작성자 없음
작성자 정보가 삭제된 글입니다.
작성
·
189
1
안녕하세요
강의 9분부터 시작되는, DMBS 자체적으로 Non Clustered Index를 사용하지 않는 이유가 궁금해서 질문드립니다.
Q1)
다른 수강생분들이 올린 질문도 참고를 했는데
SELECT *
FROM TestOrders
WHERE CustomerID = 'QUICK';
다음과 같은 sql문을 실행했을 때 DBMS가 INDEX를 사용하지 않고 SCAN을 하는 이유가 실제로 힙 테이블 내에 page가 메모리에 적재되지 않아 역효과가 발생할 수 있기에 라고 Full scan을 하는게 더 낫다고 하셨습니다.
마치 OS 가상메모리에서 page fault 가 일어나는 현상과 비슷하다고 생각을 합니다. 여기까지는 이해가 됐습니다.
다만 full scan이 더 효율적일 수 있을까? 하는 의구심이 듭니다.
SELECT *
FROM TestOrders
WHERE CustomerID = 'QUICK';
다음과 같은 sql문을 실행했을때 테이블의 데이터들도 인메모리 상태가 아니라면 물리 저장소에 접근후 메모리에 적재를 해야할텐데 과연 더 효율적일까 생각이 듭니다.
둘 다 메모리에 없다면 물리 저장소까지 다녀오는 건 비슷하다고 생각하는데 Full Scan이 조금 더 빠른건 Locality 때문인걸까요?
Q2)
마지막 질문으로 Clustered Index와 비교해서 생각을 해보고싶습니다.
Clustered Index는 Leaf Page가 곧 Data Page인데 이 Data Page도 메모리에 항상 적재되어 있을 것 같진 않습니다. 그럼에도 불구하고 Non Clustered Index보다 Select와 같은 Lookup이 빠른 이유는 Data Page내에 정렬된 데이터들과 이에따라 자연스레 형성된 Locality 때문인가요?
답변 1
2
DB 쪽에서는 정말로 상황에 따라 (데이터 개수, 구조 등등) 다르기 때문에
어떤 쪽이 낫다고 확답할 수는 없습니다.
각종 상황에 대해 테스트를 해보는 것이 진정한 정답이고
심지어 DB에서 골라주는 방법도 항상 최선이라고 보장할 수 없습니다.
상황에 따른 대응과 경험이 중요하고
아마도 그래서 DBA가 연봉이 높지 않을까 싶네요 ㅎㅎ