인프런 커뮤니티 질문&답변

joahe님의 프로필 이미지
joahe

작성한 질문수

데이터 분석 SQL Fundamentals

순위 Analytic SQL 실습 - 01

순위 함수 over 안의 order by 가 실제 조회 결과에도 영향을 주나요 ? ?

작성

·

1.1K

2

안녕하세요.

제가 순위강의 실습 하다가 궁금한 점이 생겼는데요.

제 pc 에서 실습 할때는 순위 함수 실습 1번을 해보면 조회 결과가 실제 rank 내의 orderby 순위에 맞게 정렬되서 나오는 것 같은데요.

/* 1. 순위 함수 실습 */

-- 회사내 근무 기간 순위(hiredate) : 공동 순위가 있을 경우 차순위는 밀려서 순위 정함
1, 2, 2, 4 

select *
	,rank() over(order by hiredate asc) as hire_rank   -- asc 안쓰면 기본 asc 임.
	from emp;

순위 함수 실습 2번의 경우는 한 조회 sql 안에 정렬 이 반대 조건으로 두개 들어가서.. 이런 경우에는 어떤게 우선순위인지.. 궁금합니다. 아니면 순위를 보장하지 못하는지도 궁금합니다.

-- 부서별로 가장 급여가 높은/낮은 순으로 순위: 공동 순위 시 차순위는 밀리지 않음.

select *
--	,dense_rank () over (partition by deptno order by sal desc) as sal_rank_desc
--	,dense_rank() over (partition by deptno order by sal asc) as sal_rank_asc
	,dense_rank() over (partition by deptno order by sal asc) as sal_rank_asc
	,dense_rank () over (partition by deptno order by sal desc) as sal_rank_desc
  from emp
--    order by deptno, sal_rank_asc
--	order by deptno
;

처음에는 2개 있으면 나중에 조회되는 칼럼의 order by 에 영향을 받나 싶어서 주석 풀고 순서바꿔서 조회해봤는데 그건 아닌것 같구요.. 아래쪽에 따로 order by 넣으니까 그건 우선순위가 높은건지 over 안의 order by 는 무시되고 from 이후의 order by 가 되긴 하더라구요.

그래서 궁금한건.. 순위 함수 안에 order by 가 실제 조회 결과의 order by 에 영향을 주는게.. 보장할 수 있는 규칙이 있는지.. 아니면 어쩌다가 그런 것이라서 실제 순위를 보장하려면 따로 써 주는게 좋은 건지... 아니면 순위 함수의 order by 가 조회 결과의 order by 가 없어도 조회 결과 정렬을 보장하지만.. 2개 이상이면 보장할 수 없다 라던가.. 적용 규칙 ? 정보를 아시는게 있는지 궁금합니다.

감사합니다.

 

답변 2

2

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

흥미로운 실험을 하셨군요 ^^

먼저 analytic 함수 사용시 over 절 내의 order by를 사용하면 order by 에 기술된 내용으로 정렬을 메모리나(또는 데이터가 클 경우 임시 테이블에서)에서 수행한 뒤 결과를 추출합니다. 때문에 SQL의 수행 결과가 over 절내의 order by에 따라 출력이 될 수 있습니다.

하지만 over내의 order by는 analytic 결과를 추출하기 위해서 사용하는 것일 뿐 전체 SQL의 출력 결과를 명확하게 특정 컬럼값 기준으로 하고자 한다면 반드시 SQL의 order by 절을 사용해야 합니다.

일반적으로 SQL 문장이 수행되는 순서는 다음과 같습니다.

From절/Where절/Join절 -> Group by 절 ->Select 절 -> Having 절 -> Order by 절 -> Limit또는 Fetch 절

analytic 함수는 보통 select 절에서 수행됩니다. order by 절은 select 절 이후에 거의 맨 마지막에 수행됩니다. 때문에 order by절은 절대적으로 SQL의 정렬 순서를 좌우 합니다.

analytic 함수내의 order by 역시 정렬 순서에 영향을 미칠 수 있지만, 이는 어디까지는 analytic 수행을 위한 정렬입니다. 그리고 여러개의 analytic 함수를 사용할 때 서로 다른 order by 를 적용할 때 최종적으로 정렬이 되는 방향성은 저도 잘 모르겠습니다. 이건 DB 내부에서 일반적으로 결정이 되기 때문에 DB 종류에 따라서 다를 수 있습니다.

정리해서 말씀 드리면 SQL의 최종 결과의 정렬은 SQL의 Order by에 좌우 되며, analytic 함수내의 order by 는 analytic 적용을 위해서 DB내에서 정렬을 위해 사용되는데 이용됩니다. 다만 SQL의 Order by 가 없을 경우는 DB내의 정렬을 위해 사용된 analytic 함수내의 order by 레벨로 최종 출력 결과가 정렬되서 출력 될 수 있습니다.

감사합니다.

0

마침 궁금했던 부분인데, 이미 좋은 질문과 좋은 답변이 있었네요. 덕분에 호기심이 해소되었습니다. 감사합니다.

- ps: stackover flow 에도 비스무리한 질문이 있어서 링크를 공유합니다

  1. sql - Does partition by / order by imply ordering in a query? - Stack Overflow

  2. postgresql - Order preserved in window function without ORDER BY - Stack Overflow

 

joahe님의 프로필 이미지
joahe

작성한 질문수

질문하기