인프런 커뮤니티 질문&답변

최윤정님의 프로필 이미지
최윤정

작성한 질문수

데이터 분석 SQL Fundamentals

스칼라 서브쿼리 실습 - 02

row_numbers 사용시에는 null 처리 문제

작성

·

910

0

-- 고객정보와 고객이 처음 주문한 일자의 주문 일자와 그때의 배송 주소, 배송 일자 추출

을 풀때 row_numbers로 첫번째 주문일자를 추출했더니 null이 제외되더군요.

그래서

select a.customer_id, a.contact_name ,  b.order_date as first_date, b.ship_address, b.shipped_date, b.rnum
from  nw.customers a
	left join (select *
		, row_number() over (partition by x.customer_id order by x.order_date ) as rnum from nw.orders x  
) b on a.customer_id = b.customer_id
where rnum=1 or rnum is null;

으로 'rnum is null'을 넣어주었더니

order_date가 null인 고객 정보도 출력이 되었습니다.

 

  1. row_numbers()로 순위를 매길때 null은 그냥 순위매김에서 제외되는 건가요?

  2. 위의 코딩이 맞는(효율적인) 방식인지 궁금합니다.

 

 

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

null이 제외되었다는 의미가 row_number()에서 제외되었다는 의미가 아니라 outer join이기 때문에 customer_id로 조인되지 않은 데이터가 제외 된것 같습니다.

orders 테이블에는 order_date나 customer_id가 null인 데이터가 없습니다. 때문에 row_number() 자체는 null이 나오지 않습니다.

그리고

"row_numbers로 첫번째 주문일자를 추출했더니 null이 제외되더군요."

는 customer에는 있지만, orders에는 없는 데이터를 추출할 경우 여기에 rnum은 당연히 null입니다. 이건 inner 조인이 안되기 때문에 rnum이 null 이 되어 있는데, 여기에 rnum=1을 하게 되면 null인 데이터는 추출되지 않게 됩니다. 마찬가지로 rnum is null 하게 되면 inner 조인이 되지 않는 대상만 추출되게 됩니다.

 

감사합니다.

 

 

 

최윤정님의 프로필 이미지
최윤정

작성한 질문수

질문하기