인프런 커뮤니티 질문&답변

이유정님의 프로필 이미지
이유정

작성한 질문수

초보자를 위한 BigQuery(SQL) 입문

4-5. 시간 데이터 연습 문제 3~5번

4-5 연습문제 4번

해결된 질문

작성

·

138

0

안녕하세요.

 

4-5 연습문제 4번 서브쿼리 부분에서 질문이 있습니다.

서브쿼리에 꼭 * 이나 id를 써줘야 실행이 되는 이유는 무엇인가요??

처음에는 서브쿼리>select에서 카일님 풀이처럼 *를 안 해주고 실행했더니

Unrecognized name: id
라는 오류가 떴습니다.

 

구글링을 통해 알아보니, 서브쿼리에 id를 안 썼는데 바깥에 COUNT(DISTINCT id) as battle_cnt 를 써줘서 오류가 떴다고 했습니다.

 

왜 써줘야 하는지 알 수 있을까요??

답변 1

0

카일스쿨님의 프로필 이미지
카일스쿨
지식공유자

안녕하세요!

4-5 연습문제 4번에서 서브쿼리에 *을 꼭 써야하는 이유는 서브쿼리 바깥에 있는 FROM 절 입장에선 서브쿼리가 일종의 테이블처럼 인식합니다.

 


SELECT
  day_of_week,
  COUNT(DISTINCT id) AS battle_cnt
FROM (
  SELECT
    *,
    EXTRACT(DAYOFWEEK FROM battle_date) AS day_of_week
  FROM `basic.battle`
)
GROUP BY
  day_of_week
ORDER BY
  day_of_week

 

위 쿼리에 서브 쿼리인

  SELECT
    *,
    EXTRACT(DAYOFWEEK FROM battle_date) AS day_of_week
  FROM `basic.battle`

 

위 쿼리를 실행해보면 다음과 같은 결과가 나타납니다

image

위에 결과에서 아래 쿼리를 실행하는 것으로 볼 수 있습니다

SELECT
  day_of_week,
  COUNT(DISTINCT id) AS battle_cnt
FROM 위 결과 테이블
GROUP BY
  day_of_week
ORDER BY
  day_of_week

 

만약 서브 쿼리에서 *을 제외했으면 아래와 같은 결과가 나타납니다

  SELECT
    EXTRACT(DAYOFWEEK FROM battle_date) AS day_of_week
  FROM `basic.battle`

 

image

즉, day_of_week 밖에 없는 데이터인거죠

 

그래서 아래 쿼리를 실행할 때, id가 없기 때문에 Unrecognized name(데이터에 해당 컬럼이 없다) 오류가 발생하는 것입니다

SELECT
  day_of_week,
  COUNT(DISTINCT id) AS battle_cnt
FROM 위 결과 테이블
GROUP BY
  day_of_week
ORDER BY
  day_of_week

 

그렇다면 여기서 COUNT(DISTINCT *)도 가능한가? DISTINCT를 할 때는 구체적인 컬럼을 명시해야 하기 때문에 실행이 안됩니다

그럼 COUNT(*)도 가능한가? 실행은 되지만 단순히 Row 수만 COUNT하게 됩니다. 지금 데이터에선 답이 같을 수 있지만, id가 중복으로 존재하는 테이블에서는 COUNT(*)은 의도와 다른 값이 나타날 수 있습니다. 그래서 id를 DISTINCT해서 고유값만 COUNT한 것이에요

 

정리하면, 서브 쿼리에 있는 컬럼이 있어야 바깥에서 불러올 수 있습니다. 일종의 테이블이라고 생각하시면 이해가 쉬울 것 같네요

이유정님의 프로필 이미지
이유정

작성한 질문수

질문하기