인프런 커뮤니티 질문&답변

아경님의 프로필 이미지
아경

작성한 질문수

초보자를 위한 BigQuery(SQL) 입문

총 정리 문제 풀이 4~5번

총 정리 문제 풀이 2번 방출 여부 상관

작성

·

32

0

안녕하세요. 선생님, 2번 문제에 질문있습니다.

2. 각 포켓몬 타입1을 기준으로 가장 많이 포획된(방출 여부 상관없음) 포켓몬의 타입1, 포켓몬의 이름과 포획 횟수를 출력해주세요.

위 문제에서 만약에 방출 여부를 판단하고 풀어본다면 어떻게 나오는지 궁금해서 풀이를 해보았습니다. 아래 쿼리대로 풀면 될까요?

WITH result AS (
  SELECT
    pokemon_id,
    status,
    SUM(CASE
    WHEN status IN('Active', 'Training')  THEN 1
    ELSE 0
    END) AS status_pokemon_cnt
  FROM basic.trainer_pokemon
  GROUP BY
    pokemon_id,
    status
  ORDER BY
    status_pokemon_cnt DESC
)
SELECT
  type1,
  kor_name,
  status_pokemon_cnt
FROM result
LEFT JOIN basic.pokemon AS p
ON result.pokemon_id = p.id
LIMIT 1

답변 2

0

아경님의 프로필 이미지
아경
질문자

감사합니다. 선생님, 저의 원래 질문 의도는 방출되지 않은(status IN("Active", "Training") 포켓몬의 type1, kor_name, 포켓몬의 수를 구하고 싶었습니다!

선생님 말씀대로라면 아래 쿼리처럼 하면 될까요??

WITH results_release_pokemon AS (
  SELECT
  p.type1,
  tp.status,
  p.kor_name,
  COUNT(tp.id) AS cnt,
  CASE WHEN status IN("Active", "Training") THEN "no_released"
  ELSE "released"
  END AS result_release_pokemon
FROM basic.trainer_pokemon AS tp
LEFT JOIN basic.pokemon as p
ON tp.pokemon_id = p.id
GROUP BY
  p.type1,
  tp.status,
  p.kor_name
ORDER BY
  cnt DESC
)
SELECT
  type1,
  kor_name,
  cnt
FROM results_release_pokemon AS rrp
WHERE
  result_release_pokemon = "no_released"
카일스쿨님의 프로필 이미지
카일스쿨
지식공유자

그렇다면 저는 WHERE 조건에 넣을 것 같아요!. tp.status가 컬럼으로 따로 빠질 필요가 없다면..!

 

SELECT
  p.type1,
  p.kor_name,
  COUNT(tp.id) AS cnt
FROM basic.trainer_pokemon AS tp
LEFT JOIN basic.pokemon as p
ON tp.pokemon_id = p.id
WHERE tp.status IN ("Active", "Training")
GROUP BY
  p.type1,
  p.kor_name
ORDER BY
  cnt DESC

 

0

카일스쿨님의 프로필 이미지
카일스쿨
지식공유자

안녕하세요. 열심히 학습하고 계시네요!

 

말씀해주신 내용이 관점에 따라서 여러가지로 생각할 수 있을 것 같아요. 방출 여부를 신경쓴다는 것이 방출 여부에 따른 포켓몬 타입 1, 포켓몬 이름을 출력하고 싶다고 하는 것일까요? 혹은 trainer_pokemon의 status 여부도 같이 보고 싶다는 것일까요?

 

쿼리를 작성하기 전에 내가 추출하려는 것의 문장을 구체화를 하면, 문제를 해결할 때 더 도움이 됩니다.

 

train_pokemon의 status를 추가한다고 하면 저라면 간단하게 뽑을 것 같네요

 

SELECT
  p.type1,
  tp.status,
  p.kor_name,
  COUNT(tp.id) AS cnt
FROM basic.trainer_pokemon AS tp
LEFT JOIN basic.pokemon as p
ON tp.pokemon_id = p.id
GROUP BY
  p.type1,
  tp.status,
  p.kor_name
ORDER BY
  cnt DESC

 

여기서 tp.status가 Training, Active인 것과 아닌 것을 나누고 싶다면 CASE WHEN을 쓸 것 같네요. SUM을 쓰는 것도 방법인데 저라면 CASE WHEN으로 분류하고 나중에 집계하는 것을 선호해요(trainer_pokemon의 status에 들어갈 값이 겹치지 않을 것이라 지금 해주신대로 하셔도 괜찮긴 합니다)

 

추가적으로 status, 타입1, 이름 별로 1마리만 뽑고 싶을 때는 윈도우 함수를 사용해야 하는데 이 부분은 초급 레벨에선 좀 어렵다고 판단해서 BigQuery 활용편 강의에 설명했어요. 윈도우 함수를 사용하면 각 요소 별로 Row가 1개씩 나오도록 할 수 있어요

아경님의 프로필 이미지
아경

작성한 질문수

질문하기