인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

kken2104님의 프로필 이미지

작성한 질문수

초보자를 위한 BigQuery(SQL) 입문

2-6. 연습 문제 13~17번

16번 문제

해결된 질문

작성

·

63

0

안녕하세요! 포켓몬을 제일 많이 풀어준 트레이너는 누구일까요?

select trainer_id, count(status)

from basic.trainer_pokemon

where status = "Released"

group by trainer_id

order by count(status) desc

limit 1

 

이렇게 select에서 count(status) 써도 되나요...?

포켓몬을 많이 풀어줬다 --> status가 released 많이 했다

이렇게 받아들였어요

답변 2

0

카일스쿨님의 프로필 이미지
카일스쿨
지식공유자

안녕하세요. 인프런 인턴이 말한 것과 동일합니다

COUNT(col) : 이 의미는 col에 값이 있는 Record의 수를 센다는 것을 의미합니다. count(status)나 count(id)나 모두 동일한 결과가 나올텐데 그 이유는 id 값이 있는 포켓몬은 status 값이 존재하기 때문이에요. 지금 문제에선 괜찮은데, 나중에 JOIN을 많이 하다보면 잘못된 값을 사용할 수 있어서(데이터가 뻥튀기가 될 수 있음) pokemon_id를 사용하는 것이 더 좋아요.

 

문제 정의를 어떻게 하느냐에 따라 다를 수 있는데 아래 글에 자세히 정리해두었으니 참고해보시면 좋을 것 같아요.

https://www.inflearn.com/community/questions/1225327/2-6-%EC%97%B0%EC%8A%B5%EB%AC%B8%EC%A0%9C-16%EB%B2%88-count-%ED%95%A8%EC%88%98-%EC%A7%88%EB%AC%B8

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다.

kken2104님께서 작성하신 쿼리를 보면, 트레이너가 풀어준 포켓몬의 수를 구하고 오름차순으로 정렬하여 가장 많이 풀어준 트레이너를 찾고자 하시는 것 같습니다. 질문하신 대로 COUNT(status)를 사용하셔도 무방합니다. 다만 상태가 “Released”인 레코드를 센다는 의미에서 의도가 반영된 방법이므로 논리적으로 맞습니다.

관련해서 비슷한 질문과 답변이 있는 게시글을 찾아봤습니다. 다음 링크들을 참고해보시면 적절한 도움이 되실 것 같습니다:

  1. COUNT 함수 사용에 대한 고민 - 특정 컬럼을 카운트할 때의 유의점에 대해 설명된 사례입니다. 카운트하려는 대상이 무엇인지를 명확히 정의하면, 상황에 맞는 컬럼을 선택하여 사용할 수 있습니다.
  2. 방출 여부를 포함한 포켓몬 수집 - 방출 상태를 고려하여 포켓몬 데이터를 분석하는 방법에 관한 논의가 있습니다.

쿼리를 작성할 때, 의도하는 바와 데이터의 구조가 일치하도록 고려하는 것이 중요합니다. status 컬럼을 카운트하는 것은 트레이너가 풀어준 포켓몬의 정확한 카운트에는 무리가 없으니, 현재 상황에서는 적절하다고 보입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

kken2104님의 프로필 이미지

작성한 질문수

질문하기