묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨초보자를 위한 BigQuery(SQL) 입문
수강 다짐
강의 목적💡 이 강의를 통해서 얻고 싶은 3가지는?여러 테이블이 존재하는 상황에서 불편하지 않게 데이터를 추출할 수 있다.실제 데이터 추출에서 이런 SQL 쿼리를 쓰면 되겠다라고 판단이 들고 싶다.실제 프로젝트에서 이제 어떻게 쿼리문을 작성하면 되겠다라고 판단이 들고 싶다. 💡 그걸 위해 내가 할 노력은?생각의 흐름을 먼저 정리하고 → 쿼리 문으로 옮기기47문제 중에서 상,중,하로 판단하여 어려웠던 쿼리 문만 모아서 2회독 하기47문제 중에서 자주 쓰이고 필요한 SQL 치트 시트 표 만들기💡 수강한 이후 내가 생각하는 나의 변화는?2회독을 하여, 여러 테이블이 존재하는 상황에서 어떻게 쿼리문을 작성할 수 있는 능력이 되었으면 좋겠습니다. (chat gpt없이)
-
해결됨초보자를 위한 BigQuery(SQL) 입문
pokemon 테이블을 생성하고자 하는데 뜨는 오류
pokemon 테이블을 생성하고자 하는데 이런 오류창이 뜨면서 생성이 되지 않아요 ㅠ두번쨰 이미지는 혹시나 확인에 필요할까싶어 추가 첨부해봅니다~
-
해결됨초보자를 위한 BigQuery(SQL) 입문
빅쿼리 콘솔창이 너무 글씨가 작아요
눈이 너무 아파요 ㅠ 혹시 설정 방법이 있을까요? 혼자서는 못찾겠어요 ㅠ
-
해결됨초보자를 위한 BigQuery(SQL) 입문
2-6 연습문제 16번. COUNT 함수 질문
안녕하세요,2-6강을 수강하다가 연습문제 16번에 관한 질문이 있어 질문 드립니다. 16번을 풀이하실 때 SELECT trainer_id, COUNT(pokemon_id) AS pokemon_cnt 이렇게 쿼리를 시작하셨는데, 혼자 먼저 문제를 풀 때 저는SELECT trainer_id, COUNT(status) AS pokemon_cnt이렇게 쿼리를 작성하였습니다.( COUNT( ) 안에 들어가는 부분에 pokemon_id 대신 status 컬럼을 사용) 이후 쿼리는 동일하게 작성을 하여 결과값은 똑같이 나왔는데카일님께서 풀이하실 때 COUNT 함수에 pokemon_id 컬럼을 사용하신 이유가 무엇인지 조금 더 자세하게 설명해주실 수 있나요? 이렇게 COUNT 등 집계 함수를 사용할 때 어떤 컬럼을 사용해야 하는지 헷갈릴 때가 많습니다. 이런 경우 어떤 기준으로 판단하면 좋을까요? 좋은 강의 덕분에 항상 많이 배우고 있습니다. 감사합니다!
-
해결됨초보자를 위한 BigQuery(SQL) 입문
강의 만족도 설문
https://bit.ly/4cAXvh5 을 눌러 인적사항과 두 가지 질문에 네를 체크해도 다음으로 넘어가지 않습니다.수강평을 남겨주셨나요?에 네 남겼습니다 체크 한 후 다음을 누르면 만족도 설문으로 넘어가지 않아요. [진행상황이 복원되었습니다.] 라는 에러와 함께 이 첫 화면에 머물게 되네요. 다음을 눌러 만족도 조사를 하고 싶은데... 저만 이렇게 뜨는 걸까요?
-
해결됨초보자를 위한 BigQuery(SQL) 입문
쿼리 실행 오류
두 경우 모두 오류가 발생합니다.
-
해결됨초보자를 위한 BigQuery(SQL) 입문
1-2. BigQuery 환경 설정 - 테이블 만들기 오류
안녕하세요 pokemon / trainer 파일 데이터 만들기 진행하면 아래와 같은 오류가 발생 합니다어떻게 해결 하는게 좋을까요?
-
해결됨초보자를 위한 BigQuery(SQL) 입문
join 3번, 4번 문제
안녕하세요 카일님. 연습문제 관련 질문드립니다.join 연습문제 3번: 고향=포켓몬 잡은 위치 같은 것만 구하려면 레프트 조인 쓰지 않고 그냥 아래처럼 이너조인으로 쓰는 게 낫지 않을까요? 레프트 조인을 쓰신 사유가 따로 있으실까요? select count(distinct tp.trainer_id) as trainer_cntFROM `inflearnbigquery1.basic.trainer` tjoin `inflearnbigquery1.basic.trainer_pokemon` tpon t.id=tp.trainer_id and t.hometown=tp.location join 연습문제 4번: 저는 아래와 같이 풀었는데 (각 테이블을 서브쿼리에서 where조건으로 범위를 줄여놓고 조인하고자 했습니다) 왜 count(tp.pokemon_id) 나 count(distinct tp.pokemon_id)를 하지 않고 count(tp.id)를 하는지 이해가 잘 안 갑니다..! 5번 문제도 마찬가지로 왜 count(tp.id)인지 동일한 이유로 이해가 잘 안 가요...! 그리고 4번에서 count(tp.id)를 하더라도 아래와 같이 풀면 정답과 같이 water 속성이 나오는데 저는 cnt가 69가 나오네요. (정답에선 14) select -- tp.trainer_id, -- tp.pokemon_id, -- p.type1 p.type1, -- count(pokemon_id) as pokemon_cnt count(tp.id) as cnt from (select id,trainer_id, pokemon_id, status from `inflearnbigquery1.basic.trainer_pokemon` where status in ('Active', 'Training')) tp left join (select id, achievement_level from `inflearnbigquery1.basic.trainer` where achievement_level = 'Master') t on tp.trainer_id = t.id left join (select id, type1 from `inflearnbigquery1.basic.pokemon`) p on tp.pokemon_id = p.id group by 1 order by 2 desc limit 1 아래처럼 풀면 14가 나오는 걸 보니... from 절은 서브쿼리로 범위를 줄여놔도 되지만 레프트조인 절에 들어가는 건 서브쿼리로 하면 안되는 거였을까요? 바깥에서 where master 조건을 줘야하는데 안에서 준 게 잘못된 것으로 추정되는데... 위 쿼리처럼 하면 왜 안되는 걸까요?select p.type1, count(tp.id) as cnt from (select id,trainer_id, pokemon_id, status from `inflearnbigquery1.basic.trainer_pokemon` where status in ('Active', 'Training')) tp left join `inflearnbigquery1.basic.trainer` t on tp.trainer_id = t.id left join `inflearnbigquery1.basic.pokemon` p on tp.pokemon_id = p.id where t.achievement_level = 'Master' group by 1 order by 2 desc limit 1
-
해결됨초보자를 위한 BigQuery(SQL) 입문
템플릿, 강의 계획 관련
안녕하세요?템플릿을 Espanso를 활용하는 방법 알려주셨는데, 회사 컴퓨터에 해당 프로그램을 깔기가 조금 어려운 상황입니다. 회사 컴퓨터에는 Python이 깔려있고, 사용하는 SQL은 DBeaver (PrestoSQL)인데요. Python을 활용해서 Espanso 활용한 것처럼 템플릿이 뜨게끔 할 수 는 없을까요?PM 강의, SQL 기초 강의도 너무 잘 봤습니다. 심화강의는 언제쯤 업로드 예정이신지 알 수 있을까요? 심화강의 올라왔을 때 알람을 받아볼 방법이 있을지요? 너무 기다려집니다!!!!감사합니다.
-
해결됨초보자를 위한 BigQuery(SQL) 입문
강의자료문의
강의자료 다운받아보면 폴더가 비어있어요 ..아래글에 구글드라이브에도 올려두셨다고했는데 거기들어가서 다운받아도 폴더가 비어있습니다 ㅠㅠ
-
해결됨초보자를 위한 BigQuery(SQL) 입문
강의 자료 다운로드 문의
안녕하세요! 강의를 듣고 강의 자료를 다운받았는데 폴더가 비어있어서 문의 드립니다 😂 혹시 어떻게 된건지 알 수 있을까요??
-
해결됨초보자를 위한 BigQuery(SQL) 입문
빅쿼리 강의 듣기 vs GPT에게 물어보기
안녕하세요 카일님. 여쭤보고 싶은것이 있어 글을 남기게 되었습니다. 저는 SQL에 대해 간단한 쿼리(JOIN정도)는 직접 작성할 수 있는 이해도가 있는 PM입니다. 예전에 빅쿼리를 공부하며 카일님의 블로그를 보며 공부하기도 했었고, 제가 직접 서비스와 빅쿼리를 연동하기도 했습니다.현재 서비스에서 궁금한점이 있을때마다 GPT에게 빅쿼리용 쿼리문을 작성해달라고 요청해서 데이터를 보고 있는데요.GPT에게 작성해달라고하면 2-3번 오류가 생길때도 있지만 제가 보고 싶은 데이터를 대부분 잘 짜주는거같아서 만족하며 사용하고 있어요. ( array, struct 같은 자료형은 제가 편하게 쓸수 있는 수준이 아닌데 gpt가 잘 짜주더라구요) 제가 보고 싶은 데이터는 대부분 딥한 수준이 아니어서 GPT가 작성해줄 수 있는것같다고 느껴져서 이 강의도 그렇고, 빅쿼리를 공부하지 않아도 되겠다는 생각까지 들더라구요.저 개인적으로 회사에 영업, 기획직군은 GPT에게 물어보면 보고싶은 데이터를 다 볼 수 있지 않을까 생각이 들구요.혹시 카일님께서는 어떻게 생각하시는지 , 혹시 GPT가 쿼리문 작성에서 대체할수 없는 영역이 있을지 조심스럽게 여쭤보고 싶습니다. 항상 카일님 올려주시는 글들 통해 많이배우고 있습니다. 감사합니다!
-
해결됨초보자를 위한 BigQuery(SQL) 입문
흠,., 수업자료 버튼이 안 보인다능,.
왜때문에.. ? 안보일까요/
-
해결됨초보자를 위한 BigQuery(SQL) 입문
2-3강의
편집 전 버전 같아요
-
해결됨초보자를 위한 BigQuery(SQL) 입문
battle 테이블 생성하면 오류가 떠요.
아래와 같은 오류가 뜨는데, 지나쳐도 괜찮나요? 테이블을 만들 수 없음: Error while reading data, error message: CSV processing encountered too many errors, giving up. Rows: 97; errors: 97; max bad: 0; error percent: 0작업으로 이동
-
해결됨[SQL Quest] 실전 문제 풀이로 SQL 역량 강화 하기 (Basic)
데이터 관련 커리어에 관하여 질문드립니다.
안녕하세요. 현재 데이터 사이언티스트 및 엔지니어를 꿈꾸고 있습니다.데이터 사이언티스트가 회사에 따라 일하는 업종이 다르지만, 제가 생각하기에 제가 원하는 직무는 데이터 분석에 가까운 것 같습니다. 게임업계의 N사의 경우 데이터 사이언티스트를 채용했으나, 추천시스템이나 이상탐지 등 모델을 개발하는 업무라 아무래도 학사 출신 보다는 석/박사 출신들이 많을 것 같다는 생각이 들었기 때문입니다. 머신러닝과 딥러닝 모델을 가져와서 쓰는 것은 가능하지만, 만드는 것은 또 다른 영역이었기에, 해당 부분으로는 꿈을 접게 되었습니다.그래서 데이터 분석가 쪽으로 가자! 는 마음으로 Python외에도 SQL 공부를 지속적으로 해왔습니다. 문제는, 면접장을 가봤더니, 어떤 회사의 경우 SQL이 아닌 SAS를 쓰는 경우도 있었고, 가장 크게 한계에 부딪쳤던 부분은, 서비스 지표의 문제점을 파악하고 다양한 가설 및 A/B 테스트로 서비스 개선을 해보신 분 (모바일 서비스 데이터 분석), 데이터 시각화(Tableau 등 BI툴) 경험을 본다는 점입니다.SAS는 일단 너무 비싸기 때문에, 이건 혼자서 배울 수 있는 능력이 아니라고 판단해서, 제외했습니다.데이터 시각화의 경우 Tableau는 혼자서 책을 찾아보면서 공부를 하는 중입니다. Q1. 서비스 지표의 문제점을 파악하고 다양한 가설 및 A/B 테스트로 서비스 개선을 해보신 분 이라는 이 부분이 저는 도대체 어떻게 신입이 키워나갈 수 있는지, 어떻게 공부를 하면 좋을지... 잘 모르겠습니다. 서비스 지표를 통해서 해당 데이터를 분석하는 건 할 수 있지만, 지표의 문제점을 파악한다? 가 와닿지가 않습니다.마케팅 지표를 알아야, 해당 요건을 충족할 수 있을 것 같았지만, Q1을 해결하지 못해서, 데이터를 가지고 할 수 있는 일이 무엇이 있을까...를 생각해보던 중 Data Engineer라는 직무도 알게 되었습니다. Java SpringBoot 나 Django를 활용해서 웹을 개발한 경험도 있었고, Spark, Hive SQL에 대해서 공부를 했던 경험이 있었기 때문입니다. 그런데, 항상 공고에 등장했던 부분이었던 대용량 데이터 처리를 위한 데이터 파이프라인(수집/처리/분석) 개발 경험이 발목을 잡았던 것 같습니다. Q2. 데이터 파이프라인(수집/처리/분석) 개발 경험이 하둡 아키텍처나, K8S 내에서 트러블 슈팅 경험을 말하는 것인가요? 해당 부분을 해보려고 했으나, 문제는 하둡 아키텍처를 AWS로 구성하는데 비용이 엄청나게 들어서 엄두를 못냈습니다.수집은 크롤링으로 했는데, Kafka도 언급이 있는 걸 보면, Kafka나 Flink와 같이 실시간 스트리밍 수집을 공부해야할까요?아키텍처를 구성해야 할 것 같은데, 관련 지식이 없어서 문제입니다. 비전공자다 보니, 취업이 생각보다 너무 어렵게 느껴집니다. 이번 하반기는 유독 2차에서 많이 떨어졌네요.. 내년 상반기에는 좋은 소식이 있었으면 좋겠습니다. Q3. 추가로, 강사님께서 알려주신 부분을 공부하면서, 노션에 정리를 했었습니다. 노션에는 강사님께서 첨부하신 PDF자료는 일절 없고, 쿼리문과 제가 공부를 하면서 느낀 점이나, 어떻게 문제를 풀어야하는지 등을 정리했는데, 혹시 괜찮을까요? (노션이 홈페이지와 연동이 되어있다보니, 문제가 있다면 해당 부분은 개인 아카이브에 보관하겠습니다.)=> 답변주신부분대로 테이블 조회(데이터 확인=> 이건 강사님께서 만드신 소중한 수업 자료이니 해당 부분은 제외) 부분을 제외하구 쿼리 부분만 기재해도록 하겠습니다.
-
해결됨[SQL Quest] 실전 문제 풀이로 SQL 역량 강화 하기 (Basic)
3분 20초 FORMAT_DATE 반환 타입에 관하여
[기타 질문]선생님 3분 20초 쯤에, FORMAT_DATE('%Y', date)에 대한 주석 문에 대해서 int형이 아닌 String형으로 표시를 해야 할 것 같습니다.date between '2022-01-01' and '2022-12-31' -- 2022 -- date between '2022-01-01' and '2022-12-31' EXTRACT(YEAR FROM date) = 2022 -- 2022 -- EXTRACT(YEAR FROM date) -> int로 나온다. -- EXTRACT(날짜 단위 from 날짜 필드) FORMAT_DATE('%Y', date) = '2022' -- 2022선생님께서 알려주신 3가지 방법으로 모두 적용해보니,SELECT EXTRACT(YEAR FROM date), FORMAT_DATE('%Y', date) FROM project.daily_play WHERE (EXTRACT(YEAR FROM date) = 2023 AND mode = 3) OR (EXTRACT(YEAR FROM date) = 2022 AND mode = 4) 이런 식으로 나오더라구요. EXTRACT의 반환 값은 int형(숫자형)이 나오고, FORMAT_DATE이나 FORMAT_DATETIME의 경우 반환 값은 String 형태로 나오는 것 같습니다.
-
해결됨[SQL Quest] 실전 문제 풀이로 SQL 역량 강화 하기 (Basic)
데이터베이스에 맞게 연결했는데, BAD-REQUEST라고 나옵니다..
data-whiz에 첨부해주신 json파일을 강의에서 언급한 부분대로, Database를 Connect했는데, 자꾸 Connect error가 뜨네요.. 어떻게 해야할까요[기타 질문]쿼리 작성 질문 외 강의에서 사용된 용어 등 다양한 질문들도 환영합니다. 편안하게 질문 부탁드립니다🙋♂️🙋♀️