소개
8년차 데이터 과학자, 데이터 엔지니어, 머신러닝 엔지니어로 근무했으며, 쏘카와 타다에서 데이터 분석, 데이터 엔지니어링 개발, 머신러닝 알고리즘을 개발했습니다.
카일스쿨 유튜브에 데이터 커리어 관련 영상을 올리고 있으며, 어떻게 해야 강의를 수강하신 분들이 회사에서 일을 잘할 수 있을까?를 고민하며 자료를 만들고 있어요.
카일스쿨 유튜브 : https://www.youtube.com/c/kyleschool
기술 블로그 : https://zzsza.github.io/
인스타그램 : https://www.instagram.com/data.scientist/
대표 컨텐츠 : https://github.com/Team-Neighborhood/I-want-to-study-Data-Science
데이터 과학자가 되기 위해 진행한 다양한 노력들 : https://zzsza.github.io/diary/2019/04/05/how-to-study-datascience/
강의
전체4로드맵
전체1수강평
- 유익하고 도움되는 강의 였습니다.
이상호
2024.10.24
0
- 좋은 강의 감사합니다!
DataPirate
2024.10.02
0
게시글
질문&답변
2024.10.28
수강목적
Star Trail님 데이터에 대한 역량 키울 수 있길 바랄게요!! 궁금한 점이 있다면 편히 남겨주셔요 🙂
- 0
- 2
- 12
질문&답변
2024.10.24
1-4. ARRAY, STRUCT 연습문제 중 4번째 문제를 풀다 질문드립니다
민영님 안녕하세요. 문제 잘 풀고 계시는군요..! 네 event_params는 ARRAY 안에 STRUCT가 저장된 형태라고 생각해주시면 되어요. event_params.key는 접근이 불가능하고, 배열의 몇번째를 지정하면 확인할 수 있어요 SELECT event_params[0].key FROM `inflearn-bigquery.advanced.app_logs` WHERE event_date = "2022-10-24" 위 쿼리를 실행하면 결과가 나올거에요. [0] 요소를 선택해서 key를 뽑은거지요. [0]이 없으면 민영님과 같은 오류가 발생합니다. 그렇다면 UNNEST 안에 이렇게 하면 어떻게 될까요? SELECT event_param FROM `inflearn-bigquery.advanced.app_logs` CROSS JOIN UNNEST(event_params[0].key) AS event_param WHERE event_date = "2022-10-24" Values referenced in UNNEST must be arrays. UNNEST contains expression of type STRING at [4:19] 이런 오류가 발생합니다. UNNEST 안에 들어가는 데이터는 ARRAY 형태의 데이터야 합니다. UNNEST가 배열을 풀어주는 함수니깐요..! 허나 [0].key를 지정하면 STRING이라서 풀어줄 것이 없어서 오류를 발생시킵니다. 강의에서 STRUCT라고 말씀드렸는데 이 데이터에선 ARRAY(STRUCT)라고 생각해주시면 되어요. REPEATED RECORD일 경우에 ARRAY(STRUCT)고, NULLALBE RECORD는 STRUCT입니다. REPEATED가 반복이 된다는 의미로 안에 여러가지가 들어간다고 생각해주시면 되어요. (사진) ARRAY >> 이 부분을 더 이해하기 쉽게 풀어보면 아래와 같다고 생각해주시면 되어요. ARRAY // 가장 바깥쪽: 배열 STRUCT // 배열의 각 요소는 구조체 key STRING // 구조체의 첫 번째 필드: key (문자열) value STRUCT // 구조체의 두 번째 필드: value (이것도 구조체) string_value STRING // value 구조체의 첫 번째 필드 int_value INT64 // value 구조체의 두 번째 필드 또 궁금한 것이 있으면 말씀해주셔요. 감사합니다!
- 0
- 2
- 47
질문&답변
2024.10.24
[빠짝스터디 1주차 과제] ARRAY, STRUCT, PIVOT, 퍼널 쿼리 연습 문제 (재미난 흐름)
BigQuery 콘솔 URL을 주시면 권한이 없는 사람들은 접근이 어려워요~
- 0
- 2
- 150
질문&답변
2024.10.23
2-6.연습문제 17번
안녕하세요. 열혈 수강자라니 기쁘네요! 계속 강의 잘 수강해보셔요! 질문이 약간 헷갈리는데 제가 이해한게 맞을까요? SELECT trainer_id, COUNTIF(status="Released") as B , #풀어준 포켓몬의 수 COUNT(pokemon_id) as A, #전체 포켓몬의 수 B/A as released_ratio FROM basic.trainer_pokemon GROUP BY trainer_id HAVING released_ratio >=0.2 이렇게 실행하고 싶다는 의미일까요? "COUNT IF B/A 이런식으로" 라는 표현이 구체적이지 않아서 헷갈리네요 실행을 해보시면, 실행이 안될거에요. 쿼리는 SELECT문이 마지막에 실행되는데, 실행하는 시점에 A와 B가 무엇인지 모릅니다. 그래서 서브쿼리로 감싸서 실행을 해야합니다. SELECT의 별칭은 그 안에 있는 쿼리에선 사용할 수 없습니다 SQL 실행 순서 : FROM - WHERE - GROUP BY - HAVING - SELECT - ORDER BY SELECT에서 사용한 별칭은 ORDER BY에서만 사용이 가능하고, 그 외에 사용하고 싶다면 아래처럼 서브쿼리로 감싸서 실행해야 합니다. SELECT trainer_id, B/A as released_ratio FROM ( SELECT trainer_id, COUNTIF(status="Released") as B , #풀어준 포켓몬의 수 COUNT(pokemon_id) as A, #전체 포켓몬의 수 FROM basic.trainer_pokemon ) GROUP BY trainer_id HAVING released_ratio >=0.2 이렇게는 실행이 됩니다.
- 0
- 1
- 25
질문&답변
2024.10.23
연습문제
동근님 안녕하세요! 잘 풀어주셨네요 이렇게 생각하시는 과정이 동근님의 역량 향상에 도움이 될거에요 하나씩 피드백 드리면 1. CTR과 CVR 잘 작성해주셨네요! 여기서 CTR, CVR을 구체적으로 정의해보시면 좋답니다. 분자와 분모를 명시적으로 작성해보셔요 2. CTR 질문 : 이럴 경우 재검색 비율과 몇회 이후 상품 컴포넌트를 탭했는지도 확인을 하면 좋을거 같은데 어떤 지표로 확인할 수 있을까요? 말씀해주신 것을 지표로 만들면 될 것 같은데요! 재검색 비율 = 검색한 사람들 중 다시 검색을 한 사람의 비율, 컴포넌트를 탭한 횟수 N회는 데이터를 실제로 보면서 조절해볼 것 같아요. 검색화면 진입 후 상품 CTR이 목표치 이상일 경우 검색 기능에 만족하고 있다고 볼 수 있습니다. 여기서 목표치 설정은 어떻게 해야할까요? 3. CTR 이 문제도 목표치는 어떻게 정할 수 있을까요? 재검색률, 이탈률은 분자 분모로 정의하면 어떻게 될까요? 7. 온보딩 단계 이후 가입 CVR 다음 단계 CVR은 페이지 전환율이라고 볼 수 있을 것 같아요. 이전/ 다음 단계 같은 명칭은 명확하지 않은 표현이라 이런 표현이 헷갈림을 유발할 수 있어요. 가입 퍼널에서 메인 페이지로 이동하는 페이지 전환율 가입 퍼널을 통한 가입 전환율 이렇게 구체적으로 작성해보셔요 이 문제는 AB Test 파트를 들으시고 다시 문제를 풀어보셔요! 문제 푸느라 고생하셨습니다!!
- 0
- 2
- 32