소개
🙌 소개
안녕하세요. 거칠지만 정말 유익한 데이터 분석가 "거친코딩" 입니다.
고려대학교 통계학과 (졸업)
고려대학교 대학원 빅데이터융합학과 (재학)
QS 세계대학평가 평가위원
고려대학교 SW 중심대학 인공지능 심화 수료
고려대학교 KUCC(컴퓨터 동아리) 세션장
고려대학교 학과 5회 수석, 1회 전체 수석
빅데이터분석기사 자격증
빅데이터분석 준전문가(adsp) 자격증
저는 현재 "네카 중 한 곳"에서 파이썬 및 시각화툴(Tableau)를 활용하여 데이터 수집, 가공, 분석, 예측, 시각화, 업무 자동화를 하고 있습니다.
⭐️ 멘토링
데이터 분석 직무를 꿈꾸는 학생들을 위한 효율적 공부법
데이터 분석 현업에 있는 주니어 분석가를 위한 상담
현업에서 IT직군이 아니지만, IT 기술을 활용하여 본인 업무에 적용하고 싶은 분
🌈 멘토링 진행 방식
zoom을 통한 비대면 방식 진행
준비물 : 컴퓨터, 카메라, 이어폰
미리 준비한 질문 사항 혹은 현 상황에 따라 멘토링 진행
🐯 마무리 글
모든 일에는 시작이 가장 중요합니다. 뜨거운 열정으로 이루고자 하는 것을 꼭 이뤄냅시다!..
📨 메일문의
rough_coding@naver.com
강의
수강평
- 파이썬 기초 라이브러리부터 쌓아가는 머신러닝
- Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
게시글
질문&답변
결과정리, 해석해주시는 부분에서 질문
안녕하세요.질문 해주신 부분에 대한 답변 드립니다.Q. App상에서 Buy CVR 을 구할때 raw data는 어떻게 확보되는건가요?A. raw data의 경우 로그 데이터이기 때문에 방대한 양의 데이터를 저장관리를 통해 분석을 진행하게 됩니다. 클라우드 환경을 쓸 경우, 데이터 스트림 서비스를 통해서 로그 데이터를 저장소에 확보하게 되고, 만약 클라우드 서비스를 쓰지않는 경우, 직접 SDK 개발을 통해서 프론트엔드 개발 코드에 넣어서 로그 데이터 수집을 하게 됩니다.결론은 로그 데이터 수집을 위한 데이터 파이프라인 형성을 하셔야 합니다. Q. 정렬 필터 변경이 구매전환율(Buy CVR)에 미치는 영향을 측정하기 위해 사용하시는 특정 분석 도구가 있나요?A. 조금 애매한 질문이긴합니다만, 데이터 수집만 잘 된다면 어떤 분석 도구를 사용하던지 상관은 없습니다. 만약 이러한 AB Test에 특화된 분석 결과물 확인을 원하신다면 Third Party의 한 도구로써 "핵클"이라는 서비스 추천드려봅니다. 감사합니다.거친코딩 드림.
- 0
- 1
- 22
질문&답변
섹션1의 마지막 강의(DataFrame에서 자주 사용하는 전처리 기법)의 오류 해결방법
안녕하세요.일단 먼저 데이터프레임의 경우,문자열이 있더라도 연산이 가능한컬럼(int, float형)만 감지해서 찾아서 연산하도록 설계되어있습니다.해당 에러의 원인을 저도 질문자님의 전체 코드를 확인한 것이 아니라, 정확한 원인은 찾기 어렵네요..감사합니다.
- 0
- 1
- 54
질문&답변
여기서 유의수준은 p-value와 동일한가요?
안녕하세요.유의수준 뜻은 표본의 통계치가 귀무가설과 같이 나올확률입니다.5%는 통상적 수치로써 사용되는 값이며,반드시란 개념은 아닙니다.도메인에 맞게 1~10% 그 이상 그이하로 정할 수 있습니다.다시말해서, 내가 ab test 전, 정한 기준(유의수준)에 내가 가지고 있는 표본의 통계치가 높은지 낮은지에 따라서 통계적 의사결정을 내리는 것이 ab test 입니다 감사합니다.
- 0
- 1
- 93
질문&답변
Pdf자료가 어딨죠
안녕하세요.거친코딩입니다.수업자료는 첫 pdf 구글드라이브 링크 걸어놨습니다.참고부탁드립니다.감사합니다.
- 0
- 1
- 80
질문&답변
파일을 읽어들일 때 질문 있습니다
안녕하세요.거친코딩입니다.그렇게 하셔도 무방합니다만,기본 root 경로를 잡아놓고 다른 파일도 불러들여야할때 중복코드를 넣지않고자 그렇게 하였습니다.감사합니다.
- 0
- 1
- 127
질문&답변
최소 샘플 사이즈 관련 문의드립니다.
안녕하세요.학습자님 질문에 대한 답변 드립니다.AB Test를 위한 최소 샘플사이즈 수를 계산하기 위해서는 portion(지표)인 경우에는 쉽게 구할 수 있습니다.다만, continuous(지표)에 대해서는 한 가지 문제 때문에 바로 구할수 없는데요.Standard Deviation입니다.보통 실험 설계전에 위 통계량을 구할 방법이 없기 때문에 임의의 값을 넣어서 샘플 사이즈 수를 구하거나,혹은 이전에 비슷한 실험이나 연구가 있었다면 해당 실험 또는 연구에서 얻은 데이터의 표준편차를 사용할 수 있습니다.감사합니다.
- 0
- 1
- 265
질문&답변
MF알고리즘에서 질문이있습니다.
안녕하세요.질문자님께서 말씀하신방법으로 가능합니다.다만, 매우 큰 데이터셋이나 지속적으로 변하는 데이터에 대해 온라인 학습을 수행할 때는 모델을 저기적으로 리셋하거나 업데이트 하는 것이 중요합니다. 이렇게 하면 모델이 시간이 지남에 따라 변화하는 데이터 패턴을 적절히 학습이 가능합니다.감사합니다
- 0
- 1
- 270
질문&답변
ean_rating = np.dot(sim_scores,movie_ratings) / sim_scores.sum() 부분에서 질문이있습니다.
안녕하세요.sim_scores값은 코사인유사도를 통해 산출된 값이므로 -1~1사이의 값을 가질 수 있습니다.그리고 sum의 값이 0인경우는 두 벡터가 서로 수직이라는 것을 의미하고, 즉 두 벡터사이에 아무런 상관관계가 없거나 관련성이 없다는 것을 나타냅니다.질문에 대한 답이 되었으면 합니다.감사합니다.
- 0
- 1
- 234
질문&답변
선형 회귀 이론 및 실습 부터 전혀 이해가 안되네요.
안녕하세요.강의자 거친코딩입니다.해당 내용은 보통적으로 연결되는 부분입니다.내용이 어렵긴 하나, 관심이 있거나 해당 진로를 희망하신다면 수강을 이어나가보시는것을 추천드립니다.감사합니다.
- 0
- 1
- 183
질문&답변
score를 실행하면 항상 nan이 출력됩니다
안녕하세요.전체 코드에 대한 디버깅을 해드리긴 어렵습니다.해당 부분 깊은 양해를 부탁드립니다.강의에 나오는대로 그대로 따라만 하시는게 아니라,강의에 나온 내용 이해를 토대로 차근히 따라가주시면 감사하겠습니다.감사합니다.
- 0
- 1
- 220