소개
안녕하세요,
현재 국민대학교 비즈니스IT전문대학원에서 박사과정을 진행하고 있으며, 취업준비생들의 취업을 진심으로 돕기 위한 강의와 재직자들을 대상으로 R, Python, SQL, Excel, Tableau 등 분석과 관련된 강의로 밥벌이를 하고 있는 Evan입니다. 이제 만 3년이 되었는데, 국방부, 육군본부, 하나금융에서 단기강의로 강의를 시작한 이래로 다양한 기관(한국IT비즈니스협회, 한국능률협회, 한국소프트웨어기술진흥협회, 삼육대 등)에서 강의를 진행하였습니다. 현재는 2023년부터 위 기관 외에도 멀티캠퍼스에서 강의를 하나 맡아서 장기적으로 취업 준비생을 대상으로 교육을 진행하고 있습니다.
강의
수강평
- Python Streamlit을 활용한 대시보드 만들기 (feat. 빅데이터 분석기사 실기 준비)
- Python Streamlit을 활용한 대시보드 만들기 (feat. 빅데이터 분석기사 실기 준비)
- Python Streamlit을 활용한 대시보드 만들기 (feat. 빅데이터 분석기사 실기 준비)
- Python Streamlit을 활용한 대시보드 만들기 (feat. 빅데이터 분석기사 실기 준비)
- Python Streamlit을 활용한 대시보드 만들기 (feat. 빅데이터 분석기사 실기 준비)
게시글
질문&답변
1) GCP내에서 SSH 통해 깃헙과 연결시 main.py 파일이 연동 2) Powershell Conda 설정
안녕하세요, 우선 첫번째 에러의 경우 'Please move or remove them before you merge.' 이 부분은 대개 깃허브 처음 설정 시, git pull이나 git push가 안되었을 때 종종 발생하는 에러 입니다. 따라서, 순차적으로 진행하셔야 하고, 또는 매뉴얼로 'git clean -d -f' 이 명령어를 사용하시는 걸 추천합나다. 참고 : https://stackoverflow.com/questions/36039687/git-pull-please-move-or-remove-them-before-you-can-mergeConda 활성화의 경우 보통 VSCode or PowerShell를 다시 실행시키면 되는 경우도 있습니다. Conda 활성화가 안되면, conda init powershell시도해보시기를 바라며, 그 외 여러가지 시도할 것이 있기는 한데, 다음 글을 참조하셔서 진행하시기를 바랍니다. https://stackoverflow.com/questions/64149680/how-can-i-activate-a-conda-environment-from-powershell
- 0
- 1
- 66
질문&답변
5단계 강의 코드관련(Streamlit st.data_editor() & st.column_config)
소스코드 올려드렸으니 확인 부탁드립니다.
- 0
- 2
- 85
질문&답변
5단계 강의 코드관련(Streamlit st.data_editor() & st.column_config)
아! 제가 확인해서 11시 즈음에 다시 답변 드리도록 하겠습니다. 불편함을 드려 죄송합니다.
- 0
- 2
- 85
질문&답변
jupyter nbextension enable --py widgetsnbextension 에러발생
여기 싸이트 참고 하시기를 바랍니다. https://ipywidgets.readthedocs.io/en/7.x/user_install.html 아마도 ipywidgets 설치가 안되어 있는 것 같습니다.
- 0
- 1
- 356
질문&답변
boxcox를 변환하는 코드 에
안녕하세요, 에러 확인 후, 코드를 수정하였습니다. 제보 감사합니다. 아래와 같이 해보시고, 안되면 말씀해주세요.
- 0
- 2
- 604
질문&답변
레몬에이드 데이터 자료에 없습니다
안녕하세요. Chapter 3-1. pandas 기초 다지기 (1) 강의에 Lemonade2016.csv 파일을 업로드 하였습니다.
- 0
- 1
- 291
질문&답변
ImportError: cannot import name 'plot_roc_curve
질문 주셔서 감사합니다.scikit-learn 1.2.1 버전을 사용하시는 분들은 중간에 코드 2개를 수정해야 합니다.먼저 라이브러리를 불러올 때는기존 : from sklearn.metrics import roc_auc_score, plot_roc_curve, confusion_matrix 에서수정 : from sklearn.metrics import roc_auc_score, RocCurveDisplay, confusion_matrix변경바랍니다.def evaluate 함수 중간 코드에기존 : roc_plot = plot_roc_curve(ml_model, X_test, y_test, name="Scikit-Learn ROC Curve") 에서수정 : roc_plot = RocCurveDisplay.from_estimator(ml_model, X_test, y_test, name="Scikit-Learn ROC Curve") 으로 수정 바랍니다.공식문서 참조 : https://scikit-learn.org/stable/modules/generated/sklearn.metrics.RocCurveDisplay.html#sklearn.metrics.RocCurveDisplay.from_estimator
- 0
- 1
- 1.5K
질문&답변
데이터 전처리
안녕하세요. 좋은 질문 감사합니다. 우선 기본 원칙은 훈련 데이터와 테스트 데이터를 별개의 데이터로 가정하는 것이 맞습니다. 같은 모집단으로 바라보고 처리하게 되면, 모형 학습 시, Data Leakage에 빠질 가능성이 존재합니다.또한, train 데이터의 평균값을 test 데이터에 적용하는 방법이 실제 대회에서는 맞습니다. 이 부분은 제가 작업하면서 오류가 있었네요. 수정해서 올리도록 하겠습니다. 관련해서 좋은 디스커션이 있으니 확인 바랍니다. https://www.kaggle.com/c/titanic/discussion/177536
- 0
- 1
- 234
질문&답변
결측치 채우기 부분 관련 질문
결측치 대치는 여러가지 방법이 있는데, 그 중 가장 쉬운 방법인, 빈도수가 가장 많이 나온 것을 대체 한 것입니다. 이 방법이 꼭 좋은 방법은 아니나, base 머신러닝 모형을 구축할 때는 쉽게 구축 할 수 있기 때문에 사용한다고 생각하면 될 것 같습니다. mode() 함수는 문자열의 각 값을 계산한 후, 높은 순부터 정렬하여 반환합니다. mode()[0]은 각 칼럼에서 가장 높은 값을 추출한다는 뜻입니다. 결측치 대치는 이 문제 하나만으로도 논문으로 나올 수 있는 매우 어려운 문제입니다. 본 강의에서는 가장 쉬운 방법을 택했다고 보면 될 것 같습니다. 문자열 결측치에서 가장 큰 어려운 문제는 high-cardinality 이슈가 있습니다. 관련 키워드로 검색해보시고, 혹시나 이해가 어려우면 추가로 강의를 제작해서 올리도록 하겠습니다.
- 0
- 1
- 253
질문&답변
데이터셋 압축 문제
아아 감사합니다. 압축 풀어서 보통 하도록 했는데, 답을 찾아 주셨네요. 감사합니다. 해피 코딩 되세요 ^^
- 1
- 1
- 259