소개
빅데이터 분석기사 실기를 R을 이용해서 응시하고자하는 분들을 위해 강의를 만들었습니다.
본 강의는 데이터분석이나 R을 체계적으로 학습하는 강의는 아닙니다.
빅데이터 분석기사 실기시험을 통과하기 위해 전략적으로 코드나 모델링을 진행합니다.
빅데이터 분석기사 실기시험을 준비하시는 분들께 추천드립니다.
강의
전체 1수강평
- 빅데이터분석기사 실기대비 (R 활용)
- 빅데이터분석기사 실기대비 (R 활용)
게시글
질문&답변
2024.11.20
작업형 3유형
안녕하세요. 현재까지는 그런방법을 선택해도 점수에는 영향을 주지 않았습니다. 다만, 채점기준이 언제 바뀔지 알 수 없으니 아주 기초적인 통계랑이나 p-value를 파라미터로 변수에 지정하는 방법을 알아가시면 많은 도움이 되실 것 같습니다. 감사합니다.
- 0
- 1
- 13
질문&답변
2024.11.18
작업형 1유형 코드 과정 및 답안
안녕하세요. 많은 분들이 궁금해하는 내용이긴 합니다.지금까지는 주로 코드와 무관하게 제출하는 답만 맞으면 정답으로 인정되는 것으로 보입니다.모든 응시자의 코드를 리뷰하기 어렵기 때문으로 보입니다.그러나 절대적이다 라고 말씀드리기는 어려운 점 양해부탁드립니다. 감사합니다.
- 0
- 1
- 31
질문&답변
2024.11.18
작업형2유형 rmse값
안녕하세요.회귀지표는 말씀하신대로 뭔가 사람이 와닿은 백분율 개념보다는 주로 RMSE로 평가를 합니다.다만, RMSE / MAE등은 본래의 실제 Target값의 크기 때문에 가늠이 되지 않을 수 있습니다. 시험과 무관한 관점에서 설명드리면, 그런 경우 MAPE를 많이 사용합니다.MAPE의 정의는 구글링하시면 많은 자료들을 얻으실 수 있고, 패키지나 단순한 함수로 쉽게 계산이 가능합니다. 컨셉상으로 (수학적 설명은 구글링 참고하시면 좋을 것 같습니다.) 예측값이 실제값에서 얼마나 벗어났는지를 표현하고 있으며 0%에 가까울수록 일반적으로성능이 높습니다. 한 번 참고해보시면 좋을 것 같습니다. 감사합니다.
- 0
- 2
- 21
질문&답변
2024.11.17
f1 스코어
안녕하세요. 제가 세션2의 녹화를 가장 최근에 했는데, randomForest만을 사용하는 방향으로시험 대응방안을 드렸습니다. 만약에 세 가지 알고리즘을 사용하시고 F1 스코어값을 평가지표로 활용하신다면 제시해주신 방향이 맞는 방향입니다. 다만 굳이 세 개의 모델을 실행하고 F1 스코어를 비교하는 것보다,randomforest 단일 모델로 대응하는 것이 시험을 더 쉽게 통과하는 방법이라고 보여집니다.코드 실행에 제한 시간(1분) 이 있기 때문에 복잡한 방법보다는 단순한 방법으로시험 통과에 목적을 두는 편이 나으며, 제대로만 실행된다면 상기 방법을 활용해도 전혀 문제가 되지 않습니다. 감사합니다.
- 0
- 2
- 23
질문&답변
2024.11.17
작업 2유형 제출형식
안녕하세요. 네. 맞습니다. 0/1로 Class를 답으로 원할 경우에는 type='prob'를 삭제하고 실행하시면 됩니다.auc나 확률값을 요구할때만, 넣으시면 됩니다. 문제푸실 때, 예시답안의 형태를 미리 확인하시면 좋을 것 같습니다.감사합니다.
- 0
- 2
- 12