게시글
질문&답변
2024.11.20
작업형 3유형
안녕하세요. 현재까지는 그런방법을 선택해도 점수에는 영향을 주지 않았습니다. 다만, 채점기준이 언제 바뀔지 알 수 없으니 아주 기초적인 통계랑이나 p-value를 파라미터로 변수에 지정하는 방법을 알아가시면 많은 도움이 되실 것 같습니다. 감사합니다.
- 0
- 1
- 13
질문&답변
2024.11.18
작업형 1유형 코드 과정 및 답안
안녕하세요. 많은 분들이 궁금해하는 내용이긴 합니다.지금까지는 주로 코드와 무관하게 제출하는 답만 맞으면 정답으로 인정되는 것으로 보입니다.모든 응시자의 코드를 리뷰하기 어렵기 때문으로 보입니다.그러나 절대적이다 라고 말씀드리기는 어려운 점 양해부탁드립니다. 감사합니다.
- 0
- 1
- 31
질문&답변
2024.11.18
작업형2유형 rmse값
안녕하세요.회귀지표는 말씀하신대로 뭔가 사람이 와닿은 백분율 개념보다는 주로 RMSE로 평가를 합니다.다만, RMSE / MAE등은 본래의 실제 Target값의 크기 때문에 가늠이 되지 않을 수 있습니다. 시험과 무관한 관점에서 설명드리면, 그런 경우 MAPE를 많이 사용합니다.MAPE의 정의는 구글링하시면 많은 자료들을 얻으실 수 있고, 패키지나 단순한 함수로 쉽게 계산이 가능합니다. 컨셉상으로 (수학적 설명은 구글링 참고하시면 좋을 것 같습니다.) 예측값이 실제값에서 얼마나 벗어났는지를 표현하고 있으며 0%에 가까울수록 일반적으로성능이 높습니다. 한 번 참고해보시면 좋을 것 같습니다. 감사합니다.
- 0
- 2
- 21
질문&답변
2024.11.17
f1 스코어
안녕하세요. 제가 세션2의 녹화를 가장 최근에 했는데, randomForest만을 사용하는 방향으로시험 대응방안을 드렸습니다. 만약에 세 가지 알고리즘을 사용하시고 F1 스코어값을 평가지표로 활용하신다면 제시해주신 방향이 맞는 방향입니다. 다만 굳이 세 개의 모델을 실행하고 F1 스코어를 비교하는 것보다,randomforest 단일 모델로 대응하는 것이 시험을 더 쉽게 통과하는 방법이라고 보여집니다.코드 실행에 제한 시간(1분) 이 있기 때문에 복잡한 방법보다는 단순한 방법으로시험 통과에 목적을 두는 편이 나으며, 제대로만 실행된다면 상기 방법을 활용해도 전혀 문제가 되지 않습니다. 감사합니다.
- 0
- 2
- 23
질문&답변
2024.11.17
작업 2유형 제출형식
안녕하세요. 네. 맞습니다. 0/1로 Class를 답으로 원할 경우에는 type='prob'를 삭제하고 실행하시면 됩니다.auc나 확률값을 요구할때만, 넣으시면 됩니다. 문제푸실 때, 예시답안의 형태를 미리 확인하시면 좋을 것 같습니다.감사합니다.
- 0
- 2
- 12
질문&답변
2024.11.17
작업형 2유형 인덱스값
안녕하세요. 죄송하지만 어디 부분 강의의 코드인지 확인해주시면 찾아보겠습니다.말씀하신대로 tst에서 인덱스를 지웠다면, 그 변수에서는 인덱스를 다시 불러올 수는 없습니다.답안제출 시, 인덱스가 필요한 경우에는 별도의 변수에 저장해두어야 합니다. 전체적으로 스크립트를 보았을 때, 그러한 부분이 확인되지 않았는데조금 더 상세히 질문주시면 확인해보겠습니다. 감사합니다.
- 0
- 2
- 16
질문&답변
2024.11.17
강의 문제확인 창
안녕하세요. 강의에서 사용하는 문제는 각 섹션 2,3,4,7,8,9,10에서 강의자료를 다운받으시면 확인 가능하십니다. 압축파일 받으시면 메모장내에 문제/스크립트가 있으니 그것을 활용하시면 됩니다. 감사합니다.
- 0
- 2
- 12
질문&답변
2024.06.23
이번시험 작업형2 질문
안녕하세요.시험 치르시느라 고생이 많으셨습니다. 통상적으로 별도의 전처리 (변수선택 등)없이 모델을 만들 경우,최고구간 점수는 아니어도 적당한 점수를 획득할 수 있다고 알고 있습니다. 다만, 평가기준을 공개하고 있지 않기 때문에 점수구간을 알기가 어렵습니다.커뮤니티를 여러군데 돌아다녀보니, 그 정도의 MAE를 보이는 응시자들이 많은 것 같습니다. 따라서, 어느정도의 점수는 충분히 획득 가능하지만 정확한 점수를 알기가 어렵네요.부디 결과발표 때, 좋은 소식을 들려주실 수 있으시면 좋겠습니다.
- 0
- 1
- 165
질문&답변
2024.06.12
4회 작업형 2유형 문제 불러왔을 때 변수가 안보이는데요
안녕하세요.저도 동일하게 자료를 다시 다운받아서 R을 켜자마자 메모장의 코드를 실행해보았는데요. train을 불러온 df에서 'segmentation' 가 정상적으로 로딩됨을 확인했습니다.아래 그림 참고부탁드리며, 다시 한 번 새로 다운받고 새로 실행해보시면 좋을 것 같습니다.계속해서 문제 생기면 답글을 부탁드립니다. (사진)
- 0
- 1
- 94
질문&답변
2024.06.09
작업형 1유형의 3번문제(ratio)
안녕하세요. 오류 지적에 감사드립니다.아래 마지막 두 개행에 오타가 있어서 결과 값이 잘못나옵니다. Cabin_ratio is.na(df$𝐶𝑎𝑏𝑖𝑛))+𝑠𝑢𝑚(𝑑𝑓$Cabin))+sum(df$df$Cabin=='', na.rm = T))/nrow(df)Embarked_ratio is.na(df$𝐸𝑚𝑏𝑎𝑟𝑘𝑒𝑑))+𝑠𝑢𝑚(𝑑𝑓Embarked))+sum(df$df$Embarked=='', na.rm = T))/nrow(df) 위의 두 개 df$가 잘못 들어가 있습니다.이 부분을 삭제하면 정답은 'Cabin'으로 확인됩니다. ('Age'아님)해당 오류는 강의노트에도 업데이트 해두었습니다.감사합니다.
- 0
- 1
- 110