인프런 커뮤니티 질문&답변

김경수님의 프로필 이미지

작성한 질문수

빅데이터분석기사 실기대비 (R 활용)

구름 예제 : 작업형 2번 (마지막 문제)

21.12.02 21:50 작성

·

162

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
이렇게 제출하라는데
데이터프레임으로 만들어서 제출해야 하나요?>
이렇게 제출하면 되는건가요?
 
그리고 p3 만들면 X_test는 행 수가 2400개 정도고 p3의 행 수는 800개 (열은 두개, 0/1) 정도인데
이게 맞는건가요..?
 

답변 2

0

companionclub님의 프로필 이미지
companionclub
지식공유자

2021. 12. 04. 22:29

 

안녕하세요.

아래와 같이 강의자료에 있는 '출제예상'의 마지막 문제에 대해

코드를 실행하면 2482 X 2의 결과물이 나옵니다.

저는 결측치를 지우지 않고 보정했기 때문에 X_test 데이터의 전체 행의 수만큼 예측값이 나오게 됩니다.

참고부탁드립니다.

 

0

companionclub님의 프로필 이미지
companionclub
지식공유자

2021. 12. 03. 11:44

 

안녕하세요.

데이터프레임으로 만들어서 csv로 변환하는 방법이 일반적입니다. 그렇게 제출하시면 됩니다.

제출을 위해 만들어지는 X_test에 대한 p3는 행의 수가 2,482개가 나와야 합니다.

열은 두개가 맞습니다.  그 중에 1인 확률만 필요합니다.

그래서 'result <- data.frame(Y_N = p3[,2])' 를 통해서 1인 확률만 저장합니다.

김창균님의 프로필 이미지

2021. 12. 03. 20:48

안녕하세요, 저도 비슷한 상황이어서 댓글을 답니다

p3의 행은 871개가 나오는데요

강사님이 마지막 강의에 올려주신 내용대로 그대로 작성해도 동일하게 871개가 나옵니다.

 

companionclub님의 프로필 이미지
companionclub
지식공유자

2021. 12. 03. 21:17

안녕하세요.

X_train을 데이터분할한 p3는 말씀하신 871이맞습니다.

 

다만 X_test로 산출된 p3은 2400여개가 나오는게 맞습니다.

김창균님의 프로필 이미지

2021. 12. 03. 22:02

계속해도 안되다가 답을 찾은것 같습니다.

X_test의 환불금액열에 결측값이 1611개가 있어서 p3가 871개만 나오는것 같습니다.

(1611+871)=2482

X_test도 음수와 결측치를 보정하고 진행하는게 맞는지요?