인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

ck kim님의 프로필 이미지
ck kim

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

기출(작업형2) 한 가지 방법으로 풀기

작업형2 한가지 방법으로 풀기

해결된 질문

작성

·

261

0

음...이 양식으로 빅데이터분석기사 실기 체험 유형2가 안풀리는데 혹시 해당 문제 풀이 소스 올려주실 수 있을까요?

답변 5

0

안녕하세요! 회귀부분 알려주신대로 교재310페이지 항공권 가격 예측부분에 적용해서 풀고 있는데.. 자꾸 에러가 떠요 ㅠ 

1. 카테고리수 비교 에러: 이렇게 하니 안나와요.. 

#카테고리비교 -> 안나옴 ㅠ 

print(train.describe(include='0'))
print(test.describe(include='0'))
-------------------------------------------------------------------------


 


퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

0 -> 숫자 아니고

영어 대문자 'O' 입니다.

또는 'object' 로 작성해주세요!

0

저도 같은 질문을 하려했는데 ck kim님께서는 해결하신듯하네요. 저 같은 경우에는 결측치를 채워넣어도 원핫인코딩으로 잘 풀리지가 않네요. 혹시 concat으로 train, test를 합쳐놓고 get_dummies로 인코딩하고 다시 train/test로 나눠서 진행하는 과정을 코딩으로 볼 수 있을까요?

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

실기 체험 유형은 데이터가 기출과 달리 어려운 상태입니다.

  • 결측치 존재

  • 카테고리 다름


    아래 강의 영상에서 풀이하고 있어요!

예시문제 작업형2(신 버전)

0

ck kim님의 프로필 이미지
ck kim
질문자

그리고 카테고리 차이가 있어서 인코딩할 때 concat으로 train, test를 합쳐놓고 get_dummies로 인코딩하고 다시 train/test로 나눠서 진행해야 이 포멧으로 실행할 수 있습니다.

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 맞습니다.

만약에 합쳐서 진행하는 것에 문제가 생긴다면,

좋은 방법은 아니지만 원핫인코딩 후 train과 test 컬럼을 비교하고 한쪽에 추가/제거 하는 임시방편도 있어요!

0

ck kim님의 프로필 이미지
ck kim
질문자

결측치 때문에 제대로 학습이 안되서 그렇네요

train, test에서 결측치 제거하고 진행하시면 됩니다.

다른분들도 참고하세요.

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 기출과 달리 결측치도 있습니다.

ck kim님의 프로필 이미지
ck kim

작성한 질문수

질문하기