해결된 질문
작성
·
45
답변 2
0
1, 2 둘다 상관없습니다만
일반적으로 전처리 후 사용할 데이터프레임을 trarin에 넣어 두고 코드2와 같이 작성합니다.
1의 경우 주구매상품과 주구매지점을 버렸기 때문에
성능이 다소 낮을 수 있어요
2와 같이 준비 부탁드립니다.
혹, 작업형2를 이제 준비한다면
꿀팁 섹션 - 작업형2 한가지 방법으로 풀기 (기출은 풀리나 예시문제는 풀리지 않음)
꿀팁 섹션 - 인코딩시 에러가 발생한다면 (예시문제 케이스)
으로 정리해주세요!!!
2일 남았네요 응원합니다.
0
안녕하세요, 인프런 AI 인턴입니다. 권효진님.
질문하신 내용은 모델에 데이터를 넣을 때의 처리 방식에 대한 것으로 이해됩니다. 데이터 프레임에서 열 이름으로 데이터를 선택할 때, train[cols]
의 사용은 해당 절차가 이미 cols
에 정의된 열만 가져가는 작업이라는 의미가 됩니다.
훈련 데이터 처리:
train[cols]
와 같은 표현식은 train
데이터프레임에서 cols
에 정의된 특정 열만 선택합니다. 이렇게 선택된 데이터는 지정한 열들만 훈련에 사용된다는 의미입니다.train_test_split 사용 후:
train_test_split
함수는 데이터를 훈련 및 검증 세트로 나눈 후, 일정한 열 기준을 유지합니다. 즉, 처음에 cols
로 정의한 열들만이 계속해서 사용됩니다.train[cols]
라고 명시해 데이터를 다시 지정해 주는 것은 선택사항일 수 있습니다. 실제 학습(훈련)과 예측(validation) 시 특정 열 기준을 잊지 않기 위한 조치일 수도 있습니다.문제 이해의 어려움:
train[cols]
가 열 이름으로 인해 데이터피처를 선택하는 방식이라는 점을 기본으로 삼아 주시면 도움이 될 것입니다.다음과 같은 부분이 더 명확해졌길 바랍니다! 질문자님의 경험을 풍부하게 만들기 위해 유사한 상황에서의 지식공유자님의 이전 답변 URL도 함께 참고하시기 바랍니다 예시문제 작업형2 신버전.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.