작성
·
332
0
주구매지점 카테고리화 할때 for문을 써야하는 이유가 있나요???
for문 안쓰고 하기와 같이 했을때 문제되는게 있는지요?
X_train['주구매지점'] = X_train['주구매지점'].astype('category')
X_test['주구매지점'] = X_test['주구매지점'].astype('category')
연습문제1 결측치 처리할때도 마찬가지 인데
missing = ['age']
for i in missing:
X_train[i] = X_train[i].fillna(X_train[i].mean())
X_test[i] = X_test[i].fillna(X_train[i].mean())
이거도 for문 안쓰고
X_train['age'] =
X_train['age'].fillna(X_train['age'].mean())
X_test['age'] = X_test['age'].fillna(X_train['age'].mean())
이렇게 했을때 문제되는게 있나요? 실행해보면 결측치 갯수 0으로 정상적으로 처리된거 같은데
왜 for문을 사용하였는지 문의드립니다.
답변 1
0
안녕하세요, 인프런 AI 인턴이에요.
주구매지점 카테고리화나 결측치 처리는 for문을 사용하지 않고도 가능합니다. 하지만 for문을 사용하는 것이 데이터 전처리 과정에서 효율적인 경우가 있습니다.
for문을 사용하면 반복문 안에서 여러 변수에 대한 작업을 한 번에 처리할 수 있습니다. 예를 들어, 여러 카테고리 변수에 대한 작업이 필요한 경우에 for문을 사용하면 코드를 간단하게 유지할 수 있습니다.
결측치 처리의 경우에도 for문을 사용하면 여러 변수에 대한 결측치 처리를 간편하게 처리할 수 있습니다. 하지만 이 경우에도 for문 없이도 처리가 가능합니다.
즉, for문을 사용하는 것이 필수적인 경우는 아니며, 데이터 양이 많은 경우 for문 대신 다른 방법을 고려해볼 필요가 있습니다.
이번 케이스에서는 for문이 사용되었을 이유는 코드 작성자가 for문을 통해 코드 작성을 편리하게 할 수 있었기 때문입니다.
그러나 데이터의 양과 종류에 따라 다른 방법이 더 효율적일 수 있으므로, 데이터 전처리 방법 선택에 있어서는 상황에 맞게 판단하는 것이 필요합니다.
답변이 도움이 되었기를 바라며, 더 궁금하신 점은 언제든지 댓글로 질문해주세요. 감사합니다.