인프런 커뮤니티 질문&답변

닉네임님의 프로필 이미지
닉네임

작성한 질문수

인공지능을 활용한 이상거래 검출 기법

오토인코더를 특성 추출기로 사용하는 방법에 대해 질문

작성

·

150

0

강의 내용을 바탕으로 저의 데이터를 가지고 적용하려하는데 질문이 있습니다.

제가 가지고 있는 데이터는 이렇습니다.

 

 

 

 

이것을 가지고 165번 파일을 바탕으로

c7을 제외하고 로그 스케일 후 동일하게 따라했는데 아래의 수치가 나왔습니다.

머가 잘못된 걸까요?

c7을 제외한 나머지 항목을 로그 스케일 했었는데 이곳이 문제일까요?

 

 

 

답변 1

0

YoungJea Oh님의 프로필 이미지
YoungJea Oh
지식공유자

일단 c7을 1, 2 가 아니라 0, 1 로 바꾸시기 바랍니다. 교재에서는 다른 모든 column 값 들이 scaling 되어 있고 amount 만 큰 값이라서 log scale을 잡아 줬지만 수강자님의 데이터는 각 column 별로 log scale 을 잡을 성격이 아니라 전체적으로 standard scaling을 하시는 것이 맞는 것 같습니다. c7 이 label 이라면 c7 을 y 로 분리 하시고 나머지 X column 들에 대해 sklearn.preprocessing.StandardScaler 를 이용해서 normalize 하시기 바랍니다. 감사합니다.

닉네임님의 프로필 이미지
닉네임
질문자

c7을 1,2가 아닌 0,1로 바꾸라는 말씀을 하셨는데 이유가 먼가요?

YoungJea Oh님의 프로필 이미지
YoungJea Oh
지식공유자

c7을 label 로 사용하실 것 아닌가요? 2진 분류 모델은 sigmoid 를 activation 함수로 사용하고 binary crossentropy loss 를 이용하므로 0, 1 로 encoding 되어야 합니다. 감사합니다.

닉네임님의 프로필 이미지
닉네임

작성한 질문수

질문하기