인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

gkgktmd님의 프로필 이미지
gkgktmd

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

머신러닝에 대한 질문있습니다.

해결된 질문

작성

·

141

0

안녕하세요 좋은 강의 잘 듣고 있는 수강생입니다.

2가지의 질문이 있어서 게시판에 글을 남깁니다.

1. 일단 강의는 기초만 들은 상태이고 아이리스 말고 실제 데이터로 적용해볼까 하는데(보험업 종사자입니다.)

예를 들어 2년간 쌓인 데이터로 보험 갱신율에 대해 작업해보고 싶은데

현재 강의에서는 테스트 데이터 안에서만 나눠서 학습시킨 후 검증에서 끝나더라구요.

결과가 궁금한 데이터에 대해서 적용해보는 것까지는 나오지가 않더라구요.

그러면 만약 실 데이터에 적용해본다고 하면

기존 2년간 갱신한 고객의 데이터를 kfold로 나눠서 fit과 predict를 해보고 검증 결과가 괜찮다면

(물론 더 나은 모델이 있을 수 있고 과적합? 문제도 있을 수 있지만 아직 배우지 않아서 차치하고)

올해 고객데이터를 불러와서 그대로 predict메쏘드로 돌려서 결과를 산출하면 될까요?

2. 아무래도 개인정보에 굉장히 민감한 업종이다 보니 개인정보를 파이썬에 업로드 하는거 문제는 없을까요?

구글에서 데이터를 빼갈리는 없겠지만..ㅎㅎ

답변 3

0

권 철민님의 프로필 이미지
권 철민
지식공유자

넵, 그렇습니다.

0

gkgktmd님의 프로필 이미지
gkgktmd
질문자

클라우드에 올려서 파이썬에서 호출할건 아니고(회사컴은 클라우드 접속이 막혀있습니다.)

회사컴퓨터에 파일 저장 후 파이썬으로 로컬로 바로 부를건데 

파이썬 자체는 클라우드 같은게 아니라서 별문제 없다는 말씀이시죠?

빠르고 친절한 답변 감사합니다! 

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까

1. 실 데이터를 가지고 계시다니, 충분히 생각하신 방향으로 활용해 보실 수 있을 것 같습니다.

일단 과거 2년 데이터로 cross validation하게 학습/검증 후에, 올해 데이터로 predict하여 결과를 산출하면 될 것입니다.

2. 내부의 서버를 사용하신다면 개인정보 규제에 문제가 없을 거 같습니다만 회사에 따라서는 특정 운영자 외에는 아예 개인 정보에 접근을 막는 경우가 있으니 회사 내부 규정을 먼저 살펴 보셔야 할 것 같습니다. 

그리고 클라우드등 타 서버에 올려서 테스트 할 경우에는 회사 내부 규정에 문제가 없는지 반드시 확인해 보셔야 할 것 같습니다.

파이썬과는 무관합니다.

gkgktmd님의 프로필 이미지
gkgktmd

작성한 질문수

질문하기