인프런 커뮤니티 질문&답변

이정원님의 프로필 이미지

작성한 질문수

모두의 한국어 텍스트 분석과 자연어처리 with 파이썬

0201 TF-IDF를 통한 가중치 적용

안녕하세요 선생님

24.04.18 23:29 작성

·

191

·

수정됨

0

안녕하세요 선생님

대학교에서 캡스톤디자인을 수행하고 있는 학생입니다.

판결문에서 사건의 원인,판결 결과,가중·감소 처벌 요소,키워드를 추출하고 싶은데 어떤 기술을 사용해야할지 막막하여 질문올리게 되었습니다.

거대언어모델은 지양하라고 교수님께서 말씀하셨습니다..ㅜ

조언을 주신다면 감사하겠습니다.

 

답변 1

0

박조은님의 프로필 이미지
박조은
지식공유자

2024. 04. 19. 22:36

안녕하세요.

텍스트 데이터 전처리(형태소 분석, 불용어 제거 등)를 진행하고

1) 빈도 분석을 해보는게 어떨지 싶습니다.

2) 토픽모델링을 하면 주요 주제별 키워드를 추출합니다.

3) 강의에 있는 텐서플로를 활용한 임베딩을 진행한 후 임베딩 프로젝터로 시각화 해서 가까운 의미의 키워드를 찾아보는 것도 좋겠습니다.

화이팅입니다 :)