작성한 질문수
모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
0201 TF-IDF를 통한 가중치 적용
작성
·
216
수정됨
0
안녕하세요 선생님
대학교에서 캡스톤디자인을 수행하고 있는 학생입니다.
판결문에서 사건의 원인,판결 결과,가중·감소 처벌 요소,키워드를 추출하고 싶은데 어떤 기술을 사용해야할지 막막하여 질문올리게 되었습니다.
거대언어모델은 지양하라고 교수님께서 말씀하셨습니다..ㅜ
조언을 주신다면 감사하겠습니다.
답변 1
안녕하세요.
텍스트 데이터 전처리(형태소 분석, 불용어 제거 등)를 진행하고
1) 빈도 분석을 해보는게 어떨지 싶습니다.
2) 토픽모델링을 하면 주요 주제별 키워드를 추출합니다.
3) 강의에 있는 텐서플로를 활용한 임베딩을 진행한 후 임베딩 프로젝터로 시각화 해서 가까운 의미의 키워드를 찾아보는 것도 좋겠습니다.
화이팅입니다 :)