인프런 커뮤니티 질문&답변

kjmoon66님의 프로필 이미지
kjmoon66

작성한 질문수

빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)

원하는 결과를 얻기 위한 데이터 전처리 관련

작성

·

76

0

안녕하세요

word_count 파일을 가지고 전처리를 하기 위해 유사어나 제외어를 처리를 위해 library파일을 만들었습니다

A 컬럼에는 제외할 키워드를 지정하고 B 칼럼에는 빈 공간을 두었습니다

그리고 유사어 경우 A컬럼에는 '국가' B칼럼에는 '나라' 를 기입했습니다. 그리고 제공해준 대로 코딩을 해서

키워드 빈도나 워드 크라우드를 실행해도 수정되지 않은 결과가 나옵니다(제외할 키워드, 수정할 키워드 반영이 안됨)

왜 그런지 ? 어떤 과정이 문제인지 잘 모르겠습니다

그리고 만약 유사어를 여러개를 지정할 때, 예를 들면 ' 지역주민'과 유사어가 '시민' , '주민' 등과 같이

2개이상일 경우에는 어떻게 작성해야 하는지도 궁금합니다

 

 

답변 1

0

이진규님의 프로필 이미지
이진규
지식공유자

안녕하세요 주어진 코드를 돌리면 정제파일이 생성되는데요 이 새로 생성된 정제파일을 가지고 빈도분석 등 여러 분석을 진행하셨는지요? 기존의 파일로 실행이 됬을 가능성이 높습니다.

시민을 A열에 B열에 지역주민, 주민을 A열에 B열에 지역주민으로 지정하면 됩니다^^

 

kjmoon66님의 프로필 이미지
kjmoon66

작성한 질문수

질문하기