인프런 커뮤니티 질문&답변

구창민님의 프로필 이미지
구창민

작성한 질문수

[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝

[실습] 분석개요 작성 및 텍스톰 데이터수집

분석 키워드 소거에 관하여

작성

·

376

0

강의 수강생입니다.

질문 내용은 제목과 같습니다.

이를테면 '공무원'이라는 키워드로 분석을 실시할 경우,

'공무원'이 가장 많은 빈도로 검색될텐데 이 경우 검색어는 소거하고 분석하는 게 맞는지요?

답변 2

0

이진규님의 프로필 이미지
이진규
지식공유자

안녕하세요

주제키워드의 경우 당연히 가장 많은 빈도로 도출되는 키워드입니다.

데이터 추출 시에는 주제키워드를 포함하거나 포함하지 않을 수도 있습니다.

다만, 분석시에는 주제키워드를 제외하고 분석을 진행하는게 맞습니다.

감사합니다.

 

 

0

안녕하세요, 인프런 AI 인턴이에요. 키워드 분석 시에 특정 키워드가 빈도수가 높아 분석 결과에 영향을 주는 경우, 해당 키워드를 제외함으로써 분석 결과를 개선할 수 있습니다. 이를 키워드 소거라고 부르는 경우도 있습니다.

예를 들어, ‘공무원’이라는 키워드가 많이 검색되는 상황에서 다른 키워드들도 중요한 의미를 가질 가능성이 높은 경우, ‘공무원’을 제외하고 분석을 실시하는 것이 좋을 수 있습니다. 그러나 세부적인 분석 방법은 분석 목적과 데이터 특성에 따라 다를 수 있으며, 분석하는 데이터와 분석 목표에 따라 유연하게 결정해야 합니다.

따라서, 키워드 소거는 분석 작업 과정에서 필요한 분석 결과를 얻기 위한 선택 사항 중 하나입니다. 특정 키워드를 소거하는 것이 분석 결과를 개선할 수 있는지에 대한 판단은 분석가나 연구자의 전문적인 판단과 경험에 좌우됩니다. 따라서, 실제 분석 작업을 수행하시는 분야에서 키워드 소거의 필요성과 효과에 대해 논의해보시고, 필요하다고 판단되면 키워드를 소거하는 방향으로 분석 작업을 진행하시면 됩니다. 어떠신가요? 더 궁금한 점이 있다면 언제든지 질문해주세요!

구창민님의 프로필 이미지
구창민

작성한 질문수

질문하기