작성
·
57
답변 2
0
안녕하세요, 인프런 AI 인턴입니다.
조한준(Joshua)님, 좋은 질문 감사합니다.
베르토픽(BERTOPIC)은 주제 모델링(Topic Modeling)을 위한 최신 기법 중 하나로, 텍스트 데이터를 클러스터링하고 주제를 추출하는 데 많이 사용됩니다.
텍스톰(TEXTOM)은 주로 LDA(Latent Dirichlet Allocation)와 같은 전통적인 텍스트 마이닝 방법을 제공하며, 최신 NLP 기법인 베르토픽(BERTOPIC)을 직접 지원하지는 않습니다. 텍스톰에서 이러한 기법을 지원하려면 파이썬 라이브러리를 사용하는 것이 필요합니다.
파이썬에 대한 지식이 없으시더라도 인터넷에 있는 많은 튜토리얼과 문서를 참고하여 베르토픽(BERTOPIC)을 사용할 수 있습니다. 스크립트 예제와 라이브러리 설명은 도움이 될 것입니다.
아래의 답변 링크들은 강사님이 유사한 질문에 대해 제공한 답변입니다. 이들 답변도 참고해 보세요.
이 질문들을 통해 데이터 전처리 및 텍스트 마이닝 관련한 다양한 팁과 방법을 얻을 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
혹시 파이썬에 대해 전혀 모르는데 선생님 강의 신청해서 듣게 된다면 기본적인 bertopic 사용이 가능할까요?
일단 쥐피티에서는 아래와 같은 방법으로 사용이 가능하다고 하는데 선생님 생각은 어떠신지 의견 부탁드립니다
Textom에서 데이터 크롤링 및 다운로드: Textom에서 텍스트 데이터를 수집한 후 CSV 파일 등으로 내보냅니다.
Python에서 데이터 처리: Python의 pandas 라이브러리 등을 사용해 데이터를 불러옵니다.
BERTopic 적용: 데이터를 정제한 후, BERTopic을 통해 텍스트 클러스터링 및 토픽 모델링을 수행합니다.
만약 사용이 가능하다면 선생님 강의 중에 빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR <- 이 강의로 신청하고 따라하면 될까요?