작성
·
518
0
q_topics을 입력하면 왜 계속 아래와 같은 오류상태로 출력이 되는 걸까요. 수업시간 강의를 보면 한글단어가 잘나오는데 말입니다.
topic term beta
<int> <chr> <dbl>
1 1 "\xb0\xa1\xb0\xdd" 0.00202
2 2 "\xb0\xa1\xb0\xdd" 0.000510
3 3 "\xb0\xa1\xb0\xdd" 0.00146
4 4 "\xb0\xa1\xb0\xdd" 0.000532
5 5 "\xb0\xa1\xb0\xdd" 0.000549
6 6 "\xb0\xa1\xb0\xdd" 0.00242
7 7 "\xb0\xa1\xb0\xdd" 0.000502
8 8 "\xb0\xa1\xb0\xdd" 0.00365
9 9 "\xb0\xa1\xb0\xdd" 0.00616
10 10 "\xb0\xa1\xb0\xdd" 0.000805
# ... with 644,960 more rows
답변 4
0
0
우왁! 드디어 나왔다!!! 하루동안 해서 ㅠㅠㅠ
$`1`
관련기사 구독신청 금지 네이버에서 따르 모바일한경 무단전재 바로가기 밝히
1 1 1 1 1 1 1 1 1
일본 재배포 정부 지난해 한경닷컴 한국경제
1 1 1 1 1 1
## 혹시 저같이 안나오신분들은...(확실하지 않지만) 참고하시기를
추가라이브러리 설치
###
library(xml2)
library(rvest)
library(dplyr)
#########LDA에 필요한 패키지
#https://junhewk.github.io/text/2017/08/15/complaint-LDA/
install.packages("LDAvis")
install.packages("Rmpfr")
library(stringr)
library(tidytext)
library(KoNLP)
library(ggplot2)
library(lubridate)
library(tm)
library(topicmodels)
library(LDAvis)
library(Rmpfr)
library(tidyverse)
###########리페어 인코딩
comments2<-repair_encoding(comments2, from='utf-8')
comments2<-repair_encoding(comments2)
################### 샘플을 뽑았으니깐
for(i in 1:length(comments-모수)){ => for(i in 1:length(comments2-샘플)){ 로 해야하지 않을까
0
혹시...
> comments2<-repair_encoding(comments2)
Best guess: UTF-8 (100% confident)
50건 이상의 경고들을 발견되었습니다 (이들 중 처음 50건을 확인하기 위해서는 warnings()를 이용하시길 바랍니다).
=> 이렇게 나오는데 정상일까요? // 아.... 왜 계속 깨져서 나올까요... ㅠ
0
안녕하세요. dgdg dgdg님
인코딩이 깨지는 것 같은데요.
topic modeling하기전에 데이터들이 글자가 깨지는지 한번 확인 해 보시기 바랍니다.
함수를 적용하다가 글자가 깨질 수도 있고, 데이터를 처음에 import할 때에 깨질 수도 있습니다.
데이터가 제대로 import 되어있다면, 데이터를
library(rvest)
data<-repair_encoding(data)
등과 같은 함수를 통해서 인코딩을 변환해주시면 될 것 같습니다.