인프런 커뮤니티 질문&답변

김소형님의 프로필 이미지
김소형

작성한 질문수

[R을 R려줘] R 기초다지기

보통명사 추출하기

작성

·

200

0

안녕하세요

 

저는 선생님 강의도 듣고, 블로그도 보면서 보통명사 추출하는 함수를 생성해서 tm패키지를 활용해 코퍼스로 변환하는 내용을 공부하고 있습니다~

 

커스텀함수는 이렇게 입력하고

words<-function(text){

text<- as.character(text)

extractNoun(text)

 

이후 변환을 하려고 하는데

doc<- TermDocumentMatrix(doc,

control = list(

tokenize= words

removeNumbers =T

removePunctuation =T

wordlengths= c(3,Inf)))

 

tokenize, removeNumbers, removePunctuation, wordsLengths와 제가 커스텀한 함수(words)가 인식이 안됩니다.

~are ignored 라는 경고가 뜨거나

예상하지 못한 기호(symbol)입니다 라는 에러가 뜹니다..

 

해결방법을 알고 계시는지요.

답변 1

0

김승욱님의 프로필 이미지
김승욱
지식공유자

안녕하세요 김승욱 입니다.

 

저도 텍스트마이닝을 하긴 합니다만 지금 상황만으로는 정확하게 판단하기 어렵습니다.

조금 더 정보가 필요한데 관련 코드나 샘플 데이터를 좀 더 제공해주시면 확인해드릴 수 있을 것 같습니다.

감사합니다.

김소형님의 프로필 이미지
김소형

작성한 질문수

질문하기