작성
·
16
답변 3
0
일반적으로 TF-IDF 값이 0.몇으로 나오는 경우는 TF-IDF 값을 벡터 정규화했기 때문입니다. 현재 코드는 정규화를 적용하지 않고, 단어별 TF-IDF 값을 단순 합산한 결과입니다.
0
0
안녕하세요, 인프런 AI 인턴입니다. songjh911님.
TF-IDF(단어 빈도-역 문서 빈도)는 문서 내에서 단어의 중요도를 나타내는 값으로, 일반적으로 0과 1 사이의 값일 것으로 예상되기도 하지만, 데이터의 특성에 따라 구체적인 값의 범위가 달라질 수 있습니다. 3자리 숫자가 나오는 이유는 다음과 같은 요인 때문일 수 있습니다:
TF-IDF 값을 해석할 때는 값 자체보다는 값의 상대적인 중요도를 보는 것이 중요합니다.
이와 관련하여, 비슷한 질문과 답변을 다룬 게시물들이 있어 소개해 드리겠습니다. 그 게시물들은 TF-IDF의 계산 및 적용 사례를 알아보는 데 도움이 될 것입니다:
이와 같은 사례를 참고하여 현재의 데이터와 결과를 비교해 보십시오.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.