작성
·
178
0
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns
sns.set_style("darkgrid")
def plotDateTopic(topic_id):
label = "Topic #%d:\n" % topic_id
label += " ".join([vectorizer.get_feature_names()[i]
for i in W[topic_id].argsort()[:-6:-1]])
h = H / H.sum(1, keepdims=True)
h = h[:, topic_id].ravel()
plt.plot(dateNews['date'], h)
plt.fill_between(dateNews['date'], h, alpha=0.5, label=label)
plt.figure(figsize=(40, 10))
plotDateTopic(2)
plotDateTopic(0)
plotDateTopic(4)
plotDateTopic(13)
plotDateTopic(17)
plotDateTopic(9)
plt.xticks(fontsize=25)
plt.legend(fontsize=25, bbox_to_anchor=(0.1, 0.2))
plt.show()
이렇게 식을 사용해서 데이터를 추출했더니
이런 그림이 나오는데요.
주신 자료의 4) 토픽모델링의 16번은 월별로 나오는데 어떤 부분이 잘못됐는지 궁금합니다!
그리고 맥에서 한글 오류가 나는 건 어떻게 수정하면 될까요?
좋은 강의 감사드립니다.
답변 1
0
안녕하십니까, 인사이저 입니다.
먼저 맥에서 한글폰트가 깨지는 케이스는 아래의 포스트를 참고하시기 바랍니다.
https://wannabe00.tistory.com/entry/Mac%EC%97%90%EC%84%9C-Matplotlib-%EC%82%AC%EC%9A%A9-%EC%8B%9C-%ED%95%9C%EA%B8%80-%EA%B9%A8%EC%A7%90-%ED%95%B4%EA%B2%B0
이전 공유드린 토픽 모델링 코드에, 아래 처럼 폰트를 등록하시면 되겠습니다.
그리고 보내주신 스크린샷을 보건데,
그래프를 그릴때 사용한 데이터가 2020년 8월자 데이터로만 구성된 게 아닐까 싶습니다.
matplotlib 가공 전의 데이터셋을 한 번 확인해보시고,
그럼에도 이슈가 있을 시 문의 주시기 바랍니다.
감사합니다.