소개
Eine andere Sprache zu lernen ist wie ein anderer Mensch zu werden.
게시글
질문&답변
2022.07.29
data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?
Review 0 of 4673 Review 1000 of 4673 /usr/local/lib/python3.7/dist-packages/ipykernel_launcher.py:18: DeprecationWarning: Call to deprecated `__getitem__` (Method will be removed in 4.0.0, use self.wv.__getitem__() instead). /usr/local/lib/python3.7/dist-packages/ipykernel_launcher.py:20: RuntimeWarning: invalid value encountered in true_divide Review 2000 of 4673 --------------------------------------------------------------------------- IndexError Traceback (most recent call last) "> in () ----> 1 get_ipython().magic('time testDataVecs = getAvgFeatureVecs( getCleanReviews(df_test), model, num_features )') 4 frames in time(self, line, cell, local_ns) in () "> in getAvgFeatureVecs(reviews, model, num_features) 14 print("Review %d of %d" % (counter, len(tokenized_data))) 15 # 평균 피처 벡터를 만들기 위해 위에서 정의한 함수를 호출한다. ---> 16 reviewFeatureVecs[int(counter)] = makeFeatureVec(review, model, num_features) 17 # 카운터를 증가시킨다. 18 counter = counter + 1. IndexError: index 2036 is out of bounds for axis 0 with size 2036이게 혹시 왜 나타나는 오류일까요?? del df_test["Sentence"][:2037] 하면 하나씩지워지기는 하는데... 어제부터 인덱스에러가 왜 나는지 모르갰습니다..! 위에 테스트는 잘 돌아갔는데...
- 1
- 4
- 503
질문&답변
2022.07.28
data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?
# 완성된 임베딩 매트릭스의 크기 확인 model.vectors.shape 이코드에서 'Word2Vec' object has no attribute 'vectors' 어트리뷰트에러나는데 혹시 뭐가 뭐가문제일까요? 구글링해보았는데 젠심 버전 낮췄는데도 어느샌가 부터 자꾸 이부분에서 오류가 납니다
- 1
- 4
- 503
질문&답변
2022.07.28
data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?
감사합니다! 추가적으로 이 강의를 다 듣고 적용해서 한국어 데이터에 하려고 실습해보려고 하는데 이런 오류가 뜨면서 마지막에 랜덤포레스트 모델이 안돌아가는데 혹시 test랑 train데이터 행의 개수가 달라서 그런걸까요? # 학습 리뷰를 bags of centroids 로 변환한다. # 학습 리뷰를 bags of centroids 로 변환한다. counter = 0 for review in clean_train_reviews: train_centroids[counter] = create_bag_of_centroids( review, \ word_centroid_map ) counter += 1 if counter==4673: pass # 테스트 리뷰도 같은 방법으로 반복해 준다. test_centroids = np.zeros((df_test["Sentence"].size, num_clusters), \ dtype="float32" ) counter = 0 for review in clean_test_reviews: test_centroids[counter] = create_bag_of_centroids( review, \ word_centroid_map ) counter += 1 if counter==4673: break # 랜덤포레스트를 사용하여 학습시키고 예측 forest = RandomForestClassifier(n_estimators = 100) # train 데이터의 레이블을 통해 학습시키고 예측한다. # 시간이 좀 소요되기 때문에 %time을 통해 걸린 시간을 찍도록 함 print("Fitting a random forest to labeled training data...") %time forest = forest.fit(train_centroids, df_train["Sentence"]) IndexError: index 4673 is out of bounds for axis 0 with size 4673 세번째 줄에서 에러가 나옵니다. 열은 같은데 행의 개수가 각각 4673과 267입니다. 감사합니다 제 댓글에 코드공유했습니다. 혹시 아시면 알려주시면 감사합니다!
- 1
- 4
- 503
질문&답변
2021.10.21
배운 것 기반으로 만들어보고 있는데 질문이 있습니다.
선생님이 말씀해주신 바로 위코드로 수정했는데도 20일날짜 하루치만 가져와지고 밑에서 연번 컬럼은 또 안 불러와지는데 뭐가 잘못된건가요? https://colab.research.google.com/drive/1dOIzJP10qMdO18s6r7yknMFi0AmpjvdW?usp=sharing
- 1
- 5
- 267
질문&답변
2021.10.19
배운 것 기반으로 만들어보고 있는데 질문이 있습니다.
선생님, 혼자 만들어보고 있는데 지금, 두 부분에서 막혀서 안되는데 뭐가 잘못되었는지 봐주시면 감사드립니다.... c.f.https://colab.research.google.com/drive/1sOxHYPFilE7LafM7EaHf322HZXlsZK4W?usp=sharing (사진)(사진)
- 1
- 5
- 267