인프런 커뮤니티 질문&답변

이원정님의 프로필 이미지
이원정

작성한 질문수

Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능

사용자의 평가경향을 고려한 CF

CF_knn_bias 실습에서 not in index error 발생합니다.

해결된 질문

작성

·

582

0


movie_ratings = movie_ratings[user_idx][-neighbor_size:]
에서 아래와 같은 에러가 발생합니다

KeyError: '[68, 70, 62, 31, 7, 73, 84, 1, 52, 0, 89, 6, 33, 53, 14, 26, 82, 23, 46, 63, 12, 39, 19, 44, 4, 30, 81, 10, 27, 79, 21, 45, 25, 87, 57, 40, 80, 78, 24, 86, 88, 76, 64, 2, 28, 71, 11, 37, 85, 55, 54, 66, 9, 42, 75, 36, 67, 43, 32, 50, 29, 58, 61, 72, 34, 74, 18, 22, 77, 60, 3, 47, 49, 15, 51, 56, 65, 69, 90, 16, 41] not in index'


movie_ratings 프린트 결과는 아래와 같이 나옵니다!
movie_ratings user_id 

5 -1.816794
8 -1.636364
13 -0.064990
17 -1.761905
20 0.833333
...
881 -1.340206
882 -0.097087
887 -2.796875
901 -1.817204
938 0.740741
Name: 243, Length: 91, dtype: float64


실습 데이터 말고 colab 코드도 제공받을 수 있나요?

확인부탁드립니다!

감사합니다 :)

답변 3

0

거친코딩님의 프로필 이미지
거친코딩
지식공유자

안녕하세요.

코드 확인 결과, 올려주신 코드에 오타가 있네요.

movie_raitngs = np.array(movie_ratings)

movie_raitngs -> movie_ratings로 수정해서 다시 해보시면 될 것 같습니다.

감사합니다.

-거친코딩 드림-

0

이원정님의 프로필 이미지
이원정
질문자

 
# 사용자 평가 경향을 고려한 함수 #

# full matrix 에서 사용자의 평점 평균을 구한다.

rating_mean = rating_matrix.mean(axis=1)

# 영화 평점과 각 사용자의평균과의 차이 (평점편차)를 구한다.

rating_bias = (rating_matrix.T - rating_mean).T

# 사용자 평가 경향을 고려한 함수

def CF_knn_bias(user_id, movie_id, neighbor_size=0):

if movie_id in rating_bias.columns:

sim_scores = user_similarity[user_id].copy()

movie_ratings = rating_bias[movie_id].copy()

none_rating_idx = movie_ratings[movie_ratings.isnull()].index

movie_ratings = movie_ratings.drop(none_rating_idx) # CF_knn에서는 dropna() 사용했었음

sim_scores = sim_scores.drop(none_rating_idx)

if neighbor_size==0:

prediction = np.dot(sim_scores, movie_ratings) / sim_scores.sum()

prediction = prediction + rating_mean[user_id]

else:

if len(sim_scores) > 1:

neighbor_size = min(neighbor_size, len(sim_scores))

sim_scores = np.array(sim_scores)

movie_raitngs = np.array(movie_ratings)

user_idx = np.argsort(sim_scores)

sim_scores = sim_scores[user_idx][-neighbor_size:]

movie_ratings = movie_ratings[user_idx][-neighbor_size:]

prediction = np.dot(sim_scores, movie_ratings) / sim_scores.sum()

prediction = prediction + rating_mean[user_id]




else:

prediction = rating_mean[user_id]

else:

prediction = rating_mean[user_id]




return prediction

score(CF_knn_bias, 30)


CF_knn은 정상 동작합니다!
코드 첨부드리니 한번 확인 부탁드립니다.

감사합니다.



 

0

거친코딩님의 프로필 이미지
거친코딩
지식공유자

안녕하세요.

 CF_knn_bias에서 에러가 난다고 하셨는데,

혹시 동일한 로직을 품고 있던 이전 챕터 CF_knn에서는 해당 에러가 발생하지 않았나요?

해당 부분 한번 확인해보시구

그래도 여전히 에러가 난다면 타이핑 하신 코드를 함께 첨부해주시면 확인해보도록 하겠습니다.

감사합니다.

-거친코딩 드림-

 

이원정님의 프로필 이미지
이원정

작성한 질문수

질문하기