인프런 커뮤니티 질문&답변

HAHA님의 프로필 이미지
HAHA

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02

컨텐츠 기반 필터링

작성

·

191

0

안녕하세요.

 

컨텐츠 기반 필터링을 보면 서버에서 올려 구현하다고하면 메모리에 해당 정보들을 메모리에 올려서 해야되는건가요??

서버에서 사용한다면 새벽 n시에 메모리에 있는 업데이트를 한다던가(cron job처럼) 하는 작업이 있는걸까요??

아니면 이런 정보를 위한 DB가 따로 있나요??

 

감사합니다.

답변 3

0

HAHA님의 프로필 이미지
HAHA
질문자

질문 답변주신 내용에서 

대용양 데이터일 경우 db에 index걸어서 서비스 하신다고 하셨는데,

답변에서 남겨주신 내용을 토대로 한다면 결국 다시 memory에서 계산하는게 아닌가요??

제가 잘못 이해했으면 죄송합니다ㅠㅠ

 

0

HAHA님의 프로필 이미지
HAHA
질문자

혹시 DB에 예를 들어 어떤 포맷으로 올리는지 알려주실 수 있을까요?

사용자-아이템을 한다고 하면 모든 사용자와 모든 아이템을 계산해서 

record 수는 사용자 수

column 수는 아이템 수로 해서 db에 저장하는걸까요??

권 철민님의 프로필 이미지
권 철민
지식공유자

RDBMS 에 저장할 때는 코사인 유사도와 같은 데이터 포맷을 하기에는 컬럼수가 너무 많아서 안됩니다.  그래서 모두 ROW 형태로 내립니다. 그러니까 레코드수 사용자수 , 컬럼수 아이템수가 아니라 레코드 수 사용자수 X 아이템수, 컬럼수 2개(사용자아이디, 아이템 아이디)

 

HAHA님의 프로필 이미지
HAHA
질문자

넵 답변해주신 내용토대로 좀 더 고민해보고 이해가 안가는 점 있으면 다시 질문 남기겠습니다!
항상 질문 답변해주셔서 감사합니다!

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

네, 빠르게 서비스해야 하므로 메모리에 올려서 하는 경우가 많습니다. 하지만 대용량의 데이터 일 경우에는 db에서 index을 잘 걸어서 서비스를 하기도 합니다. 

보통은 db에 있는 정보를 새벽에 배치로 잘 가공해서 메모리에 올려 놓고 서비스 합니다. 

감사합니다. 

HAHA님의 프로필 이미지
HAHA

작성한 질문수

질문하기