인프런 커뮤니티 질문&답변

신진님의 프로필 이미지
신진

작성한 질문수

IT 회사에서 비개발자가 살아남기 위한 모든 개발 지식 A to Z

데이터 파이프라인(데이터의 전체 흐름) 파악하기

데이터 베이스관련 질문들 (카프카, 레디스 등)

작성

·

216

1

안녕하세요 회사에서 만난 개념들중 이해안가는 부분

질의드려요

 

1. neo4j 그래프 데이터베이스가 있는데요

이것의 장점은 단순히 다른 형태의 데이터에 따라

속도가 빨라진다는 것일까요? rdbms말고 그래프

데이터베이스를 굳이 쓰는 이유를 모르겠어요 

 

2. 카프카라는 것이 강의중 데이터 수집서버나 

데이터 가공 서버하고 관련이 있을까요?

 

3. 레디스가 임시저장용 캐시 라고 하는데 이것도

데이터 레이크 혹은 웨어하우스에 해당할까요

 

너무 잔질문이 많아서 죄송하네요.

초보로서 제가 본 최고의 강의 제공주셔서 항상 감사드립니다.

답변 2

0

신진님의 프로필 이미지
신진
질문자

정말 감사합니다!

0

그랩님의 프로필 이미지
그랩
지식공유자

안녕하세요  신진님~

1번부터 답변을 드리자면

그래프 데이터베이스는 일반적으로 테이블 혹은 레코드 간의 관계가 복잡할수록 유용하게 사용되는 것 같아요! 기본적으로 RDB에서는 JOIN이라는 것을 통해서 테이블끼리 관계를 맺는데, 생각보다 비용이 커서 속도가 느린편입니다. 예를 들어 페이스북이나 인스타에서 친구 관계의 경우 관계 그래프가 정말 복잡하게 그려지는데 이런 상황에서 그래프 데이터베이스가 이에 최적화되어 있다고 볼 수 있어요.

2번의 경우

카프카는 가장 유명한 메시지 큐 오픈소스 중 하나로, 정말 큰 규모의 네트워크 요청들도 '메시지'라는 수단으로 내부 데이터베이스에 저장을 잘 해둔 후, 필요할 때 쓸 수 있도록 + 메시지를 여러곳에서 사용할 수 있도록 돕습니다. 즉 우리가 일반적으로 서버 클라이언트의 관계를 생각하면 바로 요청이 간다면, 카프카를 활용하면 중간에서 요청들을 저장해두고 서버에서 필요에 맞게 가져가서 사용할 수 있다는 장점이 있겠죠? 

3번의 경우,

데이터 웨어하우스, 레이크는 임시적이기 보단 반영구적으로 대용량의 데이터를 저장하기에 임시저장용 캐시(레디스)와는 성격이 다릅니다! 임시저장용 캐시는 오히려 데이터 웨어하우스같은 데이터 저장소보다 속도가 빠르죠. 각기 장단점이 있으며 이둘을 잘 활용해서 데이터 플랫폼을 구축하곤 합니다.

신진님의 프로필 이미지
신진

작성한 질문수

질문하기