해결된 질문
작성
·
1.5K
0
안녕하세요
현재 저희 조직의 데이터 리터러시 역량 레벨이 0인데요
차근차근 레벨을 올려가려합니다.
이번에 데이터 엔지니어와 함께 데이터 드리븐 문화를 만들어가려고합니다.
현재 데이터 엔지니어는 1명이고 회사 규모는 약 50명, 운영하는 서비스는 3개이며 분석가는 없습니다.
현재는 서비스에서 발생하는 로그를 클라우드에 올려서 Snowflake로 쿼리를 할 수 있는 단계이며, 이제 막 지표를 생성하려하고있습니다.
여기서 PA는 필수인지, 어떤 장단점이 있는지 고견 부탁드립니다.
답변 2
2
안녕하세요! 데이터 리터러시 역량 레벨 0에서 올리려고 하시는군요..! 질문을 정리하면 Product Analytics 도구 도입을 언제 하면 좋을지, 왜 하는지 등에 대한 것으로 파악했어요
Amplitude, Mixpanel 같은 유료 PA 도구를 사용하는 이유를 꼽자면 "리소스"를 들 수 있습니다.
회사의 상황을 가정하고 몇가지 케이스를 공유드려볼게요.
1. 처음에 데이터 엔지니어가 데이터 웨어하우스 구축하고, 지표를 하나씩 생성하려고 함
2. 지표를 생성한 후(아마 전사적인 지표, 중요한 지표 위주), 지표 대시보드 등을 공유
3. 사람들이 이 대시보드를 보며 데이터를 보기 시작. 추가적으로 궁금한 내용이 생기기 시작
4. 사람들이 데이터 엔지니어에게 데이터 추출 요청을 진행
5. 데이터 엔지니어 관점에서 해야하는 중요한 일(파이프라인 구축, 데이터 마트 구축, 시각화 플랫폼 운영 등)보단 요청한 데이터를 처리하기 급급하기 시작
6. 그래서 데이터 분석가를 채용하고, 데이터 분석가가 데이터 분석을 하길 희망
7. 하지만 업무가 데이터 엔지니어=>데이터 분석가로 바뀌었을 뿐 여전히 요청 기반으로 업무
이렇게 일하는 회사들을 자주 보았습니다. 이럴 때 시간의 병목이 생깁니다. 요청을 하는 시간, 요청을 처리하는 시간이 걸리지요. 여기서 요청을 해야하는 이유는 DB 접근 권한 이슈도 있고, SQL 사용 역량 여부 등 때문입니다. 그래서 요청 기반으로 하는데, 이 요청을 최대한 줄이고 구성원들이 직접 데이터를 볼 수 있는 환경을 만들어야 합니다.
그 과정에서 모두에게 SQL을 학습시킬 것인가?에 대한 고민을 하곤 합니다. 어떤 회사에선 이 방식이 잘 먹힐수도 있지만 어떤 회사에선 먹히지 않을 수도 있습니다. SQL이 나름 쉽다고 해도 코딩에 대해 모르시는 분들은 시간이 조금 걸리긴 하지요. 반면 유료 PA 도구는 직관적으로 드래그앤 드랍으로 사용할 수 있습니다. 그러다보니 PA 도구를 도입하면 SQL을 몰라도 데이터를 탐색할 수 있게 되어요. 즉, 데이터 분석가나 데이터 엔지니어의 애드혹 요청 처리 시간을 줄이고 전사 구성원들이 데이터를 직접 파악할 수 있게 되는 장점이 있습니다.
그러면 또 PA 도구와 시각화 도구(예를 들어 태블로)의 차이도 물어보곤 합니다. PA 도구는 데이터 로그 설계를 한 것만 볼 수 있습니다. 데이터 로그 설계를 하는 부분은 대부분 다른 SaaS거나 우리 제품의 유저 사용성 데이터에 대해 로그 설계를 진행합니다. 우리 웹이나 앱의 접근, 클릭 등이지요! 이 부분은 로그 설계 파트에 나와있어요.
다만 PA 도구를 도입해도 끝은 아닙니다. 그 이후에 어떤 일이 생기냐면..
1. PA 도구를 도입하고 교육 진행. 사람들이 점점 PA 도구를 활용하려고 함
2. PA 도구로 대시보드를 만들고, PA 도구 사용 가이드가 필요해짐
3. PA를 많이 사용하다가 특정 데이터를 확인할 수 없어서 다시 요청함
- 이 데이터는 DB의 데이터를 사용해야만 알 수 있는 데이터. 로그 설계시 어떻게 해서 데이터를 추가할 수도 있으나, DB의 데이터로 봐야할 경우가 있음
- 이런 경우 SQL이 필요해져서 요청하는 경우가 생김 => SQL을 학습해야 해결이 가능한 부분
4. 일단 아예 PA 도입 전보단 시간적 여유가 생겨서 이 부분을 자동화하며 데이터 마트를 만듬
5. 데이터 마트를 만든 후엔 SQL 조인을 조금 해도 괜찮으므로 SQL 교육을 하면서 사람들에게 지식 전파
6. DB 의 데이터는 BI 도구(Superset, Redash 등)에서 파악
이런 흐름이 되기도 합니다. 그래서 요새 PA 도구에는 DB의 데이터를 가지고 와서 처리하는 방법에 대해 고민하는 Reverse ETL이란 SaaS 제품도 나오고 있습니다(Amplitude는 알파 기능으로 있다고 하네요)
또는 데이터 엔지니어 조직이 커지면서 모든 데이터를 데이터 웨어하우스로 모읍니다. Amplitude에서 발생한 데이터를 Snowflake로 옮기는 행위라고 보시면 되어요. 그 후엔 아마 SQL로 데이터를 분석할거에요.
정리하면
- PA 도구나 SaaS 등은 시간 리소스를 잘 아낄 수 있도록 해주는 도구
- 시각화, 리텐션 분석을 쉽게 할 수 있음
- 현재 회사에서 데이터 분석을 어느정도 할지, 회사에서 데이터에 대해 생각하는 관점에 따라 다름
- C레벨이나 경영진의 의지가 중요하며, 데이터 문화를 조성하는 것도 같이 고려해야 함(문화 파트 영상도 보시면 좋을 것 같네요)
- 필수는 아니며, 큰 회사에선 이런 PA 도구를 자체적으로 만들기도 함. 회사의 규모가 작을 때 특히 임팩트를 가질 수 있고, 회사의 규모가 커지면서 DA, DE가 많아지면 점점 사용을 하지 않는 것도 방법입니다
도움이 될 자료가 있어 찾아봤는데 Mixpanel의 글도 있어서 공유드려요 :) 또 궁금하신 부분이나 이해가 되셔서 깨달음이 있다면 답변해주셔도 좋을 것 같아요!
그리고 데이터 로그 설계랑 데이터 문화 파트 영상을 먼저 학습하시면 도움이 될거에요. 강의를 보시면 PA 도구나 로그 설계에 대한 이야기를 하고 있답니다!