데이터 분석가의 일과 고민

데이터 분석가의 일과 고민

 #데이터분석가  #일과고민    

요즘은 어떤 일을 하든 데이터를 기반으로 가설을 세우고, 결정을 내리는 일이 많아졌어요. 각기 다른 채용공고를 봐도 데이터를 다룰 줄 아는 능력은 공통으로 등장하죠.  

늘 데이터와 함께 일하는 데이터 분석가는 어떤 사람일까요? 데이터 분석가의 이상과 현실 사이에서 균형을 잡아가는 데이터 분석가, 박범진 님을 만나봤습니다. 데이터 분석가의 일과 고민이 궁금하다면 아래 인터뷰를 놓치지 마세요.  

간단한 소개를 부탁드려요.

안녕하십니까. 박범진입니다. 수치모델러로 일을 시작했고 딥러닝쪽에도 잠깐 발을 담갔다가 현재는 서비스 회사의 데이터 분석가로 재직하고 있어요. 인프런에 강의도 올리고, 발표도 하고, 블로그도 쓰고 그렇게 살고 있습니다. 

데이터 분석가로 어떤 일들을 하셨는지 궁금해요. 

일단 제 의견을 일반화할 수 없다는 걸 먼저 말씀드려야 할 것 같고요. 제가 다니는 회사는 서비스 회사이기 때문에 다양한 직군이 있잖아요. CX, PM이나 마케터 등 다양한 직군에게 필요한 게 데이터거든요. 

서비스와 연결된 데이터가 변화하는지를 파악하기 위해 파이썬이나 SQL을 이용한 데이터 추출은 물론 팀원들이 좀 더 편하게 볼 수 있는 대시보드 제작, 데이터가 흐르는 문화를 만들기 위한 SQL과 대시보드 제작 교육도 병행하고요. 데이터 적재, 그에 관한 파이프라인, 데이터 분석 등등 데이터에 관한 전반적인 일을 담당하고 있습니다.

데이터 관련 직무들을 간략히 비교해주실 수 있을까요?

저희 회사에서는 데이터 분석가는 뭘 해야 한다, 데이터 과학자는 뭘 해야 한다는 식으로 데이터 관련 직무가 할 일을 굳이 나누지는 않아요. 회사마다, 채용 공고마다 차이는 있지만 ‘넌 꼭 이거만 해야 해.’ 하고 나누기는 좀 애매할 것 같아요.

제가 이 질문을 받았을 때 떠오른 건 커뮤니케이션 양이었어요. 저의 경우에는 CX나 운영팀 등등 여러 직군의 분들을 만나거든요. 정말 웬만한 인사팀보다 더 많은 사람들을 만나요. 그런데 데이터 과학자는 그런 외부 팀원들을 조금 덜 만난다는 정도? 사용하는 기술에서도 차이점이 있겠지만, 굳이 나누라고 하면 커뮤니케이션 접점의 양이라고 생각하고 있습니다. 일반적인 답변이랑은 좀 다르죠? ㅎㅎ

왜 데이터 분석가의 커뮤니케이션 양이 많을까요?

다른 회사는 다를 수도 있겠지만, 일단 저는 서비스 회사에서 딥러닝을 활용할 수 있는 분야는 추천시스템이 대부분이라고 생각하거든요. 추천시스템 같은 경우에는 시스템을 개발하기 위해서 논문이나 다른 분들의 블로그 등을 것을 봐야 해요. 갑자기 사업부에 가서 ‘추천시스템 어떻게 만들까요?’ 하고 질문할 수야 있겠지만, 논문을 바라보고 리서치하는 시간에 비해서는 적다고 생각해요. 그렇기 때문에 데이터 분석가가 커뮤니케이션 양이 많다고 생각하는 거죠. 저는.

데이터 분석가는 일단 만나지 않으면 숫자밖에 못 보거든요. 근데 이 숫자가 원래 그분들이 알고 있는 숫자일 수도 있고요. 저는 중요하게 봤지만 그분들에게는 중요하지 않은 숫자일 수도 있거든요. 도메인 지식은 담당자분들이 더 많이 알고 있고, 숫자로만 판단할 수 없으니까 커뮤니케이션이 필요한 거죠.

지금은 집중하고 있는 일은 무엇인가요? 

지금 회사에서 분석가가 저밖에 없거든요. 다른 데이터 과학자 분들이 계시지만, 아무래도 커뮤니케이션은 제가 제일 많이 해요.

그래서 데이터 추출에 상당한 시간을 쏟고 있고요. 제 개인 역량을 어떻게 늘릴 것인가에 대한 고민도 하고 있어요. 그동안 서비스에 누적된 과거 데이터가 있잖아요. 제가 입사하기 전에 다른 분들이 만들어둔 데이터를 누군가가 계속 보고 있단 말이에요. 그럼 이 데이터를 과연 우리가 잘 보고 있는지, 제대로 잘 적재되어 있는지 판단이나 분석을 하려고 하는데요. 이 부분도 현재의 고민입니다.

왜 데이터 분석 업무를 선택하셨나요? 

선택이었다기보다는, 제가 막 입사했을 때 회사가 돌아가는 걸 보는데 일단 데이터 과학자에 대한 니즈보다는 궂은 일이 조금 더 필요해 보였어요. ‘이 서비스의 데이터는 어떤 게 있나’? 그걸 하기 위해서 일단 데이터 추출부터 시작해야 한다고 생각했어요. 저도, 회사에서도 그런 일을 하는 사람이 필요했기 때문에 데이터 분석 업무를 맡게 되었습니다.

데이터 분석가의 현실을 말해주세요. 일해보니 어떤가요?

데이터 분석가라는 게 남들이 보면 좀 있어 보이는 그런 이름이잖아요. 많은 분들이 데이터 분석가가 되기 위해서 여러 가지 노력을 하고 있을 것 같아요. 공모전도 나가고, 머신러닝도 배우고. 그런데 실제로 스타트업에서는 기본적인 데이터 전처리나 사업부에 필요한 데이터를 공급하는 게 더 중요하거든요. 궂은 일이 많이 필요한 업무예요. 이런 일들이 마냥 멋있다고 할 수는 없어요. 

하지만 이 일을 통해 회사가 바뀌고 매출이 오르면 ‘내가 했던 일이 헛된 건 아니었구나’라는 걸 또 느낄 수 있어요. 그런 점에 있어서는 데이터 분석가를 꿈꾸는 분들에게는 이 일이 나쁘지만은 않다는 말씀을 드리고 싶어요.

이상과 현실 사이의 괴리가 있나요?

항상 있죠. 아시겠지만 계속 이런 반복적인 일이라던지 궂은 일을 하는 게 결국에는 성장이랑 또 연결이 되거든요. 저도 ‘이런 일만 하면 내가 성장할 수 있을까?’ 하는 점에서 괴리감을 느끼기에 그 와중에도 몸부림을 치고 있어요.

데이터 분석 업무의 매력은 무엇인가요?

매력이라고 하면 또 반대로 말씀을 드릴 수 있을 것 같아요. 예를 들면 마케터는 CTR, CPM 같은 용어를 많이 쓰잖아요. 그분들과 대화하려면 그분들의 배경지식을 가져와야 해요. 그리고 어떤 개발자 분들은 쿼리를 통째로 주시기도 하고요. 그럼 ‘어? 이분들은 쿼리를 또 이렇게 쓰시네?’ 하면서 저는 그걸 또 빨아들일 수 있어요. 커뮤니케이션이 싫으신 분들한테는 이게 독이 되거든요. 근데 반대로 생각하면 커뮤니케이션을 많이 하기 때문에 배울 수 있는 점들도 많다고 생각합니다. 

기업 데이터 분석가 채용 공고를 보시면 대부분 자격요건에 커뮤니케이션이라고 한 줄 꼭 써놓았을 거예요. 그게 아마 이런 이유 때문에 써놓지 않았을까 싶습니다.

기억에 남는 데이터 분석 사례는 무엇인가요?

회사에 그로스TF라는 조직이 새로 생겼는데, 말 그대로 실험을 하기 위한 조직이거든요. 그로스TF를 통해 기존 데이터를 다른 모습으로 보기도 하고 다른 인사이트를 얻기도 하는 분석 경험을 했어요. 일을 2배로 하긴 했는데 그만큼 재밌었어요. 인프런에서도 AB테스트를 하고 있잖아요. 결국 서비스가 성장하기 위해서는 시도를 많이 해봐야 되거든요. 지금은 TF가 사라져서 많이 아쉬워요.

현업에서 성장하기 위해 어떤 노력들을 하시는지 궁금해요. 

사내에 제가 따라갈 사수라는 개념이 없어서 개인적으로 성장하기 위해 많이 고민했어요. 회사 안에 없으면 다른 쪽으로 봐야 하잖아요. 다른 회사에 계신, 잘하시는 분들은 회사에서 뭘 하고 있나? 하고요.

그분들이 뭘 하는지 알고 나면, 제 실력을 키워야 따라갈 수 있잖아요. 그러기 위해서 제가 했던 일을 기록하고 다음에 사용하기 위해서 블로그를 쓰고 있고요. 다른 분들의 블로그나 유튜브, 강의를 보면서 배우기도 하고요. 

다른 방안으로는 강의를 만들어요. 블로그에는 짤막하게 필요한 코드를 넣고요. 강의는 기승전결이 필요하잖아요. 강의를 만들려면 거기에 맞춰서 공부를 해야 하거든요. 그래서 강의를 찍으면서 개인적인 역량을 키우고 있습니다.

데이터 분석 잘 한다는 말을 들으려면 어떻게 해야 할까요? 

저도 데이터 분석을 잘 하고 싶거든요. 그래서 이 질문에 대한 대답을 하기가 어려울 것 같아요.

우선 파이썬이든, 매트랩이든, R이든, SQL이든 내가 원하는 데이터를 원하는 형태로 가공하는 능력은 기본으로 갖춰야 하고요. 데이터 분석에는 과정이 있잖아요. 처음에 가장 중요한 것이 문제 설정이거든요. 일단 왜 하는지가 맞아 떨어져야 해요. 설명할 때도 이 분석을 ‘왜’ 하는지가 상대방에게 전달되기 때문에 ‘왜?’ 라는 질문이 가장 필요한 것 같아요. 그리고 계속 강조했던 커뮤니케이션, 이 두 가지가 가장 필요한 자질이라는 생각이 들어요.  

📣 파이썬과 매트랩의 차이점 

말그대로 언어의 차이점이거든요. '파이썬이 좋냐, R이 좋냐'를 누가 구분할 수도 없는 거고. 문법이 다를 뿐이고 그에 대한 결과는 같잖아요. 파이썬에서 1+1을 하나, R에서 1+1을 하나, 매트랩에서 1+1을 하나 같은 값이거든요. 

다른 외적인 부분에서는 매트랩은 유료고 파이썬은 오픈 소스(무료)라 예를 들어서 어떤 패키지가 망가졌다고 하면 매트랩같은 경우는 담당 엔지니어가 있기 때문에 다음 버전에서는 업데이트가 딱 되거든요. 근데 파이썬의 경우에는 오픈소스니까 만든 사람의 의지가 없으면 그건 그냥 에러인 채로 살아야 돼요. 그런 점에서 차이가 있고, 대신 매트랩은 좀 많이 비싸기 때문에 저는 현재 사용하고 있진 않습니다. 

데이터 분석 자격증, 따야 할까요? 실제 업무에 도움이 되나요? 

저도 하나 있긴 있어요. ADsP 데이터 분석 준전문가 자격증이요. 제 경우에도 취직을 목표로 자격증을 땄어요. 그런데 실무로 적용하려니까 기억이 안 나요. 말 그대로 데이터 자격증을 따기 위해 답만 외웠거든요. 이렇게 하면 솔직히 자격증을 따는 의미가 없다고 생각해요. 만약 똑같은 실력인데 누군가는 데이터 자격증이 있고, 누군가는 데이터 자격증이 없으면 데이터 자격증이 있는 게 1점이라도 더 얻겠죠? 왜냐하면 똑같은 실력이기 때문에.

데이터 분석은 이런 것이구나, 공부하면서 자격증을 딴다면 괜찮은데요. 자격증 따기 위해 그냥 답을 외운다는 건 잘못된 것 같고요. 공부의 결과물, 산출물이 데이터 자격증이라고 생각하면 좋지 않을까요. 시험 100점 맞는 게 중요한 게 아니라 과정이 더 중요한 것 같아요.

데이터 분석가를 꿈꾸는 취준생에게 하고 싶은 말이 있다면?

취준생분들에게 솔직히 일단 힘내라는 말밖에 해드릴 수 있는게 없어요. 너무나 힘든 시기이고 취업도 쉬운 상황이 아니니까요. 먼저 데이터 분석 업무는 많은 분들과 커뮤니케이션을 할 수 있고, 그분들이 알고 있는 것을 제가 배울 수 있어요. 분석을 통해서 회사가 결정 방향을 수정한다던지 움직이는 것을 보는 것이 매력이라고 생각해요. 단점을 말씀드리면 쉬운 일이 아니고, 데이터 분석가를 희망하는 분들이 꿈꾸는 이상과 현실은 다르기 때문에 이 부분은 감안을 해주시면 좋을 것 같아요.

데이터 분석을 하는 이유는 서비스를 잘 되게 하기 위해서이기 때문에 도메인 지식, 비즈니스에 대한 이해, 우리 서비스의 지향점 등을 인지하는 게 가장 중요한 거 같아요.

제가 볼 때 저희 회사에서는 커뮤니케이션을 우선순위로 두고요. 커뮤니케이션이 안 되면 웬만한 A급이 와도 입사가 어려울 수 있다고 알고 있어요. 슈퍼스타보다는 멀티플레이어가 낫다라는 말도 하고요.  

커리어를 돌아보았을 때, 변곡점이 되는 지점은 어디였나요? 

일단 저는 해양과학과 출신으로 석사를 나왔고 수치모델링을 전공으로 했어요. 그런데 백수가 되었고, 그리고 나서 IT로 돌아섰잖아요. 그 변곡점이 된게 생활코딩을 운영하시는 이고잉님이라는 분이 계세요. 어느날 제가 페이스북에서 백수로 도서관에 앉아있는데 페이스북을 하다가 이고잉님의 추천 영상이 딱 뜨는 거예요. 이고잉님이 코딩야학을 모집하신다고요. 그때 ‘어, 나도 코딩을 다시 해볼까?’ 하고 생각이 든 거예요. 

그래서 어떻게 코딩야학에 지원했고, 프로그램을 따라갔어요. 물론 그분은 그 당시에 웹 기초로 HTML, CSS를 가르쳤고, 저는 원래 데이터를 하던 사람이었기 때문에 지금은 데이터로 오게 되었지만 만약 그날 페이스북을 보지 않아서 그 영상을 못 보고, 코딩야학에 신청을 하지 않았더라면 지금의 저는 없었을 수도 있어요. 그렇지만 그날 IT라는 게 있고, 그런 무료강의가 있고, 그런 세상을 처음 봤기 때문에 저에게는 그게 변곡점이라고 할 수 있고요. 여러 가지가 있겠지만 IT로 접어선 첫 번째 이유는 이고잉님의 생활코딩이 처음이었습니다.


이전엔 IT 분야에 관심이 없었나요? 

솔직히 전혀 없었죠. 전혀. IT 업계는 뭔가 천재만 있는 것 같고, 왠지 내가 가면 안되는 곳인 것 같고. 그렇기 때문에 기존에는 전혀 생각을 하지 않았습니다. 그 영상을 보기 전까지는.

데이터 분석가 포트폴리오는 어떻게 준비해야 할까요?

저는 일단 비전공자로 분류가 됐었거든요. 왜냐하면 해양과학이라고 하면 코딩을 했다고 해도 안 믿어줘요. 전공이 생소하기 때문에 비전공자로 분류되었어요. 그래서 생각했던 게 그러면 제가 가지고 있는 능력, 그러니까 데이터 분석, 코딩, 커뮤니케이션 같은 것들을 보여줄 수 있는 장치가 있었으면 좋겠다고 생각했고 그래서 시작한 게 강의예요.

강의를 맨 처음에 유튜브에 올렸었어요. 제가 대학교에서도 후배들 상대로 강의를 했었는데 그걸 잊지 못해서 강의를 만들었거든요. 그런데 이게 어떻게 생각하면 남들이 가지고 있지 않은 제 능력이잖아요. 경험이고. 대학교에서 후배들을 상대로 수십 명을 앉혀두고 강의를 하신 분들이 그렇게 많진 않으니까요. 그런 경험을 유튜브에 올리거나 좀 더 발전시켜 인프런에 올리면 내 능력을 조금 더 보여줄 수 있겠다고 생각했어요. 

이런 식으로 다른 사람이 갖고 있지 않은 나의 능력을 보여주는 것도 방법이라고 생각해요. 외부 컨퍼런스에서도 발표를 했는데요. 남들이 하지 못한 경험이잖아요. 저보다 분석을 잘하시는 분들이 많을 수도 있어요. 당연히 많을 거고요. 그런데 발표를 많이 하고, 다른 분들과 커뮤니케이션을 많이 한 분은 그렇게 많지 않을 거 같아요. 이 부분에서는 제가 유리하다고 말씀드릴 수가 있는 거죠.


컨퍼런스에서는 어떤 주제로 발표하셨나요? 

데이터야놀자에서는 데이터 분석가가 데이터 추출을 왜 해야 하는지에 대해서랑, 말 그대로 데이터 분석가의 힘든 점을 15분 발표에 녹여서 진행했었고요. 그때 댓글창이 좀 폭발했었죠. 반응이 좀 많이 좋았어요. 현업에서 뛰는 분들에게 공감이 된 거죠. 

데이터 분석가가 남들이 보기엔 멋있어 보이는데 실제로는 뒤에서 이런 일들을 하고 있고, 뭐 이런 부분에 대해서는 발표를 잘 안 하셨는데요. 제가 그 부분을 언급하니까 많이 공감해주셨어요. ㅎㅎ

앞으로의 계획은 어떠신지 궁금해요. 

일단 업에 대한 것만 말씀을 드리면, 저는 수치모델러에서 딥러닝도 살짝 해보고 현재는 데이터분석가로 일하고 있잖아요. 직무는 조금씩 다르지만 교집합은 데이터에 있거든요. 데이터가 있어야 수치모델링을 할 수가 있고 딥러닝, 분석도 할 수 있어요.

그래서 데이터라는 교집합은 항상 제가 들고 있을 거예요. 앞으로 모습이 계속 바뀌더라도 데이터는 계속 가지고 있겠다는 게 제 계획이에요.

저는 백수 시절이 있었거든요. 예전에 백수 생활을 한 1년 3개월 동안 했어요. 그 전에는 나름대로 자부심이 있었어요. 석사니까.ㅎㅎ 그래서 백수생활이 그렇게 길 줄 몰랐어요. ‘넣으면 서류는 되겠지.’ 생각했는데 해보니까 아무것도 아니더라구요. 무조건 서류 탈락인 거예요. 단순히 그래도 석사는 졸업했으니까 날 뽑아주겠지, 했는데 그것만 믿고 실력은 남들에게 보여줄 준비가 되지 않았던 거예요. 

대기업 직장인들도 그런 말 많이 하잖아요. “내가 입고 있던 건 내 스스로의 힘이 아니라 삼성 명함의 힘이었다”고. 저도 마찬가지라고 생각해요. 지금은 회사의 옷을 입고 있다고 생각하거든요. 그런데 제가 백수가 됐을 때, 혹은 유명하지 않은 회사에 갔을 때도 사람들이 나를 알아줄까? 찾아줄까? 라는 생각을 해요. 회사의 옷이 아닌 제 스스로의 것을 가지고 살아가고 싶어요. 그래서 발표나 강의 활동을 계속 하고 있어요.

 

   

박범진 님의 발자취가 궁금하다면,

- 박범진 님의 데이터 분석 강의들 
- 데이터 분석가 박범진 님의 영상 인터뷰


이번 [주간 인프런] 어떠셨나요?
솔직한 의견을 들려주세요!

유익해요 | 아쉬워요

지난 [주간 인프런] 이 궁금하다면? (클릭)

댓글 0

댓글을 작성해보세요.

채널톡 아이콘