코딩 열풍은 식을 줄을 모르는데, 무엇부터 해야 할지 모르겠다면!
<주간 인프런> 방학맞이 코딩 길라잡이 - 프로그래밍 초보가 듣기 좋은 언어 특집은
6월 셋째 주부터 6월 마지막 주까지 3주에 걸쳐 연재됩니다.
지난 주 <주간 인프런> 보러 가기 🏃🏃 <<
대학교 학과별 프로그래밍 언어 추천! 물론 전공이 달라도, 대학생이 아니어도 환영해요 🤟
방학맞이 코딩 길라잡이 (2)
공대 편(6월 셋째 주) → 상경대 편(6월 넷째 주) → 예대 편(연재 예정)
R
Python
SQL
VBA
•••
“발표, 연구, 통계, 학점, 자격증, 스펙… 누가 우릴 ‘문송하다’ 하나요?
좁아진 취업문, 고민 많은 나는 상경대생(Business & Commerce and Management) ”
지난 몇 년 사이 ‘빅데이터’는 단연 핫한 키워드였죠. 분야를 막론하고 데이터 분석이 중요해졌고, 데이터의 양도 어마어마하게 많아지면서 프로그래밍을 활용한 데이터 사이언스 분야가 각광받고 있어요. 기획자, 마케터, 데이터 분석가 등으로 진출하는 상경계열 전공 학생들에게도 데이터 분석 역량이 그만큼 중요해졌죠. 데이터 프로그래밍은 이제 더이상 나와 상관없는 분야가 아니랍니다. 이번 <주간 인프런> 방학맞이 코딩 길라잡이 2편에서는 졸업 전에 배워두면 유용하게 쓸 수 있는 데이터 관련 프로그래밍 언어를 소개할게요.
* 저번 ‘공대’ 편과 마찬가지로, 이 글은 ‘상경대’ 내지 ‘상경대생’을 포괄적인 표현으로 사용하고 있어요. 물론, 실제로는 대학마다 학과 및 단과대 명명 및 편제 방식이 다릅니다. (경제/통계학을 이공계로 분류하는 경우도 많고, 최근 들어서는 경영학과를 독립 단과대/학부로 분리시키는 대학도 늘고 있죠.) 유념해서 읽어주세요! 👩🎓
R 대 Python, 어떻게 다를까요?
R과 파이썬(Python)은 데이터 분석에 쓰이는 대표적인 프로그래밍 언어입니다. 활용 분야가 겹치다보니 이 둘을 비교하는 걸 왕왕 볼 수 있는데요. R과 파이썬은 무엇이 다르고 각각 어떤 장단점이 있는지, 어떤 언어를 선택하는 게 좋을지 살펴볼까요? (물론, 양쪽을 모두 적절하게 활용하는 것도 좋겠죠!)
• R은
1993년 처음 공개된 R은 데이터 분석과 통계 처리를 위해 만들어진 프로그래밍 언어입니다. 통계학자들이 통계 분석을 위해 고안한 만큼 데이터 분석에 특화된 언어죠. (데이터분석계의 터줏대감!)
• 파이썬은
간결한 문법과 높은 코드 가독성, 뛰어난 생산성, 다양한 활용도로 인기가 높은 프로그래밍 언어입니다. 판다스(Pandas)나 넘파이(Numpy) 등의 라이브러리를 통해 데이터 분석 작업에도 활용할 수 있어, 데이터 사이언스 분야에서 영향력이 부쩍 커졌어요.
강력한 데이터 시각화 작업이 필요하다면? R 승!
날것 그대로의 데이터로는 인사이트를 얻기 힘든 만큼 데이터를 도표나 그래프로 변환하는 작업이 필요하죠. 파이썬으로도 데이터 시각화를 할 수 있지만, R은 태생부터 통계 목적으로 만든 언어입니다. 그만큼 통계와 데이터 시각화에 한해서는 파이썬이 R을 완전히 뛰어넘기는 어려워요. ggplot2을 필두로 하는 수많은 시각화 패키지를 사용하면 R을 강력한 데이터 시각화 툴로 변신시킬 수 있답니다.
다양한 프로젝트, 더 넓은 가능성을 열어두고 싶다면? 파이썬 승!
파이썬은 개발용으로 만들어진 언어이면서도 ‘다용도 언어’로 불릴 만큼 쓰임새가 넓습니다. 웹 개발, 머신러닝, 시스템 유틸리티 프로그래밍, 사물인터넷(IoT) 등 다양한 분야에 파이썬이 활용되죠. 때문에 웹에 데이터 분석 작업을 연동하는 등 데이터를 개발이 필요한 프로젝트에 활용하고 싶다면 파이썬으로 영역을 넓힐 수 있어요.
💡 더 살펴볼까요?
• 프로그래밍을 해본 적이 있다면? 파이썬 (이전에 다른 프로그래밍 언어를 배워본 적이 있다면, 일반적인 프로그래밍 언어인 파이썬 문법을 이해하기 쉬워요.)
• 통계를 위해 빠르게 익히고 싶다면? R (프로그래밍 경험이 없지만 통계 경험이 있는 사람이라면 파이썬보다는 R을 좀더 빠르게 배울 수 있고, 패키지 적용도 비교적 쉽습니다.)
• 데이터 전처리(Pre-processing)를 쉽게 하고 싶다면? 파이썬 (데이터 전처리를 해야 한다면 R보다는 파이썬 판다스(pandas)를 활용하는 게 더 간편해요.)
• 풍부한 통계 관련 패키지와, 통계적 정확성이 필요하다면? R (뭐니뭐니해도 통계 분석 생태계에서 R이 쌓아온 영향력은 막대하니까요.)
데이터, 직접 추출하세요! SQL 정복하기
데이터 분석은 알겠는데, 필요한 데이터를 뽑아내려면 어떻게 해야 할까요? SQL(Structured Query Language)은 데이터를 관리하기 위한 프로그래밍 언어입니다. R이나 파이썬을 통해 데이터를 분석하고 시각화한다면, SQL은 방대한 양의 데이터베이스에서 분석할 데이터를 추출하는 역할을 하죠.
마케터나 기획자가 반드시 SQL을 배워야 하는 건 아니예요. 하지만 회사에서 일하면서 매번 개발자나 엔지니어에게 필요한 데이터를 부탁해야 한다면 어떨까요? 내가 직접 데이터에 접근해 필요한 데이터만 찾아올 수는 없을까요? 직무 구분이 모호하고, 빠른 의사결정을 위해 일인 다역을 맡아야 하는 업무 환경(예컨대 스타트업) 에서는 SQL이 강력한 무기가 됩니다. 커뮤니케이션에 드는 시간과 인력을 아낀 만큼 데이터를 직접 확인해보면서 여러 가지 가설을 빠르게 검증해볼 수 있고, 데이터 관점에서 서비스를 바라볼 수 있죠. 덕분에 최근 들어 기획자나 마케터의 채용 우대 사항으로 SQL 활용 능력을 꼽는 기업들이 부쩍 늘고 있어요.
엑셀로 코딩하세요! 엑잘알이 되는 VBA
채용 시장에서 엑셀은 필수나 다름없죠. 컴퓨터활용능력이나 MOS처럼 엑셀 역량을 증명하기 위한 자격증을 취득한 사람도 흔해요. 그런데 엑셀을 정말 ‘잘’ 하는 사람은 직장에도 그다지 많지 않다는 사실, 알고 계신가요? 엑셀만 잘 해도 일 잘 한다는 소리를 들을 수 있어요!
VBA(Visual Basic for Application)는 마이크로소프트 오피스 툴에 내장된 프로그래밍 언어입니다. 엑셀을 오랫동안 쓴 분도 VBA의 존재를 모르는 경우가 간혹 있죠. VBA를 쓰면 엑셀 함수 수식만으로는 불가능한 복잡한 계산을 처리하고, 매크로 코드를 편집해 반복되는 업무를 자동화할 수 있어요. 대량의 데이터를 무한 ‘복붙’을 통해 일일이 수정할 필요가 없죠. 우리에게 친숙한 엑셀을 가지고 코딩을 할 수 있다니, 어쩌면 VBA는 가장 쉽게 접할 수 있는 프로그래밍 언어인지도 모르겠네요.
데이터를 공부하기 시작한 여러분께 💌
아무리 데이터를 피할 수 없다곤 해도, 비전공자로서 프로그래밍을 시작하기란 쉽지 않을 수 있어요. 어렵고 따분하게 느껴질 수도 있고, 프로그래밍을 전공한 사람만큼 잘 하지 못하는 것 같아 조급해질 수도 있겠죠.
다만 하나 기억하면 좋을 것 같아요. 데이터를 만지는 능력만큼이나 중요한 건 데이터 안에서 인사이트를 찾아내는 능력이라고요. 두 길 사이에서 균형을 잃지 않고 데이터를 적절하게 활용할 수 있다면, 누구에게도 뒤지지 않는 인재로 성장할 수 있지 않을까요? 당장은 데이터가 낯설고 막연하게 느껴지더라도, 동기를 가지고 공부하다 보면 분명 훌쩍 성장해 있을 거라 믿어요.
댓글 0
댓글을 작성해보세요.