
실습 중심으로 알차게 배우는
빅데이터 파이프라인 마스터!
special thanks to my lovely students 👨🏻🎓
* appreciate it, believe you'll do well anywhere 👩🏻🎓

데이터 처리 이론 및 실습
빅데이터 파이프라인의 핵심!
안녕하세요, J.PHIL 입니다 🙇🏻
좋은 기회를 맞이하여 인프런에서 첫 강의로 빅데이터 시스템 구축 및 분석에 관심있는 입문자를 위해 ‘데이터 처리 이론 및 실습’ 강의를 진행하게 되었습니다.
한눈에 보는 핵심 키워드
Mastering Big Data Processing: Tools and Techniques for Success
Distributed System
Apache Spark
HDFS
Elasticsearch
Logstash
Kibana
Crawler
Scraping
Selenium
AWS S3
Node.js
Docker
우리는 왜 이 강의를
들어야 할까요? 📚
최근 약 10년 동안의 급진적인 기술 발전으로 인해 다양한 플랫폼과 서비스가 생겨나고, 다양한 고객들이 그 위에서 질 높은 삶을 영위하고 있습니다. 이에 우후죽순으로 발생하는 데이터 가운데 많은 기업들이 그 중에서 가치 있는 데이터를 발굴하고 추출하여 BM(Business Model)을 설계함으로써 좀 더 우리에게 가치있는 삶을 제공하고 있습니다.
이런 환경에서 저희 엔지니어들👷🏻이 “감히 미래를 예측하고 대응한다면” What and How 준비해야 할까요? 바로 데이터를 관리하고 다루는 능력을 길러야 합니다. 역으로 여러분이 데이터를 잘 다루게 되고 더불어 잘 표현까지 할 수 있다면, 산업에 어떤 점들을 기여할 수 있을까요?
Data-driven decision-making
💡 빅데이터 분석을 통해 조직은 데이터 중심 의사 결정을 내릴 수 있으며, 이를 통해 비즈니스 결과를 개선할 수 있습니다.
Increased efficiency and productivity
💡 빅데이터 분석을 통해 조직은 운영을 간소화하고, 비용을 절감하며, 생산성을 높일 수 있습니다.
Innovation
💡 빅데이터 분석은 기업이 새로운 제품과 서비스를 개발하고, 기존 제품과 서비스를 개선하고, 새로운 비즈니스 모델을 만들 수 있도록 함으로써 혁신을 촉진할 수 있습니다.
그래서 이 강의는 어떻게
구성되어 있나요? 📑
📝
Data Top-Tier Conference 논문을 땀흘려 쓴 경험
👨🏻💼
현업에서 얻은 값진 빅데이터 시스템 구축 및 분석 경험
🧑🏻🏫
오랫동안 대학교에서 좋은 제자들을 양성한 경험
이처럼 값진 경험을 바탕으로, “이 분야에 관심있는 어느 누구에게나” 좋은 출발점이 될 수 있도록 빅데이터 프로세스의 4가지 단계에 대해 14주차 이상의 폭넓으면서도 알찬 과정으로 강의를 구성하였습니다 📚

여러분들은 위에 소개된 기술들을 이용하여 데이터 수집 ▶ 데이터 저장 ▶ 데이터 분석 ▶ 표현에 대하여 이론 30% 및 실습 70%의 코드랩 형식으로 학습합니다. 약 6년 동안 훌륭한 제자들의 소중한 피드백들 💌 회고하고 반영해, 최대한 쉽고 질 좋은 컨텐츠로 강의를 구성한 만큼 입문자 분들에게 반드시 큰 도움이 되실 겁니다.
아! 참고로 강의 자료는 추후 다양한 Reference를 찾거나 이 기회를 통해 Research 분야나 더 좋은 기업으로 가실때 도움을 드리기 위해 최대한 영문으로 작성했습니다 🧗🏻♀️
저희는 무엇을 배우나요? 🧑🏻🏫
위 Big Data Processing 4 Steps을 기반으로, 아래와 같이 커리큘럼을 구성하였습니다. (1주차 무료영상 참고)

빅데이터 파이프라인에 관심 있는
누구나 수강하실 수 있습니다 🧑🏻🎓
Python 및 Linux 명령어, 데이터베이스에 대한 기초 지식만 알고 있다면 누구나 수강할 수 있습니다.

[프로모션] 학생, 취준생분들께 강의 금액을 지원해드립니다 💪
수입이 없는 학생분 또는 취준생분에게 약 20% 할인을 제공합니다. 아래 링크로 신청해주시고 원활한 comm. 위해, 꼭 수강전 문의 탭에 " ${자기소개} 학생/취준생 [프로모션] 신청했습니다" 와 같이 로그 남겨주세요 :)
신청 링크 / 수강전 문의
[프로모션] +200 수강생 기념, 기간 연장 프로모션💪
+100명 프로모션 혜택을 받은 수강생분을 제외한, 신규 수강생분들에게 강의 3개월 무료 연장 프로모션을 진행합니다. 아래 링크를 통해 신청해주세요 :)
신청 링크
실습 환경은 어떻게 되나요? 💻
아래와 같이 부담없는 환경을 준비하셔도 충분히 수업을 따라오실 수 있습니다.
(실제 Cluster 구성은 현재 제작 중인 [초보] 이론 강의에서 진행할 예정입니다 🙏🏻)
- OS: Ubuntu or Linux
- Machine 사양
- Aws t2.medium 2 Core 4GB // ec2 free.tier 참석은 가능
- Virtualbox 이용하여 위 OS로 참석 가능
[입문자 DOCKER 강의] 프로모션 이벤트 😄
Docker 대하여 자세히 공부하고 싶은 분들은 [입문자를 위한 Docker 및 Dockerizing 마스터하기] 적극 추천합니다. [빅데이터 파이프라인 마스터] 수강하신 분들에게 프로모션* 적용해드립니다.
[빅데이터 클러스터 구축패키지] 런칭 프로모션 이벤트 🎓
탄탄한 코드랩으로 고가용성이 보장되는 빅데이터 클러스터 직접 구축하고 싶은 분에게 추천합니다. 옆 강의링크를 클릭후 [수강전 문의] 란에 "아이디 / 이메일 / 프로모션 신청합니다" 라고 남겨주세요.
이 강의를 만든 사람
J.PHIL을 소개합니다 ✒️

