데이터 사이언스

데이터 엔지니어링

빅데이터 클러스터 구축 패키지; 성공을 향한 로드맵

Name: 빅데이터 클러스터 구축 패키지; 성공을 향한 로드맵
Price: 99000 KRW

High Availability가 보장되는 빅데이터 시스템 또는 분산처리 시스템 클러스터 (HDFS, Zookeeper, Spark, Zeppelin) 를 직접 구축해보는 코드랩 위주의 수업입니다.

(4.7) 수강평 18개

수강생 102명

J.PHIL

빅데이터 Apache Spark Hadoop 데이터 엔지니어링 cluster

초급자를 위해 준비한
[데이터 엔지니어링] 강의입니다.

이런 걸 배울 수 있어요

Big Data Cluster Setup
Distributed File OR Processing System
High Availability
Hadoop
HDFS
Apache Spark
Apache Zeppelin
Apache Zookeeper
AWS (EC2, AMI, Security Group)

안녕하세요 J.PHIL 입니다 🍏

한 학기가 흐르고 좋은 기회를 맞이하여, 이번 시즌에는 빅데이터 분산 클러스터를 직접 여러분이 구축해보는 '빅데이터 클러스터 구축 패키지' 강의를 진행하려고 합니다 📚

여러분들의 성원에 힘입어, 지난 '빅데이터 파이프라인 마스터' 수업의 영감을 바탕으로 '다소 챌린지할 수 있으나 다른 방향으로 유의미한 강의가 있지 않을까?' 고민끝에 한 땀 한 땀 정성들여 해당 강의를 제작하였습니다.

Keyword: Big Data Cluster, Distributed System, High Availability, Hadoop, HDFS, Apache Spark, Zookeeper, Zeppelin, AWS EC2 & AMI

우리는 왜 강의를 들어야 할까요 🙇🏻

약 10년이 넘는 시간동안 급진적인 기술 발전으로 다양한 플랫폼 및 서비스가 우후죽순으로 생겨나고, 이를 통해 생활에서 파생되는 무수한 데이터들이 활용 및 분석되면서 저희는 질 높은 삶을 영위하고 있습니다.

아래 figure1. 처럼 국내 거대 대기업들 뿐만이 아니라 세계 거인 기업들은 Big Data Storage 및 Big Data Processing 에 대한 중요성은 공공연하게 강조하며, 많은 엔지니어들에게 이와 비슷한 분석 및 구축 스킬셋을 요구하고 있습니다.

하지만 저희가 실제 해당 INDUSTRY에 진입하기전까지는 사전에 BIG DATA CLUSTER 를 직접 구축해보거나 다룰 수 있는 경험을 얻기는 쉽지 않습니다. 그래서 막상 유의미한 가치를 얻을 수 있는 기회가 왔을때, 이에 대한 경험 부족으로 아쉬운 결과를 맞이할 수도 있습니다.

저 또한 연구원 시절 'DATA TOPTIER CONFERENCE' 논문을 쓸때 50대 빅데이터 클러스트를 직접 구축을 했어야 했었고, 멤버들에게 솔선수범해야하는 부담감과 과금에 대한 큰 스트레스를 견디며 보름동안 밤낮을 지새우며 오로지 클러스터를 구축에 전념했었습니다.

물론 그 때의 소중한 경험으로 많이 배우고 앞으로 나아가는데 좋은 자양분이 되었지만, 저는 여러분이 이렇게 시간을 다소 비효율적으로 쓰길 원치 않습니다. 즉, 여러분의 값진 약 200시간을 클러스터를 구축하는데만 쓰지 않고, 효율적으로 클러스터 위에 실험이나 고객 데이터 분석을 하는데 전념하길 기대하며 해당 강의를 제작하였습니다 📝

무엇보다도 여러분이 현재 강의를 듣고 클러스터 구축 경험을 쌓으신 후, 저처럼 직접 현업이나 대학원에서 빅데이터 클러스터를 구축시 큰 도움이 되길 바라며, 해당 강의는 무제한 으로 풀었으니 참고해주세요 💓

클러스터 패키지를 이론 및 탄탄한 코드랩을 통해 직접 구축해볼 예정입니다.

위에 고가용성 파일시스템 데몬 구성들이 다소 어렵게 보이시나요? 원래 항상 처음 보는 아키텍처 및 시스템 구성도들은 부담스럽기 마련입니다.

하지만

약 6년동안 훌륭한 제자들의 소중한 피드백을 회고하여, 지난 인프런 2개 강의를 런칭한 경험으로 바탕으로, 수강생분들의 눈높이에 맞춰 차근차근 하나씩 용이하게 최대한 쉽고 질 좋은 컨텐츠로 구성하였으니 부담없이 follow up 해주셔도 괜찮습니다.

special thanks to my lovely students 👨🏻‍🎓

이런 분들께
추천드려요!

학습 대상은
누구일까요?

빅데이터 처리 시스템 클러스터 구축을 직접 경험하고 싶은 수강생
데이터 분석 및 시스템에 관심있고 직무를 희망하는 학생
고가용성 클러스터 실습을 직접 경험하고 싶은 개발자
빅데이터 분석 및 구축 분야에서 강점을 만들고 싶은 취준생

선수 지식,
필요할까요?

파이썬 기초 코딩
리눅스 명령어 기초 지식
데이터베이스 기초 지식

안녕하세요
J.PHIL입니다.

435

명

수강생

개

수강평

개

답변

4.9

점

강의 평점

개

강의

안녕하세요 J.PHIL 입니다 🧑🏻‍🎓

첫번째 강의로 [ 빅데이터 시스템 구축 및 분석에 관심있는 입문자 ] 를 위해
"Mastering Big Data Processing: Tools and Techniques for Success" 강의를 오픈 하였습니다.

'수업 및 프로필' 자세한 사항들은 수업 상세 페이지에 잘 작성했으니 참고 부탁드립니다 🙏🏻

커리큘럼

전체

36개 ∙ (4시간 51분)

해당 강의에서 제공:

수업자료

섹션 1. Introduction to Course

3개 ∙ (22분)

섹션 2. 이론] Distributed File System

1개 ∙ (9분)

4. All About Distributed System 😉
09:26

섹션 3. 이론] Intro to Big Data Frameworks

2개 ∙ (17분)

5. Framework 1 and 2] Hadoop (HDFS + Yarn) and SPARK
13:41
6. Framework 3 and 4] Zookeeper (분산 코디네이터) and Zeppelin (빅데이터 노트북)
04:18

섹션 4. 이론] About SPOF and High Availability (고가용성)

1개 ∙ (6분)

섹션 5. 이론] About HDFS Federation

1개 ∙ (4분)

섹션 6. 이론] Final Wrap Up

1개 ∙ (4분)

섹션 7. 이론] Background before CODELAB :)

1개 ∙ (5분)

섹션 8. 코드랩-1] Introduction to Codelab

1개 ∙ (4분)

섹션 9. 코드랩-2] Launch Base Node and Install Essential Settings

2개 ∙ (20분)

섹션 10. 코드랩-4] Create 5 Nodes by My AMI

2개 ∙ (19분)

섹션 11. 코드랩-5] All About Hadoop Setup

2개 ∙ (20분)

섹션 12. 코드랩-6] All About Zookeeper Setup

1개 ∙ (5분)

섹션 13. 코드랩-7] Clone Frameworks to Other Nodes

1개 ∙ (5분)

섹션 14. 코드랩-8] Start and Demo Hadoop and Zookeeper Daemons

2개 ∙ (22분)

섹션 15. 코드랩-9] All About WEB UI Setup

1개 ∙ (7분)

섹션 16. 코드랩-10] All About Spark Setup and Demo Spark Job

2개 ∙ (10분)

섹션 17. 코드랩-11] Demo Automatic Failover on HDFS High Availability

1개 ∙ (6분)

섹션 18. 코드랩-12] Zeppelin Setup and Demo on Big Data Cluster

4개 ∙ (23분)

섹션 19. 코드랩] Final Wrapup 😊

6개 ∙ (1시간 12분)

섹션 20. Closing & Promotion 👩🏼‍💻

1개 ∙ (3분)

강의 게시일: 2023. 10. 29.

마지막 업데이트일: 2024. 03. 15.

수강평

전체

18개

4.7

18개의 수강평

Jason.king
수강평 2
∙
평균 평점 5.0
2024. 01. 25.
5
36% 수강 후 작성
이전에 파이프라인 강의를 듣고 본 강의를 듣고 있는데 머리속에 잘 들어와서 너무 좋아요~ 컴팩트하고 실무에 쓰일 강의 감사해요~ 이 강의도 금방 들어버릴 것 같은데 다른 강의도 있을지 기대됩니다.
- Jason.king
  2024. 01. 27.
  2일 걸렸네요. lab 형식이라 좀 빠르게 진행되고 , namenode 기동이 안되어서 삽질하느라 어려웠는데 (아마 어딘가 실수하여 그런듯) 나중에 보니 trouble shoot guide 부분에 기동절차 스크립트 및 로그 보는 부분 정리해 두셨네요. 이것도 봤다면 좀더 빨리 실수를 복구했을텐데 ㅜㅜ 혹시 진행하시는 분들은 모두 따라 치는 것보다는 한번 정독하고 따라하는 것도 좋을 것 같아요~ 강사님. 좋은 강의 매번 감사해요~
- J.PHIL
  지식공유자
  2024. 01. 28.
  안녕하세요 Jason.King 님, 제 이번 강의를 열심히 수강해주셔서 감사합니다 :) 때때로 버그나 trouble shooting을 직접 겪어보면서 고민해보고 복기해보는 것이 많이 도움이 될 때가 있을테니 오히려 이번 경험이 추후 큰 도움될거라 사료됩니다. 굵직한 오프소스를 직접 구축해보면 클러스터를 구축해보셨으니 다른 오프소스가 나와도 이제 빠른 시간에 잘 구축하실 수 있을겁니다. 앞으로도 화이팅입니다
귤껍데기
수강평 3
∙
평균 평점 4.3
2025. 01. 07.
5
44% 수강 후 작성
내용이 알차고 처음 시작하기에 좋은 강의라고 생각되네요. 이런 강의를 준비해 주셔서 감사합니다.
권영미
수강평 3
∙
평균 평점 5.0
2024. 02. 08.
5
100% 수강 후 작성
감사합니다!
- J.PHIL
  지식공유자
  2024. 03. 01.
  안녕하세요 권영미님, 소중한 수강평 감사드립니다! 화이팅입니다
one831
수강평 1
∙
평균 평점 5.0
2024. 02. 25.
5
19% 수강 후 작성
곧 졸업을 앞둔, 데이터 엔지니어를 지망하는 컴공과 학생입니다. 취업 관련 포트폴리오를 만들면서, 빅데이터를 처리하기 위한 파이프라인 및 아키텍쳐를 어떻게 구성하고, 어떤 식으로 aws 환경을 설정하여 최대한 낮은 비용으로 효율적으로 이용할 수 있을지 고민이 많았었는데, 본 강의를 통해 엄청난 인사이트와 노하우들을 얻어갑니다. 특히, 빅데이터를 다루는 다양한 프레임워크들에 대한 많은 지식도 얻게 되어 앞으로 어느쪽으로 파고들수 있을지 영감을 얻은 것 같아 기쁩니다. 가뭄 끝에 단비를 만났습니다. 저와 같이 이쪽 분야를 지망하시는 학생분들께 수강 추천드립니다.
- J.PHIL
  지식공유자
  2024. 03. 01.
  안녕하세요 one831님, 소중한 수강평 감사드리며, 앞으로도 좋은 결과 있기를 바랍니다 화이팅입니다
Yeonwoo Jung
수강평 4
∙
평균 평점 5.0
2023. 12. 31.
5
31% 수강 후 작성
이론 부터 코드랩까지 초기 입무자에게 정말 추천하는 강의 입니다!! 빅데이터 클러스터 구축 강의로 필수로 수강하길 추천합니다!!
- J.PHIL
  지식공유자
  2024. 01. 02.
  안녕하세요 Yeonwoo Jung님, 소중한 수강평 감사합니다. 기회될 때 하루이틀 투자하셔서 AWS 로 실습을 따라해보셔서 좋은 성과 있기를 바랍니다. 새해 복 많이 받으세요 :)

J.PHIL님의 다른 강의

지식공유자님의 다른 강의를 만나보세요!

빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술

J.PHIL

여러분들은 빅데이터 프로세싱의 4단계에 해당하는 [데이터 수집 ▶ 데이터 저장 ▶ 데이터 분석 ▶ 표현] 에 대한 내용을 이론 30% + 실습 70%으로 이루어진 코드랩 방식으로 보다 재밌고 체계적으로 학습합니다 🧑🏻‍🏫

초급

빅데이터, Elasticsearch, Apache Spark

비슷한 강의

같은 분야의 다른 강의를 만나보세요!

빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술

J.PHIL

초급

빅데이터, Elasticsearch, Apache Spark

[2025] SQLD 문제가 어려운 당신을 위한 노랭이 176 문제 풀이

데이터코드랩

공부는 했지만 문제를 풀지 못하는 당신을 위한 SQLD 노랭이 176 문제 풀이 강의. 완강 후 합격을 넘어 전문가가 됩니다. SQLD 올인원패스!

초급

SQL, SQLD, 빅데이터

[리뉴얼] 처음하는 MongoDB(몽고DB) 와 NoSQL(빅데이터) 데이터베이스 부트캠프 [입문부터 활용까지] (업데이트)

잔재미코딩 DaveLee

최신 스타트업에서 활용하는 풀스택과 데이터과학 기술의 기본 기술 중 하나인 빅데이터를 다룰 수 있는 NoSQL 기술을 익힙니다. 몽고DB는 NoSQL 중에서도 가장 쉬우면서 빠르게 활용할 수 있는 기술입니다. 본 강의에서는 짧은 시간 안에 몽고DB 기초를 익히고, 파이썬으로 몽고DB를 다루고 활용할 수 있는 기술까지 학습해 봅니다.

초급

Python, MongoDB, DBMS/RDBMS

스파크 머신러닝 완벽 가이드 - Part 1

권 철민

스파크(Spark) 머신러닝의 핵심 Framework에 대한 이해, 난이도 높은 실전 문제를 통한 SQL 기반의 데이터 가공, 업무 도메인 분석을 통한 데이터 분석과 최적화된 머신러닝 모델 구현 능력까지, 대용량 데이터 기반에서 머신러닝 전문가로 인정 받고 싶다면 이 강의와 함께 하십시요.

중급이상

Apache Spark, 머신러닝, 빅데이터

[멘토링] 데이터로 미래를 그리다: 모두를 위한 데이터 리터러시

한기용

데이터에 관심있는 개인이나 리더를 대상으로 데이터 팀이 하는 일을 소개하고 조직의 데이터 활용 능력을 나타내는 데이터 문해력이 어떤 것인지 소개합니다.

입문

데이터 리터러시, 데이터 엔지니어링, 데이터 트랜스포메이션

갖고노는 MySQL 데이터베이스 by 얄코

얄팍한 코딩사전

비전공자도 이해할 수 있는 MySQL! 빠른 설명으로 필수개념만 훑은 뒤 사이트의 예제들과 함께 MySQL을 ‘갖고 놀면서’ 손으로 익힐 수 있도록 만든 강좌입니다.

입문

MySQL, SQL, DBMS/RDBMS

[리뉴얼] 처음하는 SQL과 데이터베이스(MySQL) 부트캠프 [입문부터 활용까지]

잔재미코딩 DaveLee

이 강의를 통해 SQL과 데이터베이스의 이해, SQL 문법, 실제 활용을 위한 데이터베이스 설계, 프로그래밍을 통한 데이터베이스 활용, 데이터 분석 활용 사례까지 익힐 수 있습니다.

초급

Python, SQL, MySQL

다양한 사례로 익히는 SQL 데이터 분석

권 철민

다양한 실전 데이터 분석 사례를 SQL을 통해 구현해 나가면서 데이터 분석 능력과 SQL 활용 능력을 동시에 향상 시킬 수 있습니다.

중급이상

SQL, PostgreSQL, DBMS/RDBMS

데이터입문자를 위한 Azure 데이터 기초 완전정복

이상희강사

Microsoft AZ-900 자격을 동시에 대비 할 수 있는 이론적 토대를 마련 할 수 있는 특강이며 2025년 5월 기준의 출제 범위를 반영한 최신 콘텐트로서 핵심 데이터 개념 ,Azure의 관계형 데이터 ,Azure의 비관계형 데이터,Azure의 분석 워크로드에 관련된 내용을 이론과 실습이 겸비된 형태로 제공함으로서 자격증 취득은 물론 데이터 전문가로의 첫걸음 다지는 의미있는 교육 기회로 활용 할 수 있습니다

입문

SQL, 빅데이터, 데이터 엔지니어링

모르면 퇴사각? 데이터 엔지니어링 정석

미쿡엔지니어

데이터 시대, 진정한 가치를 발견하라! 📊 데이터에 집중된 어플리케이션 설계는 이제 필수가 되었습니다. 최신 트렌드와 실무 중심의 사례로 회사가 원하는 인사이트와 실력을 키워보세요. 효율적인 데이터 처리와 설계 비법, 지금 바로 시작하세요! 당신의 다음 스텝, 데이터 중심의 세계로 도약하세요!

초급

빅데이터, 데이터 엔지니어링, 아키텍처

mongoDB 기초부터 실무까지(feat. Node.js)

김시훈 (도도소프트)

mongoDB, NoSQL 요즘 많이 들리지만 아직은 낯선 데이터베이스인가요? 관계형 데이터베이스(RDS/SQL)처럼 사용하고 계시지는 않으신가요? 아무리 좋은 기술도 올바르게 사용하지 않으면 역효과가 발생합니다. 그래서 몽고디비 사용 실패 사례도 종종 보이는데요. 이 강의는 mongoDB를 최대한 mongoDB스럽게 사용할 수 있도록 기본 개념부터 실무 노하우까지 가르쳐드려요.

초급

MongoDB, REST API, Node.js

따라하며 배우는 도커와 CI환경 [2023.11 업데이트]

John Ahn

이 강의를 통해 도커에 대해서 배울 수 있으며, CI 환경을 구성할 수 있습니다.

초급

GitHub, AWS, Docker

월 ₩19,800

5개월 할부 시

₩99,000

빅데이터 클러스터 구축 패키지; 성공을 향한 로드맵

초급자를 위해 준비한
[데이터 엔지니어링] 강의입니다.

이런 걸 배울 수 있어요

안녕하세요 J.PHIL 입니다 🍏

우리는 왜 강의를 들어야 할까요 🙇🏻

저희는 무엇을 배우게 되나요 📚

하지만

커리큘럼에 대해서 알려주세요 🧑🏻‍🏫

빅데이터 OR 분산처리에 관심있는 누구나 수강 가능합니다 🧑🏻‍🎓

실습 환경은 어떻게 되나요? 💻

J.PHIL 소개 👨‍👨‍👧‍👦

이런 분들께
추천드려요!

안녕하세요
J.PHIL입니다.

안녕하세요 J.PHIL 입니다 🧑🏻‍🎓

커리큘럼

수강평

J.PHIL님의 다른 강의

비슷한 강의

빅데이터 클러스터 구축 패키지; 성공을 향한 로드맵

초급자를 위해 준비한 [데이터 엔지니어링] 강의입니다.

이런 걸 배울 수 있어요

안녕하세요 J.PHIL 입니다 🍏

우리는 왜 강의를 들어야 할까요 🙇🏻

저희는 무엇을 배우게 되나요 📚

하지만

커리큘럼에 대해서 알려주세요 🧑🏻‍🏫

빅데이터 OR 분산처리에 관심있는 누구나 수강 가능합니다 🧑🏻‍🎓

실습 환경은 어떻게 되나요? 💻

J.PHIL 소개 👨‍👨‍👧‍👦

이런 분들께 추천드려요!

안녕하세요 J.PHIL입니다.

안녕하세요 J.PHIL 입니다 🧑🏻‍🎓

커리큘럼

수강평

J.PHIL님의 다른 강의

비슷한 강의

초급자를 위해 준비한
[데이터 엔지니어링] 강의입니다.

이런 분들께
추천드려요!

안녕하세요
J.PHIL입니다.