이런 걸
배워요!
Airflow 개념과 기초
Airflow 기반 파이프라인 개발
Airflow로 자동 Email 전송하기
Airflow를 활용한 공공데이터 API 호출 및 시각화
Airflow & 카카오, Slack을 활용한 메시지 알람
Airflow로 ChatGPT를 활용하기
데이터 파이프라인, Airflow로 고민 끝 📊
👉 Apache Airflow(아파치 에어플로)의 기본 개념부터 대용량 환경에서 운영할 수 있는 아키텍처 구성까지 모든 것을 담았습니다.
👉 약 60개 가량의 실습파일은 Github에서 다운받을 수 있습니다.
그런데, 왜 Airflow일까요?
Airflow는 추출, 가공, 저장, 분석 등이 이루어지는 데이터 파이프라인을 만들고 관리하는 핵심적인 오케스트레이션 솔루션입니다.
Airflow는 유사 솔루션 중에서도 가장 인기가 많은 파이프라인 관리 도구이며, 도입 사례 또한 계속해서 증가하고 있습니다.
Airflow 기본기
Airflow의 개념과 워크플로를 만드는 방법 등 기본적인 사용법을 실습을 통해 배웁니다. 60개 정도의 실습 파일로 차근차근 배울 수 있도록 구성하였습니다.
파이프라인 구성
스케줄링 관리를 통한 이메일 전송 등 Airflow를 이용해 DAG 파이프라인을 개발하고 실행하는 과정을 학습합니다.
데이터 수집
서울시 공공데이터 포털에서 API로 데이터를 받아 저장하는 파이프라인을 구성해봅니다.
모니터링 및 연동
카카오톡, 슬랙(Slack) 메신저 앱과 연동해 에러메시지, DAG 현황 등 알람(Alarm) 받기를 실습해 봅니다.
데이터 시각화
R 언어를 이용하여 시각화할 수 있는 R Shiny에 대한 개념을 소개합니다. 서울시공공데이터포털에서 받은 데이터를 이용하여 시각화를 진행해봅니다.
아키텍처
Airflow의 여러 배포 방식 및 아키텍처에 대해 배우고, 대용량 환경에서 안정적으로 운영할 수 있는 방법을 익힙니다.
업무 자동화
ChatGPT에 대한 개념을 소개하고 파이썬(Python) API와 ChatGPT를 연계하는 방법을 알아봅니다. 파이썬으로 주식정보를 불러올 수 있는 방법을 통해 주식 급등 종목에 대해 ChatGPT가 소개하는 내용을 블로그에 자동 포스팅해보는 자동화를 실습해봅니다.
1. Python 기본 지식
2. Docker 및 Docker Compose
3. SQL
김현진
Q. 강의는 어떤 식으로 진행하나요?
Airflow에서 워크플로우를 DAG이라고 하는데, DAG을 함께 작성해보는 방식으로 실습합니다. 기본 개념을 설명하는 시간 외에는 기본적으로 각 장마다 실습을 진행합니다.
실습 파일이 긴 경우에는 제가 미리 DAG 파일을 만들어 놓고, 로직을 설명하는 방식으로 진행합니다.
Q. 실습 파일과 학습 자료를 다운로드받을 수 있나요?
물론입니다! Github에서 실습 파일을 모두 받을 수 있습니다. Git 사용법을 잘 모르신다구요? Git 사용법도 알려드립니다.
그리고 PDF 기반 학습 자료도 모두 제공해드립니다. 섹션 0 - 강의자료 다운로드에서 받으시면 됩니다.
Q. 실습 난이도는 어느 정도인가요?
초반에는 파이썬의 기본적인 문법만 알아도 이해할 수 있으나 후반부로 갈수록 난이도는 조금 어려울 수 있기에 파이썬의 클래스, 상속과 같은 개념을 알면 도움이 됩니다. 그렇지만 걱정 마세요. 실습 내용은 충분히 설명드리고 진행합니다.
Q. Airflow 배우면 무엇을 할 수 있나요?
Bash Shell, 파이썬으로 할 수 있는 것은 모두 할 수 있습니다. 무언가를 Airflow로 할 수 있는지가 궁금하다면, 그것을 Bash Shell 또는 파이썬 언어로 처리할 수 있는지를 먼저 알아보세요. Bash Shell 또는 파이썬 언어로 할 수 있다면 Airflow로 할 수 있습니다.
학습 대상은
누구일까요?
데이터 엔지니어에 대해 배우고 싶은 분
Airflow가 궁금하신 분
Airflow를 쓰고 있긴 하지만 잘 활용하지 못하는 분
데이터 파이프라인 구축과 관리가 필요한 분
선수 지식,
필요할까요?
Python 기초문법
Docker & Docker Compose 사용법
SQL 기초 문법(SELECT, FROM)
안녕하세요
LG CNS 데이터 엔지니어 김현진 입니다.
정보관리기술사를 취득한 이후 지금까지 얻은 지식을 많은 사람들에게 공유하고,
특히 데이터 엔지니어를 희망하고 공부하고 싶은 분 들에게 도움이 되고자 컨텐츠를 제작하고 있습니다.
첫 컨텐츠는 Airflow 마스터 클래스로써
데이터 파이프라인을 만들고 관리할 수 있는 핵심 도구를 초보자도 이해하기 쉽게 만들었습니다.
만나서 반갑습니다 ^^
Contact: hjkim_sun@naver.com
전체
85개 ∙ (20시간 4분)
가 제공되는 강의입니다.
강의 소개
12:29
Airflow 소개
07:16
WSL설치
16:44
도커&에어플로우설치
17:18
개발환경구성(전체설명, 사양 설명)
04:52
개발환경구성(파이썬 인터프리터설치)
05:58
개발환경구성(Vscode 설치)
11:39
Airflow library 설치
05:50
cron 스케줄 설명
08:54
task 연결하기
13:32