데이터를 다루는 방법은 무엇이 더 아름다운지를 느끼는 감각보다 우리의 시각적 지각을 통해 더 잘 접근합니다. 그래서 데이터 시각화의 지각적 특성을 파악하는 것이 인간의 선호도를 통해 알아차리는 것보다 유리합니다. 따라서 이 강의를 통해 실무에 적합한 데이터 분석과 그래픽 커뮤니케이션을 구축하고자 합니다.
이런 걸
배워요!
데이터 시각화
데이터 분석
실무에서 데이터를 활용하는 일들이 많은 요즘입니다. 이 강좌는 업무의 효율을 올리기 위해서 데이터에 대한 분석을 하고 시각화를 하는 역량을 키울 수 있습니다.
중요한 자산인 데이터들을 정리하여 통계를 내고, 데이터를 시각화하여 유의미한 정보를 얻을 수 있도록 분석할 수 있는 능력을 가지게 되면 효율적인 업무를 할 수 있을 것입니다.
보통 통계적 수치로 업무에 접근하는 경우들이 많습니다. 하지만 이러한 통계적 수치만으로는 데이터의 특성을 파악하기가 쉽지 않습니다. 그래서 데이터 시각화를 통해서 알 수 없는 특성을 파악하고 특이값을 찾아낼 수 있습니다.
본 강의는 R을 활용한 데이터 시각화에 대한 이해를 돕고 실무 적용을 위해 구성되었습니다. R이 제공하는 다양한 함수를 이용하여 데이터를 그래프나 플롯으로 표현하고자 합니다. 데이터 시각화를 통해 데이터 의미, 관계, 차이, 분포 등을 선명하게 표현하여 업무의 효율을 높일 수 있습니다. 또한 도표(graph)를 통해 명확하고 효과적인 정보 전달이 이루어집니다.
• 강의 소개, R 다운로드와 설치 영상을 제공하여 처음 접하시는 분들도 쉽게 따라오실 수 있습니다.
• 이미지와 도표를 곁들여 누구나 쉽게 이해할 수 있습니다.
• 다양한 실습을 통해 상황에 맞는 스크립트를 작성하실 수 있습니다.
• 기본적인 데이터를 제공합니다.
• 입문자도 이해할 수 있도록 풍부한 강의 자료를 제공합니다.
• 제공된 PDF로 바로 편집이 가능하며 R에서 실습할 수 있습니다.
데이터 시각화의 정의부터 알아가면서 데이터 시각화의 특성, 전략, 현황에 대해 살펴보고자 합니다.
데이터를 효율적으로 시각화하는 방법을 배우는 것은 데이터에서 수치를 생성하는 코드로 작성하는 방법을 아는 것 이상입니다.
또한, 데이터 또는 변수 유형에 따라 그룹을 나누어 그래프를 접해보고자 합니다.
R 다운로드와 설치를 하여 R을 실행하고 살펴봅니다.
1년 365일(366일)의 각 날짜에 계열 값을 컬러로 나타낸 채색화인 채색 달력과 시계열 자료의 플롯인 시도표를 소개합니다.
또한, ggplot2 팩키지를 활용하여 '지나온 길'을 그려봅니다.
이변량 자료의 시각화에서 기본적이고 궁극적인 도구인 산점도를 배우게 됩니다. 이를 통해 '큰' 자료의 산점도를 소개하고 사례를 제시합니다.
이변량 밀도를 살펴보면 모분포의 밀도를 추정하기 위해서 커널 함수를 사용합니다. 또한, identify 함수를 실행하여 특이점의 식별번호를 표현할 수 있습니다.
흩뜨림을 구현하기 위해 beeswarm 함수를 이용하여 자료 점의 겹침을 최소화할 수 있습니다.
3변량 이상의 수치형 자료를 시각화 하는 움직이는 산점도를 배우게 됩니다.
1개의 종속변수 Y와 3개 이상의 설명변수 X1, X2, X3, ⋯ 으로 구성되어 있는 경우를 상정합니다. 이 때, 끝 잇기 알고리즘을 파악할 수 있습니다.
텍스트 내 명사들로 구성된 단어 클라우드는 잠재적 독자에게 경제적이고 효과적인 요약을 제공할 수 있습니다. 이를 구현하기 위해 "wordcloud" Packages를 기반으로 R 스크립트를 작성할 수 있습니다.
다양한 데이터를 동시에 비교할 수 있게 해주는 여러 뷰의 모음인 대시보드를 배우게 됩니다. 시각화한 데이터 중 필요한 부분을 강조, 색출할 수 있습니다.
사용자 정의 R 함수를 통해 예술적 가치가 있는 n X m 행렬의 이미지를 구현할 수 있으며, 행렬의 특별한 구조를 파악하는 데 있어서 도움이 됩니다.
Q. 비전공자도 들을 수 있나요?
A. 네. 함수를 기초부터 알려드리기 때문에 R을 모르셔도 들을 수 있습니다.
Q. 왜 데이터 시각화를 배워야 하나요?
A. 본인만의 데이터를 가공하거나 자세히 알고 싶을 때 시각화함으로써 인지효과를 높일 수 있습니다.
Q. 데이터 시각화를 배우면 어떤 일을 할 수 있나요?
A. 의사결정이 이루어지는 상황에서 효과적인 프레젠테이션을 구축할 수 있습니다.
Q. 강의를 듣기 전 준비해야 할 것이 있나요?
A. 없습니다. 열심히 배우고자 하는 의지만 있으시면 됩니다.
Q. 수업 내용을 어느 정도 수준까지 다루나요?
A. 데이터 시각화를 처음 접하는 분들에게 기초부터 차근차근 실습을 통해 설명하여 실무에 적용할 수 있는 수준까지 다루고 있습니다.
학습 대상은
누구일까요?
데이터 시각화를 공부하고 싶은 분들
데이터 시각화를 활용하여 업무의 효율을 높이고 싶은 분들
실무에 데이터 분석을 적용하고 싶은 분들
선수 지식,
필요할까요?
없습니다.
회사 소개
MCA 연구센터는 맞춤형 기업 컨설팅(연수교육, 데이터분석가 양성 컨설팅), 암호 알고리즘 연구 및 블록체인 플랫폼 개발 회사입니다.
- 국가기관 연수교육 : 사무관 및 실무 공무원 대상 통계학, 데이터분석 강의
- ㈜아이티고 온라인 교육: 데이터 분석 및 통계학 강의, 암호학 강의
(경영 빅데이터 분석사, 재무 빅데이터 분석사, ADSP, ADP, 통계직 공무원 대상 통계학등)
- ㈜위브앱솔루션 : 앱개발 고급통계 기법 및 알고리즘 기술자문
- 퀀트 및 금융 관련 앱 개발 스타트업 기업 : 알고리즘 트레이딩, 퀀트 관련 기술 자문
- 성균관대 대수센터 참여연구 (과제: 타원곡선과 그 적용 문제 연구(암호학관련))
- 카이스트 참여연구 (과제: 보형형식의 산술성 및 분할수 연구)