작성
·
290
0
답변 2
0
선생님 조언 감사합니다 ㅎ 잘 이해가 되엇습니다.
선생님 조언대로 일반적인 소양으로 SQL강의까지는 듣는것이 좋다고 느껴집니다 ㅎㅎ SQL강의에서 다시 뵙겟습니다 ㅎㅎㅎ
0
안녕하십니까,
오, 제 강의들을 사랑해 주셔서 넘 감사합니다.
=> 네, 전반적으로 그렇게 이해하셔도 될 것 같습니다. 예측 분석은 기존 통계 기반의 방식도 사용하지만, 근래에는 머신러닝 기반을 매우 많이 사용합니다.
=> Spark를 사용하는 경우보다 그냥 파이썬 만으로 머신러닝을 구현하는 경우가 더 많습니다. Spark을 사용하는 경우는 데이터 처리량이 많아서 Pandas등으로는 데이터를 다 로딩할 수 없는경우이거나 머신러닝 모델을 학습하는데 너무 오래 걸리는 경우 입니다. 또는 이미 Spark를 데이터 처리 프레임워크로 사용하고 있고, 이를 기반으로 머신러닝을 수행하고자 하는 경우입니다.
주로 Spark를 이미 도입한 기업들에서 Spark 기반 머신러닝을 많이 활용하고 있습니다. 데이터량이 적은 경우(일반적으로 20GB 이하)라면 굳이 Spark에서 머신러닝을 학습할 필요는 없습니다.
3) 데이터분석가로서는 최종목표를 spark등을 이용한 머신러닝을 구축하는것이 최종목표로 잡아도 되는지요?
=> 그렇지는 않습니다. 데이터 분석가는 데이터 분석을 통해서 기업이 원하는 문제를 해결하는 것을 주요 목표로 삼고 있습니다. 파이썬 기반의 머신러닝이든 spark 기반의 머신러닝이든, 또는 SQL만 사용하든 툴은 어떤 것이든 상관 없습니다.
다만 데이터 분석가라면 일반적인 소양으로 데이터 분석을 위한 여러 업무의 이해, 통계에 대한 이해, SQL 및 머신러닝에 대한 이해를 하고 있다면 실제 현업 업무에 빠르게 적용하고 문제해결에 자신이 가진 역량을 발휘하기가 더 쉬울것입니다. 또한 데이터 분석가로서의 취업도 한결 쉬워질 것입니다.
감사합니다.