소개
금융과 통신 등 다양한 분야에서 빅데이터와 AI 관련 전문가로 활동하고 있으며, 기술&경험의 채우기와 비우기를 반복하며 소소한 행복을 찾는 Big.D(빅디) 입니다.
강의
전체1수강평
- 좋은 강의 입니다
박정필
2024.03.08
1
- 좋은 강의였습니다 :) 감사합니다
ᄏᄏ
2024.03.05
1
- 안녕하세요. 전반적인 시스템을 배울 수 있어서 좋은 강의인 것 같습니다.
Seonggil
2024.03.04
2
게시글
질문&답변
2024.06.02
FileZilla 권한 거부
안녕하세요! 김태욱님! bigdata 계정은 하둡 설치후 간단하게 Sample.txt 파일 업로드에만 잠깐 사용 되는 계정입니다. 말씀하신 대로 권한을 수정 하셔도 되고요, 테스트가 다 끝났다면 bigdata 계정은 이후 사용되지 않으니깐 무시하셔도 괜찮습니다. 대신 이후부터는 root 계정을 사용 하는데.. bigdata계정과 같은 문제가 발생 한다면, 어떤 작업으로 인해 권한이 변경 되었는지 확인해 볼 필요는 있습니다~ -빅디 드림 ^^*
- 0
- 1
- 13
질문&답변
2024.05.30
클라우데라 접속 중 블루스크린 오류
안녕하세요! jackrkd022244님! 블루스크린은 PC환경에따라 너무 다양한 원인이 있어서 정확한 답변이 어려운데요... TT VM이 정상 기동 됐는데, 이후 액션(크롬브라우져 실행 등)에서 블루 스크린이 발 생했다면.. 의심되는 원인은 PC의 리소스(CPU, Memory, Disk 등) 부족 문제일 확률이 높습니다. 다소 번거롭더라도 사용중인 PC의 불필요한 프로그램들을 삭제 또는 미사용한 상태로, 리소스를 최대한 많이 확보해 실행해 보고나, 포맷이 필요할 수 도 있습니다. ㅠㅠ 강의소개에서 설명 드렸던 실습 PC의 필요 자원은 아래와 같습니다. 메모리: 7GB 이상의 여유 디스크: 90GB 이상 여유(SSD 권장) -빅디 드럼
- 1
- 1
- 45
질문&답변
2024.05.17
파일질라 다운로드 오류
안녕하세요! sunj8234님! 파일질라 설치시 권한에 문제가 있어 보입니다. ^^;; 설치파일에서 마우스 우클릭하고 "관리자 권한으로 실행"으로 설치해 봐주세요~ -빅디 드림
- 0
- 1
- 52
질문&답변
2024.05.15
hue 설치 중 psycopg2 설치 오류
안녕하세요! 김민구님! 빅디입니다. 휴일인데도 파일럿 프로젝트 진행하며 질문을 주셨네요.. 파일럿 프로젝트 완주를 응원합니다! ^^ 음...질문 주신 에러는 파일럿 VM 환경에선 잘 안나는 에러인데 발생을 했네요.. 주로 보안정책으로 pip 타겟 URL을 신뢰할 수 없는 사이트로 인식해 발행 합니다. 여러 조치 방법이 있는데요, 제일 간단한건 pip실행중 Verification을 무시하는 겁니다. 우선 아래 내용으로 조치후 테스트 부탁드립니다. 아래의 sessions.py 파일을 vi로 오픈 $ vi /opt/rh/python27/root/usr/lib/python2.7/site-packages/pip/_vendor/requests/ sessions.py # SSL Verification default 라는 주석 하단의 verify = True 값을 False로 변경 verify = False -빅디 드림
- 0
- 2
- 73
질문&답변
2024.03.07
각 서버에 설치하는 프로그램은 어떻게 정하나요?
안녕하세요! "dali7711"님! 오늘 날씨가 갑자기 쌀쌀해 졌네요...환절기 감기 조심하세요! 그리고 좋은 질문 감사합니다! ^^* 각 SW의 서버 인스턴스의 설치 기준은 우선 파일럿 환경 기준으로만 설명 드리자면 간단합니다. 개인의 PC환경에서 다양한 빅데이터 에코시스템들을 작동 시키기 위한 최선으로 구성한 것 입니다. 결국 가상서버들의 CPU/Mem의 자원을 분산 시키되, 아키텍처의 정합성은 깨지지 않도록 구성을 한 것 입니다. 예를들어 PostgreSQL은 Cloudera Manager가 사용 하게 되는데, Cloudera Manager가 Server01에 설치 되어 있기 때문에 같은 위치에 구성을 한것이고요, HBase Region 같은 경우 하둡에 의존성을 갖게 되므로 하둡의 워커노드가 3개이면 HBase리전도 3개로 맞춘것 입니다. 또한 질문중 왜? PostgreSQL로 했냐고 물으셨는데요... 이또한 Cloudera Manager에서 기본으로 제공하는 DBMS가 PostgreSQL이기 때문에 설치 구성의 편의성 차원이 이유입니다. 물론 Oracle을 별도로 설치하고 Cloudera Manager와 연결을 할 수 도 있지만, 파일럿 프로젝트의 핵심은 DBMS 기술을 배우는것이 아니니깐요! 물론 실프로젝트에선 Oracle을 많이 연결해 사용합니다. ^^ 그런데 실제 환경에서도 이런일들이 비일비재 합니다. 물리적인 자원은 한정되고, 사업은 확장 되면서 구축해야할 시스템은 늘어 나는데, H/W 장비는 지금당장 구매해 들어오기가 어려운 상황들로, 제품에 최적화된 아키텍처 보단, 빡빡한 자원에 맞춰 아키텍처링을 할 수 밖에 없는 상황들 입니다. 강의에선 "dalki7711"님처럼 궁금해 하실 분들이 있으실 것 같아서... "섹션2 - 빅데이터 실환경의 이해"에서 실제 프로젝트에선 수십대의 서버에 다양한 빅데이터 에코시스템들을 이중화 및 분산구조 등으로 성능/안정성/확장성을 고려해 배치 된다는 것은 간략하게나마 설명 드렸습니다. 이때 어떤 S/W를 사용할 것이냐는 프로젝트의 목적에 따라 비용/성능/안정성/운영 등 많은 것을 고려합니다만, 의외로 현장에선 아키텍트 또는 의사결정권자 등이 경험 했던 제품으로 많이 결정 되곤 합니다. 제가 파일럿 프로젝트 강의에서 Flume, Kafka, Storm, Hbase 등을 선택해 실시간 기능을 구성 했던 것 처럼요~ 실전 프로젝트에서 저같은경우는...사업의 요구사항을 최우선으로 하고요, 본인의 경험과 기술 트랜드 그리고 개발자/운영자들의 기술수준 등을 고려해서 아키텍처링을 하는편 입니다. 아 마지막 질문중 서비스 확장에대해 물어 보셨는데요, 대부분의 실운용 시스템엔 자원을 모니터링 하는 툴들이 있게 됩니다. 시스템의 중요도에 따라 리소스의 사용률 임계치 정하는데요...중요도가 높은 시스템일 수로 임계치를 낮게 잡습니다. 예를들의 CPU/Mem 사용률이 피크시간때 80% 이상 넘는 다든지, 일평균 70%를 넘는다든지, 자원의 스파이크가 매우 빈번하게 발생 한다던지 하면 삐요삐요를 알리고, 필요시 서버를 Scale-Out/Up 하게 됩니다. 요즘엔 Cloud Native 환경을 이용해 이러한 임계치를 기준으로 Auto Scale-In/Out를 처리하기도 합니다. 요약하자면 기준은 따로 없고요 시스템의 중요도와 모니터링 결과에 따라 케바케라 보시면 됩니다. ^^ -빅디 드림
- 0
- 1
- 125