소개
금융과 통신 등 다양한 분야에서 빅데이터와 AI 관련 전문가로 활동하고 있으며, 기술&경험의 채우기와 비우기를 반복하며 소소한 행복을 찾는 Big.D(빅디) 입니다.
강의
전체1수강평
- 좋은 강의 입니다
박정필
2024.03.08
1
- 좋은 강의였습니다 :) 감사합니다
ᄏᄏ
2024.03.05
1
- 안녕하세요. 전반적인 시스템을 배울 수 있어서 좋은 강의인 것 같습니다.
Seonggil
2024.03.04
2
게시글
질문&답변
2024.05.17
파일질라 다운로드 오류
안녕하세요! sunj8234님! 파일질라 설치시 권한에 문제가 있어 보입니다. ^^;; 설치파일에서 마우스 우클릭하고 "관리자 권한으로 실행"으로 설치해 봐주세요~ -빅디 드림
- 0
- 1
- 43
질문&답변
2024.05.15
hue 설치 중 psycopg2 설치 오류
안녕하세요! 김민구님! 빅디입니다. 휴일인데도 파일럿 프로젝트 진행하며 질문을 주셨네요.. 파일럿 프로젝트 완주를 응원합니다! ^^ 음...질문 주신 에러는 파일럿 VM 환경에선 잘 안나는 에러인데 발생을 했네요.. 주로 보안정책으로 pip 타겟 URL을 신뢰할 수 없는 사이트로 인식해 발행 합니다. 여러 조치 방법이 있는데요, 제일 간단한건 pip실행중 Verification을 무시하는 겁니다. 우선 아래 내용으로 조치후 테스트 부탁드립니다. 아래의 sessions.py 파일을 vi로 오픈 $ vi /opt/rh/python27/root/usr/lib/python2.7/site-packages/pip/_vendor/requests/ sessions.py # SSL Verification default 라는 주석 하단의 verify = True 값을 False로 변경 verify = False -빅디 드림
- 0
- 2
- 60
질문&답변
2024.03.07
각 서버에 설치하는 프로그램은 어떻게 정하나요?
안녕하세요! "dali7711"님! 오늘 날씨가 갑자기 쌀쌀해 졌네요...환절기 감기 조심하세요! 그리고 좋은 질문 감사합니다! ^^* 각 SW의 서버 인스턴스의 설치 기준은 우선 파일럿 환경 기준으로만 설명 드리자면 간단합니다. 개인의 PC환경에서 다양한 빅데이터 에코시스템들을 작동 시키기 위한 최선으로 구성한 것 입니다. 결국 가상서버들의 CPU/Mem의 자원을 분산 시키되, 아키텍처의 정합성은 깨지지 않도록 구성을 한 것 입니다. 예를들어 PostgreSQL은 Cloudera Manager가 사용 하게 되는데, Cloudera Manager가 Server01에 설치 되어 있기 때문에 같은 위치에 구성을 한것이고요, HBase Region 같은 경우 하둡에 의존성을 갖게 되므로 하둡의 워커노드가 3개이면 HBase리전도 3개로 맞춘것 입니다. 또한 질문중 왜? PostgreSQL로 했냐고 물으셨는데요... 이또한 Cloudera Manager에서 기본으로 제공하는 DBMS가 PostgreSQL이기 때문에 설치 구성의 편의성 차원이 이유입니다. 물론 Oracle을 별도로 설치하고 Cloudera Manager와 연결을 할 수 도 있지만, 파일럿 프로젝트의 핵심은 DBMS 기술을 배우는것이 아니니깐요! 물론 실프로젝트에선 Oracle을 많이 연결해 사용합니다. ^^ 그런데 실제 환경에서도 이런일들이 비일비재 합니다. 물리적인 자원은 한정되고, 사업은 확장 되면서 구축해야할 시스템은 늘어 나는데, H/W 장비는 지금당장 구매해 들어오기가 어려운 상황들로, 제품에 최적화된 아키텍처 보단, 빡빡한 자원에 맞춰 아키텍처링을 할 수 밖에 없는 상황들 입니다. 강의에선 "dalki7711"님처럼 궁금해 하실 분들이 있으실 것 같아서... "섹션2 - 빅데이터 실환경의 이해"에서 실제 프로젝트에선 수십대의 서버에 다양한 빅데이터 에코시스템들을 이중화 및 분산구조 등으로 성능/안정성/확장성을 고려해 배치 된다는 것은 간략하게나마 설명 드렸습니다. 이때 어떤 S/W를 사용할 것이냐는 프로젝트의 목적에 따라 비용/성능/안정성/운영 등 많은 것을 고려합니다만, 의외로 현장에선 아키텍트 또는 의사결정권자 등이 경험 했던 제품으로 많이 결정 되곤 합니다. 제가 파일럿 프로젝트 강의에서 Flume, Kafka, Storm, Hbase 등을 선택해 실시간 기능을 구성 했던 것 처럼요~ 실전 프로젝트에서 저같은경우는...사업의 요구사항을 최우선으로 하고요, 본인의 경험과 기술 트랜드 그리고 개발자/운영자들의 기술수준 등을 고려해서 아키텍처링을 하는편 입니다. 아 마지막 질문중 서비스 확장에대해 물어 보셨는데요, 대부분의 실운용 시스템엔 자원을 모니터링 하는 툴들이 있게 됩니다. 시스템의 중요도에 따라 리소스의 사용률 임계치 정하는데요...중요도가 높은 시스템일 수로 임계치를 낮게 잡습니다. 예를들의 CPU/Mem 사용률이 피크시간때 80% 이상 넘는 다든지, 일평균 70%를 넘는다든지, 자원의 스파이크가 매우 빈번하게 발생 한다던지 하면 삐요삐요를 알리고, 필요시 서버를 Scale-Out/Up 하게 됩니다. 요즘엔 Cloud Native 환경을 이용해 이러한 임계치를 기준으로 Auto Scale-In/Out를 처리하기도 합니다. 요약하자면 기준은 따로 없고요 시스템의 중요도와 모니터링 결과에 따라 케바케라 보시면 됩니다. ^^ -빅디 드림
- 0
- 1
- 119
질문&답변
2024.02.20
파일럿 프로젝트 pc 환경 구성 질문입니다.
안녕하세요! "ssafy204"님! Docker 컨테이너에서 작업은 SW들간의 의존성과 복잡성이 높아 불가능 합니다. 우선 강의에서 제공한 가상서버를 이용해 실습을 끝까지 완수해 보시고요~ 이후 다양하게 응용해 볼 수 있는 아이디어들이 개인의 역량에 따라 생기실 겁니다. 예를들어 프로젝트 중간에 Redis를 VM Server02에 설치하게 되는데, Redis서버를 Docker로 구성하는 아키텍처로 확장해 보는 방법등 입니다. -빅디 드림
- 0
- 1
- 131
질문&답변
2024.02.15
VirtualBox-5.0.40 실행불가
안녕하세요! "스스로 스터디"님! 아주 기분좋은 닉네임으로 만드셨네요!! ^^; 네~ 말씀하신대로 윈도우 버젼에 따라 VirtualBox 버젼에 호완성 문제가 있습니다. 그런경우 VirtualBox 7.0 버젼을 사용하시면 되고요~ 아마 강의에서 사용하는 VirtualBox 5.x와 UI가 좀 상이 하지만 문제없이 셋팅이 가능하실 겁니다. 그중 가장 큰차이는 "섹션 2. 파일럿 프로젝트 환경구성 > 4.통합환경구성"에서 "NAT Networks 및 호스트 전용 네트워크" 구성이 좀 다른데요. VirtualBox 7 기준 "파일 > 도구 > Network Manager"에서 관련 설정 창을 확인하실 수 있습니다. VirtualBox에서 가상서버만 정상 기동 된다면, 이후 과정은 강의 환경과 똑같아서 파일럿 프로젝트 진행에 문제 없으실 겁니다. 아래 관련 스크린캡쳐 올립니다~ -빅디 드림 (사진)(사진)
- 1
- 2
- 171