24.02.03 00:10 작성
·
253
·
수정됨
0
안녕하세요
지난 2월 1일, Ooize를 통해 table을 create, alter, insert에 대한 task 정의하고, workflow를 실행하고, 아래와 같은 쿼리를 실행했습니다.
SELECT * FROM MANAGED_SMARTCAR_STATUS_INFO WHERE BIZ_DATE = '20220201' LIMIT 10;,
그러나, 중간의 파일명이 꼬였는지, 조회값이 나오지 않았습니다(제가 자투리 시간을 이용하여 공부하다보니, 20220130, 20220131, 20220201에 대한 log 파일이 모두 존재한 상황이었습니다.
해서, 맨 처음 flume 단계부터 다시 실행하기 위해 실행되는 모든 service를 종료하고, cloudera를 다시 실행하였더니, 첨부된 사진과 같이 HDFS와 HBase에 에러가 감지 되었습니다. 현재 shell을 통해 확인하니, HDFS는 에러가 있었음에도 정상적으로 파일을 저장하였지만, HBase는
http://server02.hadoop.com:8888/
에 접속이 되지 않아, 이후 공부가 진행을 하지 못하는 상황입니다... 무엇이 문제인지와 해결방법에 대해 알려주시면, 감사하겠습니다.
P.S. 요즘 너무 많은 에러를 겪고, 이걸 스스로 해결을 하지 못하는 경우가 너무 많아 의지가 많이 약해지네요.. ㅠㅠ 주말에 리프레시 하고.. 다음주 월요일부터 다시 화이팅하겠습니다 ..
답변 1
0
2024. 02. 03. 21:13
안녕하세요! Junhui Woo님!
실제 프로젝트를 진행 하다 보면, 여러 문제들이 발생하고 이를 해결해 가는 과정과 경험이 매우 중요합니다.
파일럿 프로젝트는 비록 미니멀하게 진행 되지만, 이런 트러블슈팅을 직접 해보면서 문제 해결 능력을 키우는것이 수강생들에게 더 좋은 상황이고, 무난한 기능 구현 보다 더 많은것을 배울수 있게 됩니다.
그러니 포기하지 마시고 좀 더 파이팅해 주세요~ ^^
HBase는 파일럿 프로젝트 환경에서 제일 무겁고 복잡한 놈입니다.
그래서 개인PC의 프로젝트 환경에서 위와같이 셧다운되는 현상은 비일비재합니다.
원인으로는 일시적인 자원부족(CPU, Mem) 현상, 특히 메모리 부족시 셧다운이 가장 잘 일어납니다.
그래서 현재 테스트와 무관한 서버들이 있다면 중지 시켜서 최대한 자원을 확보 후 테스트 하는게 중요합니다.
설명해 주신 상황은 HBase가 자원부족으로 강제 셧다운 된것으로 보이고 Junhui Woo님의 잘못은 없어보이니, 너무 자책하지 마시고요~ ^^;;
불필요한 서버/서비스를 종료후 차분하게 다시한번 테스트 진행해봐 주세요~
(특히 Cloudera Manager Service는 모니터링에만 사용하고, 테스트시에는 중지 시켜 놓으셔야 합니다.)
ps. 주말엔 편안하게 리프레쉬 하고, 꼭~ 월요일부터 테스트 하셔야 합니다! ^^
-빅디 드림
2024. 02. 04. 09:24
자세히 보니 HDFS의 미달과 누락된 복제 블록이 있네요!!??
혹시 복제블록계수를 몇개로 하셨는지 확인 부탁 드립니다.
아래 설정으로 확인해봐 주시고 저사양기준 꼭 1로만 설정 하셔야 합니다.
CM의 홈 메뉴에서 [HDFS]를 선택한 후 [구성]을 선택
검색란에서 “복제 계수”를 입력하고 후 엔터 키를 치면 복제 계수 입력창 표기됨
복제 계수 입력창에 "1"을 입력후 확인
다음으로 HDFS에 미달 및 누락된 복제 블록들을 처리해 줘야 하는데요 다음 명령을 순서대로 해주세요!
Putty로 Server02에 접속
모든 복제계수 1개로 재구성
$ hadoop fs -setrep 1 /
손상된 불록 삭제
$ hdfs fsck / -delete
ps. 아래 URL은 같은 상황의 Q&A 입니다. 참고하세요~ -빅디 드림
https://www.inflearn.com/questions/484306/hdfs-%EB%AF%B8%EB%8B%AC-%EB%B3%B5%EC%A0%9C-%EB%B8%94%EB%A1%9D-%EB%AC%B8%EC%A0%9C