작성
·
568
1
좋은 강의 올려주셔서 정말 감사합니다.
spring boot, jvm을 모니터링하고 있는데 system cpu, proess cpu 같은 치수들을
보면서 무엇이 위험한 수치이고 어떻게 대응해야 하는 지 감이 오지 않아서
제 나름대로 공식 문서나 구글링을 찾아보곤 하는데 혹시 어떤 문서를 읽는 것이 좋은 가요?
예를 들면 cpu 사용량이 0.006정도 되는데 얼마의 치수가 되면 위험하고 대응해야 하는 지 궁금합니다...
읽어주셔서 정말 감사합니다.
답변 1
1
안녕하세요, kbm6009 님. 공식 서포터즈 y2gcoder 입니다.
장애 감지 기준에 대한 질문이네요.
어떤 상황이 장애 인지 아닌지 판단하기 위한 기준은 과거의 기록, 즉 패턴입니다. 이런 경험에 기반하여 판단할 수 밖에 없습니다.
물론 어플리케이션을 틀면 메모리 점유율이 지속적으로 증가한다거나 하는 명백한 문제가 발생하면 전체적인 메모리 누수를 찾는 등의 조치를 취해야 합니다. 그러나 일반적으로 특정 시간대에 CPU/메모리 사용량이 어느정도를 유지한다 라는 기록이 있다면, 이 패턴이 깨지는 순간이 장애가 발생했다고 볼 수 있습니다.
트래픽의 경우도 보통 시간대별로 일정한 양상을 보입니다. 다만 트래픽은 이벤트 등의 요인으로 일시적으로 몰리는 경우가 있습니다. 그래서 장애여부를 판단하기 위해선 종합적인 데이터나 비지니스 상황을 모두 고려해야 합니다.
감사합니다.