점검 항목 | 점검 설명 | 리스크레벨 | 솔루션 |
네트워크 딜레이 | HTTP 요청 전송을 통해 인스턴스 네트워크 딜레이가 높은지 점검합니다. 기준은 다음과 같습니다. 600ms 이상이면 네트워크 연결 상태가 좋지 않은 것으로 판단 5s 이상 응답이 없으면 요청이 시간 초과된 것으로 간주 모든 요청에 시간이 초과되면 네트워크 장애로 판단 | 이상 | 로컬 네트워크 문제를 확인하고 구체적인 문제를 수정하십시오. |
| 네트워크 지터 | 인접한 요청 간의 딜레이 값 차이를 구하고 평균값이 네트워크 지터 값입니다. 네트워크 지터 값/네트워크 딜레이 값이 0.15보다 작거나 같으면 네트워크가 안정적이고 0.15 보다 크면 네트워크가 변동이 있음을 나타냅니다. | - |
| 업스트림 대역폭 | 인스턴스 업스트림 대역폭을 계산하기 위해 인스턴스에 데이터 패킷 업로드 | - |
| 다운스트림 대역폭 | 인스턴스에서 데이터 패킷을 다운로드하여 인스턴스의 다운스트림 대역폭 계산 | - |
점검 항목 | 점검 설명 | 리스크레벨 | 솔루션 |
보안 그룹 규칙이 상용 포트의 인터넷 개방 여부 | 보안 그룹으로 인해 인바운드 TCP 프로토콜의 22, 3389 등 상용 포트 요청 금지 여부. | 경고 | 인스턴스 보안 그룹에서 인바운드(Ingress) 규칙의 TCP 프로토콜 포트 22 요청이 금지되어 SSH 로그인이 실패할 수 있습니다. 필요한 포트를 인터넷 개방할 수 있으며, 자세한 사항은 보안 그룹 응용 사례를 참고하십시오. |
점검 항목 | 점검 설명 | 리스크 레벨 | 솔루션 |
CBS의 딜레이가 높은지 여부 | IO 성능 svctm 지표 이상 여부 | 경고 | 이 인스턴스의 CBS는 딜레이가 높은 문제가 있으므로 CBS의 사용에 주의하십시오. |
CBS에 IO HANG 표시 여부 | CBS에 IO HANG 표시 여부 | 경고 | 이 인스턴스의 CBS에 IO HANG 문제가 있으므로 CBS 사용에 주의하시기 바랍니다. |
시스템 디스크 inode 사용량 | CBS의 inode 사용량 100% 도달 여부 | 경고 | CBS 사용에 주의하십시오. 장애 처리는 를 참고하십시오. |
| 시스템 디스크 읽기 전용 여부 | CBS가 현재 읽기 전용 상태인지 여부 | 이상 |
| 시스템 디스크 공간 사용량 | CBS 디스크 사용량 100% 도달 여부 | 경고 |
| 디스크 파티션에 총 시간에 대한 IO 작업이 있는 시간의 백분율 | CBS의 io_util 100% 도달 여부 | 경고 |
점검 항목 | 점검 설명 | 리스크레벨 | 솔루션 |
인스턴스 종료 여부 | 현재 인스턴스의 종료 여부 | 경고 | |
인스턴스 재시작 여부 | 지난 12시간 동안 인스턴스 재시작 여부 | 경고 | 지난 12시간 이내에 인스턴스가 재시작되었습니다. 인스턴스의 실행 상태에 주의하시기 바랍니다. |
인스턴스 커널 크래쉬 | 지난 12시간 동안 인스턴스에 hangtask 존재 여부 | 이상 | 지난 12시간 동안 인스턴스에 hangTask/panic/soft lockup이 있었습니다. 인스턴스의 실행 상태에 주의하십시오. 장애 처리는 커널 및 IO 관련 문제를 참고하십시오. |
| | 최근 12시간 동안 인스턴스가 panic 상태가 되었는지 여부 | 이상 |
| | 지난 12시간 동안 인스턴스에 soft lockup 존재 여부 | 이상 |
점검 항목 | 점검 설명 | 리스크레벨 | 솔루션 |
CPU 사용량 | 지난 12시간 동안 인스턴스 CPU 부하가 높았는지 여부 | 경고 | 비즈니스 병목 현상을 방지하려면 CPU 사용량을 확인하고 즉시 설정 변경하는 것이 좋습니다. 장애 처리는 해당 인스턴스의 운영 체제에 따라 다음 문서를 참고하십시오. |
| 메모리 사용량 | 지난 12시간 동안 인스턴스 메모리 부하가 높았는지 여부 | 경고 |
| 기본 CPU 사용량 | 지난 12시간 동안 인스턴스 CPU 부하가 높았는지 여부 | 경고 |
점검 항목 | 점검 설명 | 리스크레벨 | 솔루션 |
외부 네트워크 IP 연체 여부 | 외부 네트워크 IP의 연체 및 격리 여부 | 이상 | |
외부 네트워크 IP 유무 | 인스턴스에 외부 네트워크 IP 유무 | 경고 | |
외부 네트워크 IP가 DDOS에 의해 차단되는지 여부 | 외부 네트워크 IP가 DDOS에 의해 차단되는지 여부 | 이상 | 인스턴스의 외부 네트워크 IP가 DDOS 공격에 의해 차단되었습니다. |
외부 네트워크 대역폭 사용률 | 지난 12시간 동안 인스턴스 외부 네트워크 Inbound 대역폭이 높았는지 여부 | 경고 | |
| | 지난 12시간 동안 인스턴스 외부 네트워크 대역폭이 높았는지 여부 | 경고 |
| 내부 네트워크 대역폭 사용률 | 지난 12시간 동안 인스턴스 내부 네트워크 Inbound 대역폭이 높았는지 여부 | 경고 |
| | 지난 12시간 동안 인스턴스 내부 네트워크 Outbound 대역폭 이 높았는지 여부 | 경고 |
패킷 손실 상황 | 지난 12시간 동안 인스턴스 속도 제한을 트리거하고 TCP 패킷 손실 존재 여부 | 경고 | |
| | 지난 12시간 동안 인스턴스 속도 제한 트리거로 인한 UDP 패킷 손실 존재 여부 | 경고 |
| | 인스턴스가 지난 12시간 동안 소프트웨어 인터럽트 패킷 손실 트리거 여부 | 경고 |
| 커널 네트워크 사용량 | 지난 12시간 동안 인스턴스 UDP 전송 버퍼가 가득 찼는지 여부 | 경고 |
| | 지난 12시간 동안 인스턴스 UDP 수신 버퍼가 가득 찼는지 여부 | 경고 |
| | 지난 12시간 동안 인스턴스 TCP 전체 연결 큐가 가득 찼는지 여부 | 경고 |
| | 지난 12시간 동안 인스턴스 TCP 요청 오버플로우 유무 | 경고 |
| 연결 수 사용량 | 지난 12시간 동안 인스턴스 연결 수 최댓값 도달 여부 | 경고 |
문제 해결에 도움이 되었나요?