[카테고리:] Monitoring : Zabbix & ETC
-
엔터프라이즈 Zabbix 확장 패턴: K8S Pod 네트워크 트래픽 수집 (cAdvisor 기반)
일반적으로 Zabbix Kubernetes 템플릿은 CPU, 메모리, 디스크, 노드 상태, 컨테이너 상태 위주의 기본 지표만 제공한다. Pod 단위 네트워크 트래픽은 빠져 있다. 많은 운영 환경에서는 Prometheus를 통해 이 문제를 해결하지만, 여기서는 Zabbix만으로 Pod-level 네트워크 트래픽 수집을 완성한 사례를 공유한다. 이 설계는 레퍼런스가 전혀 없는 상태에서 직접 만든 것으로, 검증된 운영 환경에서 이미 활용 중이다. 설계 개요…
-
An Examination of Monitoring Metrics: Part 5 MongoDB
MongoDB is more than a simple document database. It is widely used as a session store, log analytics engine, and even a messaging backbone.To ensure stable operations, monitoring must cover availability, performance, resources, cursors & connections, and network usage.The following are the core metrics that should always be part of a MongoDB monitoring strategy. 1.…
-
An Examination of Monitoring Metrics: Part 4 Elasticsearch
1. Cluster Health Metrics cluster healthOverall cluster status. unassigned shardsNumber of shards not assigned to any node. 2. Resource Metrics Total size of all file stores / Total available size to JVM in all file stores ⚠️ Problem points when Available decreases rapidly Summary jvm_heap_usage_percent node uptime 3. Performance Metrics query latencySearch query response time.…
-
An Examination of Monitoring Metrics: Part 3 Redis
1. Memory Metrics used_memory mem_fragmentation_ratio evicted_keys 2. Performance Metrics instantaneous_ops_per_sec slowlog 3. Connection Metrics blocked_clients connected_clients rejected_connections 4. Network Metrics total_net_input_bytes / total_net_output_bytes 5. Persistence Metrics (Persistence: the property of data being safely preserved beyond memory to disk) rdb_last_bgsave_status aof_last_bgrewrite_status rdb_changes_since_last_save 6. Cache Efficiency Metrics keyspace_hits / keyspace_misses ⚠ Note: The default Redis template for…
-
An Examination of Monitoring Metrics: Part 2 Kafka
In the previous article, we looked at MySQL metrics. This time, we turn to Kafka.In production environments, Kafka has grown beyond being just a simple message queue to become a critical data streaming platform.Therefore, closely monitoring the state of Kafka brokers and clusters is essential for preventing incidents and ensuring stable performance. In this article,…
-
An Examination of Monitoring Metrics: Part 1 MySQL
In production environments, MySQL is more than just a relational database — it serves as the core data store and the foundation of service stability for countless applications.Therefore, closely monitoring MySQL servers and query performance is essential for preventing failures and ensuring optimal performance. Reading MySQL Performance with Zabbix (Summary) 1) InnoDB: Open Files Meaning:…
-
모니터링 지표에 대한 고찰 : 다섯번째 대상 MongoDB
MongoDB는 단순 문서형 데이터베이스를 넘어 세션 저장소, 로그 분석, 메시징까지 다양한 영역에서 활용된다.안정적 운영을 위해서는 가용성, 성능, 리소스, 커서·연결, 네트워크 영역별 주요 지표를 균형 있게 점검해야 한다.아래는 일반적으로 반드시 살펴야 할 핵심 지표들이다. 1. 가용성 지표 uptime 2. 성능 지표 operation latency (total) operation throughput (rate) 3. 리소스 지표 connections memory usage (resident memory) wiredTiger…
-
모니터링 지표에 대한 고찰 : 네번째 대상 Elasticsearch
Elasticsearch는 단순 검색 엔진을 넘어 로그·메트릭·애플리케이션 데이터까지 처리하는 분산 데이터 플랫폼으로 활용된다.따라서 안정적 운영을 위해선 클러스터 상태·리소스 사용·성능·색인 처리 영역별 주요 지표를 주기적으로 점검해야 한다. 1. 클러스터 상태 지표 cluster_health클러스터 전체 상태.Green = 정상, Yellow = 복제본 불일치, Red = 데이터 유실 위험. unassigned_shards할당되지 않은 Shard 개수.0이 정상. 디스크 부족, 노드 다운, 샤드 재배치 지연…
-
모니터링 지표에 대한 고찰 : 세번째 대상 Redis
운영 환경에서 Redis는 단순 캐시를 넘어, 세션 저장소·큐·Pub/Sub 등 핵심 서비스로 활용된다.따라서 성능 저하나 장애를 예방하기 위해선 메모리·네트워크·커넥션·퍼시스턴스 영역별 주요 지표를 주기적으로 점검해야 한다. 1. 메모리 지표 2. 성능 지표 3. 연결 지표 4. 네트워크 지표 5. 퍼시스턴스 지표 : 데이터가 메모리를 넘어 디스크에 안전하게 보존되는 특성 6. 캐시 효율 지표 ✅ 운영 포인트 요약
-
모니터링 지표에 대한 고찰 : 두번째 대상 Kafka
지난 글에서 MySQL 지표를 다뤘다면, 이번에는 Kafka를 살펴본다.운영 환경에서 Kafka는 단순 메시지 큐를 넘어, 데이터 스트리밍 플랫폼으로 중요한 위치를 차지한다.따라서 Kafka 브로커와 클러스터의 상태를 세밀하게 모니터링하는 것은 장애 예방과 성능 보장에 있어 필수적이다. 이번 글에서는 **Grafana 대시보드 (Zabbix 데이터 기반)**에서 제공되는 주요 Kafka 지표들을 중심으로 해석과 의미를 정리해 본다. 1. Offline Partitions Count 👉 운영…