[카테고리:] Monitoring : Zabbix & ETC
-
Kubernetes + Zabbix Integration: Building a Dynamic Monitoring Dashboard with Grafana Variables (Query)
In a Kubernetes environment, monitoring Pod-level network traffic cannot rely on static queries alone. Pods, Hosts, and Groups are constantly changing. This is why leveraging Grafana’s Template Variable feature is essential. The example below is based on a Pod network monitoring dashboard I built using Zabbix + Grafana.You can adapt the same approach to fit…
-
Kubernetes + Zabbix 연동: Grafana 변수(Query)로 만드는 동적 모니터링 대시보드
Kubernetes 환경에서 Pod 단위의 네트워크 트래픽을 모니터링하려면, 단순히 고정된 쿼리만으로는 부족하다. Pod, Host, Group이 계속 바뀌기 때문이다. 그래서 Grafana의 템플릿 변수(Template Variable) 기능을 적극적으로 활용해야 한다. 아래 예시는 내가 실제 운영하고 있는 Zabbix + Grafana 환경에서 구성한 Pod 네트워크 모니터링 대시보드를 기반으로 설명한다.이 글을 참고삼아 응용해서 다양한 환경에서 grafana를 잘 적용할 수 있길 바란다. 1.…
-
How to Monitor Airflow with Zabbix
Background The team I manage is divided into three parts: Cloud Engineers, DevOps, and Data Engineers.One day, a Data Engineer asked for the ability to receive alerts when Airflow DAGs fail. While Airflow’s Web UI can show the status of DAG runs, it doesn’t provide a direct way to trigger alerts.I searched for references, but…
-
Zabbix로 Airflow 모니터링하는 법
배경 내가 책임지고 있는 팀은 Cloud Engineer / DevOps / Data Engineer 세 파트로 나뉘어 있다.어느 날 Data Engineer 팀원이 “Airflow DAG 성공 여부를 알람으로 받고 싶다” 는 니즈를 제기했다. Airflow Web UI에서 DAG 실행 상태는 확인할 수 있지만, 장애 알람으로 바로 받아볼 방법은 없었다.검색해보니 Prometheus 기반 대시보드 예제는 조금 있었지만, 정작 실패 알람에 초점을…
-
“Implementing Web Login Monitoring using Zabbix Web Scenario
Simply checking whether a site is “up” is not enough for reliable monitoring.Even if the login page itself loads, users may still be unable to access the service if the actual login process fails. By using Zabbix’s Web Scenario feature, you can simulate a real login request and verify the response to monitor whether login…
-
Zabbix Web 시나리오로 web login 체크 모니터링 구축하기
단순히 “사이트가 열리냐?”만 확인하는 모니터링은 부족하다.로그인 페이지 자체가 열리더라도 실제 로그인 과정에서 문제가 생기면 사용자는 서비스를 이용할 수 없기 때문이다. Zabbix의 Web 시나리오(Web Scenario) 기능을 이용하면, 로그인 요청을 실제로 날려보고 응답을 검증하여 로그인 성공 여부를 모니터링할 수 있다. 단순히 HTTP에 대한 응답 모니터링은 설정도 어렵지 않을 뿐더러 조금만 검색을 하면 가이드를 해주는 사이트를 쉽게 찾아…
-
Lenovo XCC2 SNMP-Based Power Consumption Monitoring (Zabbix Integration Guide)
In server operations, CPU, memory, and disk health are common monitoring targets—but power consumption is equally critical.A datacenter runs on electricity. Without clear visibility into power usage, it becomes impossible to calculate electricity bills, plan rack capacity, prevent overload, or mitigate failures. Lenovo servers ship with XClarity Controller2 (XCC2), a BMC (Baseboard Management Controller) that…
-
Lenovo XCC2 SNMPv3 기반 전력 사용량 모니터링 (Zabbix 연동 가이드)
서버 운영에서 CPU, 메모리, 디스크 상태 못지않게 중요한 지표가 있다. 바로 전력 사용량(Power Consumption) 이다.데이터센터는 전력으로 움직인다. 전력 소비량을 알지 못하면 전기요금 산정, 랙별 전력 용량 계획, 과부하 방지, 장애 예방이 모두 불가능하다. Lenovo 서버의 XClarity Controller2 (XCC2) 는 BMC(Baseboard Management Controller)로, 원격 관리와 함께 SNMP(Simple Network Management Protocol)를 통해 전력, 온도, 팬 속도 같은…
-
Enterprise Zabbix Extension Pattern: Collecting K8S Pod Network Traffic (via cAdvisor)
By default, Zabbix Kubernetes templates provide only basic metrics such as CPU, memory, disk, node status, and container status. Pod-level network traffic is missing.In many environments, this gap is covered by Prometheus. Here, however, is a case study where Zabbix alone was extended to collect Pod-level RX/TX traffic metrics. This design was built from scratch…
-
엔터프라이즈 Zabbix 확장 패턴: K8S Pod 네트워크 트래픽 수집 (cAdvisor 기반)
일반적으로 Zabbix Kubernetes 템플릿은 CPU, 메모리, 디스크, 노드 상태, 컨테이너 상태 위주의 기본 지표만 제공한다. Pod 단위 네트워크 트래픽은 빠져 있다. 많은 운영 환경에서는 Prometheus를 통해 이 문제를 해결하지만, 여기서는 Zabbix만으로 Pod-level 네트워크 트래픽 수집을 완성한 사례를 공유한다. 이 설계는 레퍼런스가 전혀 없는 상태에서 직접 만든 것으로, 검증된 운영 환경에서 이미 활용 중이다. 설계 개요…