[카테고리:] Monitoring : Zabbix & ETC

  • PM2-Zabbix Integration Guide (Monitoring PM2 with Zabbix)

    Reference: https://github.com/greatcare/pm2-zabbix The official repository installation generally works,but installation may fail due to Node.js version, global path, or permission issues.This guide documents a field-tested, production-validated setup. The Zabbix XML template is included in the GitHub repository underinstall/zabbix-server/ — download and import it through the Zabbix UI. 1. Overview pm2-zabbix is a Node.js module that sends…

  • PM2-Zabbix 연동 가이드 (Zabbix로 PM2 모니터링)

    참고 문서: https://github.com/greatcare/pm2-zabbix 공식 저장소 기준으로 설치가 가능하지만,Node 버전·경로·권한 문제로 설치가 실패하는 경우가 많다.아래 내용은 실제 운영 환경에서 검증된 실무 적용 버전이다.템플릿(XML)은 위 깃허브의 install/zabbix-server/ 경로에서 다운로드 후 Zabbix UI에서 Import 하면 된다. 1. 개요 pm2-zabbix는 PM2 프로세스 상태를 Zabbix로 전송하는 Node.js 기반 모듈이다.Zabbix의 LLD(저수준 발견)를 이용해 PM2 프로세스를 자동 등록하고,각 프로세스의 상태·CPU·메모리·재시작 횟수, 그리고…

  • Zabbix Database Performance Optimization

    (Practical MySQL Tuning Guide for Real-World Operations) zabbix database performance optimization : When running Zabbix at any real scale, the first bottleneck you’ll hit is the database.Long before CPU or memory become an issue, InnoDB I/O and Zabbix’s internal caching layers start choking the system.Especially in environments collecting hundreds or thousands of metrics every second,…

  • Zabbix DB 성능 최적화 (MySQL 환경 기준 실무 튜닝 가이드)

    Zabbix를 일정 규모 이상으로 운영하다 보면 가장 먼저 한계가 오는 부분이 DB다.CPU, 메모리보다도 InnoDB I/O와 Zabbix의 내부 캐시 구조가 병목을 일으킨다.특히 수백~수천 개 아이템이 초 단위로 들어오는 환경에서는 DB 튜닝이 시스템 전체 안정성을 좌우한다. 이 글은 단일 Zabbix Server + MySQL 조합에서 실무적으로 가장 효과가 컸던 zabbix DB 성능 최적화 기법을 정리한 것이다. 이것과 관련한…

  • Kubernetes + Zabbix Integration: Building a Dynamic Monitoring Dashboard with Grafana Variables (Query)

    In a Kubernetes environment, monitoring Pod-level network traffic cannot rely on static queries alone. Pods, Hosts, and Groups are constantly changing. This is why leveraging Grafana’s Template Variable feature is essential. The example below is based on a Pod network monitoring dashboard I built using Zabbix + Grafana.You can adapt the same approach to fit…

  • Kubernetes + Zabbix 연동: Grafana 변수(Query)로 만드는 동적 모니터링 대시보드

    Kubernetes 환경에서 Pod 단위의 네트워크 트래픽을 모니터링하려면, 단순히 고정된 쿼리만으로는 부족하다. Pod, Host, Group이 계속 바뀌기 때문이다. 그래서 Grafana의 템플릿 변수(Template Variable) 기능을 적극적으로 활용해야 한다. 아래 예시는 내가 실제 운영하고 있는 Zabbix + Grafana 환경에서 구성한 Pod 네트워크 모니터링 대시보드를 기반으로 설명한다.이 글을 참고삼아 응용해서 다양한 환경에서 grafana를 잘 적용할 수 있길 바란다. 1.…

  • How to Monitor Airflow with Zabbix

    Background The team I manage is divided into three parts: Cloud Engineers, DevOps, and Data Engineers.One day, a Data Engineer asked for the ability to receive alerts when Airflow DAGs fail. While Airflow’s Web UI can show the status of DAG runs, it doesn’t provide a direct way to trigger alerts.I searched for references, but…

  • Zabbix로 Airflow 모니터링하는 법

    배경 내가 책임지고 있는 팀은 Cloud Engineer / DevOps / Data Engineer 세 파트로 나뉘어 있다.어느 날 Data Engineer 팀원이 “Airflow DAG 성공 여부를 알람으로 받고 싶다” 는 니즈를 제기했다. Airflow Web UI에서 DAG 실행 상태는 확인할 수 있지만, 장애 알람으로 바로 받아볼 방법은 없었다.검색해보니 Prometheus 기반 대시보드 예제는 조금 있었지만, 정작 실패 알람에 초점을…

  • “Implementing Web Login Monitoring using Zabbix Web Scenario

    Simply checking whether a site is “up” is not enough for reliable monitoring.Even if the login page itself loads, users may still be unable to access the service if the actual login process fails. By using Zabbix’s Web Scenario feature, you can simulate a real login request and verify the response to monitor whether login…

  • Zabbix Web 시나리오로 web login 체크 모니터링 구축하기

    단순히 “사이트가 열리냐?”만 확인하는 모니터링은 부족하다.로그인 페이지 자체가 열리더라도 실제 로그인 과정에서 문제가 생기면 사용자는 서비스를 이용할 수 없기 때문이다. Zabbix의 Web 시나리오(Web Scenario) 기능을 이용하면, 로그인 요청을 실제로 날려보고 응답을 검증하여 로그인 성공 여부를 모니터링할 수 있다. 단순히 HTTP에 대한 응답 모니터링은 설정도 어렵지 않을 뿐더러 조금만 검색을 하면 가이드를 해주는 사이트를 쉽게 찾아…