[작성자:] black K

  • 모니터링 지표에 대한 고찰 : 세번째 대상 Redis

    운영 환경에서 Redis는 단순 캐시를 넘어, 세션 저장소·큐·Pub/Sub 등 핵심 서비스로 활용된다.따라서 성능 저하나 장애를 예방하기 위해선 메모리·네트워크·커넥션·퍼시스턴스 영역별 주요 지표를 주기적으로 점검해야 한다. 1. 메모리 지표 2. 성능 지표 3. 연결 지표 4. 네트워크 지표 5. 퍼시스턴스 지표 : 데이터가 메모리를 넘어 디스크에 안전하게 보존되는 특성 6. 캐시 효율 지표 ✅ 운영 포인트 요약

  • 모니터링 지표에 대한 고찰 : 두번째 대상 Kafka

    지난 글에서 MySQL 지표를 다뤘다면, 이번에는 Kafka를 살펴본다.운영 환경에서 Kafka는 단순 메시지 큐를 넘어, 데이터 스트리밍 플랫폼으로 중요한 위치를 차지한다.따라서 Kafka 브로커와 클러스터의 상태를 세밀하게 모니터링하는 것은 장애 예방과 성능 보장에 있어 필수적이다. 이번 글에서는 **Grafana 대시보드 (Zabbix 데이터 기반)**에서 제공되는 주요 Kafka 지표들을 중심으로 해석과 의미를 정리해 본다. 1. Offline Partitions Count 👉 운영…

  • 모니터링 지표에 대한 고찰 : 첫번째 대상 MySQL

    운영 환경에서 MySQL은 단순한 관계형 데이터베이스를 넘어, 수많은 애플리케이션의 핵심 저장소이자 서비스 안정성의 근간을 이룬다.따라서 MySQL 서버와 쿼리 처리 상태를 세밀하게 모니터링하는 것은 장애 예방과 성능 최적화에 있어 필수적이다. Zabbix로 읽는 MySQL 성능: (요약) 1) InnoDB 현재 열린 파일 수 의미: InnoDB가 오픈한 파일 핸들 수(테이블스페이스 등).정상 범위: 보통 수십~수백. innodb_open_files 한도 내면 OK.문제 신호:…

  • Zabbix for Kubernetes Monitoring (Agent2 7.0–7.4)

    Version note (important): Zabbix publishes different Helm repos per version (7.4 / 7.2 / 7.0 LTS).The examples below use 7.4. If your running Zabbix server/templates are on a different version, change <ZBX_VER> accordingly. Repo pattern:https://cdn.zabbix.com/zabbix/integrations/kubernetes-helm/<ZBX_VER>/ 0) Prerequisites 1) Add the repo (pick your version) 2) Dump default values → edit a single file Open zabbix_values.yaml…

  • Zabbix로 Kubernetes 모니터링 구축

    버전 주의(중요): Zabbix는 7.4/7.2/7.0(LTS) 등 버전별로 Helm Repo URL/차트 브랜치가 다름.아래 예시는 7.4 기준이며, 운영 중인 Zabbix 서버/템플릿 버전에 맞춰 <ZBX_VER>만 변경.Repo 패턴:https://cdn.zabbix.com/zabbix/integrations/kubernetes-helm/<ZBX_VER>/ 0) 사전 준비 1) Repo 등록(버전 선택) 2) 기본 values 덤프 → 파일 한 장만 편집 아래 항목을 같은 파일(zabbix_values.yaml) 에서 찾아 환경에 맞게 수정버전별로 다를수 있음 . 아래는 7.4 기준임 3)…

  • Zabbix vs Prometheus : Both Are Excellent

    Zabbix and Prometheus are both more than capable monitoring tools.That said, in Kubernetes / microservices environments many teams lean toward Prometheus for the reasons below. Quick Comparison Area Prometheus Zabbix Collection model HTTP pull (Pushgateway as helper), service discovery Agent/Agent2, SNMP/Trap, IPMI, JMX, HTTP, VMware, etc. Data / query Time-series with PromQL for aggregation and…

  • Zabbix vs Prometheus

    zabbix와 prometheus는 두개 다 충분히 좋은 모니터링 도구이다.보통 사람들은 아래와 같은 이유로 k8s 나 MSA 구조에서는prometheus를 선호한다. 항목 Prometheus Zabbix 수집 모델 HTTP pull(Pushgateway 보조), 서비스 디스커버리 Agent/Agent2, SNMP/Trap, IPMI, JMX, HTTP, VMware 등 데이터/쿼리 시계열 + PromQL로 집계·경향 분석 항목(Item)/트리거 기반 임계치, 비주기 데이터도 용이 알림 Alertmanager (그룹핑/억제/라우팅) 내장 알림/에스컬레이션/원격 커맨드 시각화 Grafana 등…

  • 1화 : 추억

    밤 열한 시. 책상 앞. 전자담배가 느릿하게 깜빡인다.재떨이엔 반쯤 탄 스틱이 눕고,창밖으론 자동차가 도로 금속선을 긁듯 지나간다. 방 안의 공기는 얇다. 이 얇음은 오래전부터 내 곁에 있었다.얇은 벽, 얇은 담요, 얇은 숨, 얇은 밤.얇다는 건 잘 찢어진다는 뜻이지만,잘 겹친다는 뜻이기도 하다. 나는 얇은 것들을 겹쳐서 살아왔다.기억과 이름과 습관을, 한 장 한 장. ​ 이야기는 바다에서…

  • How Ingress Controller Traffic Works on On-Prem K8s with MetalLB — Why externalTrafficPolicy: Cluster Can Blackhole Traffic

    1) Default Behavior (Cluster mode) — Kubernetes Check your current setting 2) VIP Binding in MetalLB L2 3) Failure Scenario 4) Why a Blackhole Even in Cluster Mode? 5) Practical Remediation ✅ Summary

  • MetalLB 기반 온프레미스 K8s에서 Ingress Controller 트래픽 처리 방식

    externalTrafficPolicy: Cluster의 문제 발생 원인 (K8S 환경에서) 1. 기본 동작 (Cluster 모드) – K8S 적용 2. MetalLB L2에서 VIP 바인딩 구조 3. 문제 발생 시나리오 4. 왜 Cluster인데도 블랙홀이 생기는가? 👉 즉, 문제의 본질은 L2 모드의 ARP 테이블 갱신일 확률이 큼 : 이 경우 igress traffic policy를 local로 변경하고 변경하려는 노드에 ingress pod를 띄워도 문제…