[카테고리:] 기술

  • Zabbix K8S 모니터링 : taint 걸린 워커 노드에 Zabbix Proxy만 배포하기

    “복잡한 Zabbix 운영을 더 효율적으로 만들고 싶다면,블로그의 핵심 내용을 집대성한 『Zabbix 엔터프라이즈 최적화 핸드북(PDF)』을 확인해보세요.” https://jikimy.gumroad.com/l/zabbix-master Zabbix로 Kubernetes를 모니터링할 때 일반적으로는 각 노드마다 Zabbix Agent2 pod(또는 DaemonSet)를 올려 호스트 리소스를 수집하고, Zabbix Proxy pod는 cluster 상태를 수집해 Server로 전달한다. 그러나 이미 노드 OS에 zabbix‑agent2가 설치되어 있거나, 관리 정책상 cluster 내부에는 Proxy만 두고 싶은 경우 proxy…

  • Monitoring NVIDIA GPUs with Zabbix

    Ready to streamline your complex Zabbix operations? I’ve distilled the most valuable insights from this blog into one essential guide. Take full control of your environment with the Zabbix 7 Enterprise Optimization Handbook [Mastering Hybrid Infrastructure Monitoring with a Kubernetes First Approach]. 👉 Get your PDF copy here: https://jikimy.gumroad.com/l/zabbixmaster You can install it with apt…

  • Zabbix로 NVIDIA GPU 모니터링 하기

    “복잡한 Zabbix 운영을 더 효율적으로 만들고 싶다면,블로그의 핵심 내용을 집대성한 『Zabbix 엔터프라이즈 최적화 핸드북(PDF)』을 확인해보세요.” https://jikimy.gumroad.com/l/zabbix-master Zabbix에서 NVIDIA GPU를 제대로 모니터링하려면zabbix-agent2-plugin-nvidia-gpu 플러그인이 필요하다. # apt install zabbix-agent2-plugin-nvidia-gpu 로 패키지 설치할 수도 있고.소스 빌드로 설치하는 방법이 있는데. 여기서는 소스 빌드 설치하는 법을 가이드하도록 하겠다.아래와 같은 이유로 소스 빌드 방법 가이드를 제시하는 부분이니 참고 바란다. 패키지로 문제…

  • Kubernetes Packet Drops Caused by nf_conntrack Exhaustion — A Practical Guide for Ubuntu-Based Nodes

    In Kubernetes environments, it’s common to see intermittent timeouts when using NodePort services, calling external APIs, or communicating between internal services.Pods appear healthy, nodes have available resources, and logs look clean—yet specific traffic paths intermittently drop packets for no obvious reason. When this happens repeatedly on Ubuntu-based Kubernetes nodes, the first thing to check is:…

  • Kubernetes 환경에서 nf_conntrack 고갈로 발생하는 패킷 드롭 — Ubuntu 기준 실전 가이드

    Kubernetes 환경에서 NodePort, 외부 API 호출, 내부 서비스 간 통신이 간헐적으로 타임아웃 나는 경우가 있다.Pod도 정상이고, 노드 리소스도 여유 있고, 로그도 깨끗한데 특정 트래픽만 불규칙하게 drop되는 패턴이다. Ubuntu 기반 Kubernetes 노드에서 이런 현상이 반복될 때 가장 먼저 확인해야 하는 부분이 있다. 노드의 nf_conntrack 테이블이 한계에 도달했는지 여부다. Ubuntu는 기본적으로 적당한 conntrack 값을 제공하지만,Kubernetes 환경처럼 NAT이…

  • Analysis of Slow SSH Login — /dev/pts Contention Caused by Accumulated bash Sessions

    Some time ago, I encountered an issue on an Ubuntu server where SSH login became unusually slow or unstable.System resources appeared normal, logs were clean, and nothing pointed to an obvious cause.This post summarizes the analysis I performed back then.It may be useful for anyone facing a similar situation. 1. Symptoms at the Time From…

  • SSH 접속 지연 원인 분석 — 누적된 bash 세션으로 발생한 /dev/pts 경합 문제

    예전에 Ubuntu 서버에서 SSH 접속이 비정상적으로 지연되거나 끊기는 문제를 겪은 적이 있었다.겉으로는 서버 자원도 정상이고 로그도 깨끗했기 때문에 원인 파악이 쉽지 않았다.그 당시 분석했던 내용을 다시 정리해 둔다.비슷한 상황을 겪는 사람들에게 참고가 될 수 있을 것이다. 1. 당시 증상 표면적으로는 원인을 찾기 어렵고 진단 범위도 매우 넓은 상태였다. 2. 처음 확인된 이상 징후 — bash…

  • Service Failure When Internal App Servers Call an L4 VIP — Why You Need a Proxy IP

    In many internal service environments, application servers send traffic to a private L4 VIP.This is common in architectures where an internal load-balancing layer mediates traffic between multiple app servers.As a result, an app server calling its own VIP is a perfectly normal scenario. Yet under certain conditions, this setup can suddenly start dropping traffic.This typically…

  • 내부 App 서버에서 L4 VIP 호출 시 서비스 불가 현상 — 왜 Proxy IP가 필요한가?

    내부 서비스 구조에서 App 서버가 사설 L4 VIP를 바라보는 환경은 흔하다.내부 LB 계층을 통해 여러 App 서버 간 트래픽을 중계하는 구조에서는App 서버가 App 서버의 VIP를 직접 호출하는 일이 자연스럽게 발생한다. 그런데 이 구조에서 특정 상황에서만 트래픽이 drop되는 장애가 발생한다.주로 아래 작업 후 자주 나타난다: 표면적으로는 L4도 정상, App 서버도 정상, Health Check도 정상인데정작 “App 서버…

  • K8S Calico vs Cilium — Beyond a Simple CNI Comparison: A Clash of Networking Philosophies

    K8S Calico vs Cilium Among Kubernetes CNI plugins, the two names compared most often are Calico and Cilium.Both handle Pod-to-Pod communication, but their approaches could not be more different. Calico relies on traditional Linux networking — iptables and BGP — to build a simple and predictable L3 network.Cilium, on the other hand, uses eBPF to…