[카테고리:] 기술

  • PM2-Zabbix Integration Guide (Monitoring PM2 with Zabbix)

    Reference: https://github.com/greatcare/pm2-zabbix The official repository installation generally works,but installation may fail due to Node.js version, global path, or permission issues.This guide documents a field-tested, production-validated setup. The Zabbix XML template is included in the GitHub repository underinstall/zabbix-server/ — download and import it through the Zabbix UI. 1. Overview pm2-zabbix is a Node.js module that sends…

  • PM2-Zabbix 연동 가이드 (Zabbix로 PM2 모니터링)

    참고 문서: https://github.com/greatcare/pm2-zabbix 공식 저장소 기준으로 설치가 가능하지만,Node 버전·경로·권한 문제로 설치가 실패하는 경우가 많다.아래 내용은 실제 운영 환경에서 검증된 실무 적용 버전이다.템플릿(XML)은 위 깃허브의 install/zabbix-server/ 경로에서 다운로드 후 Zabbix UI에서 Import 하면 된다. 1. 개요 pm2-zabbix는 PM2 프로세스 상태를 Zabbix로 전송하는 Node.js 기반 모듈이다.Zabbix의 LLD(저수준 발견)를 이용해 PM2 프로세스를 자동 등록하고,각 프로세스의 상태·CPU·메모리·재시작 횟수, 그리고…

  • Zabbix Database Performance Optimization

    (Practical MySQL Tuning Guide for Real-World Operations) zabbix database performance optimization : When running Zabbix at any real scale, the first bottleneck you’ll hit is the database.Long before CPU or memory become an issue, InnoDB I/O and Zabbix’s internal caching layers start choking the system.Especially in environments collecting hundreds or thousands of metrics every second,…

  • Zabbix DB 성능 최적화 (MySQL 환경 기준 실무 튜닝 가이드)

    Zabbix를 일정 규모 이상으로 운영하다 보면 가장 먼저 한계가 오는 부분이 DB다.CPU, 메모리보다도 InnoDB I/O와 Zabbix의 내부 캐시 구조가 병목을 일으킨다.특히 수백~수천 개 아이템이 초 단위로 들어오는 환경에서는 DB 튜닝이 시스템 전체 안정성을 좌우한다. 이 글은 단일 Zabbix Server + MySQL 조합에서 실무적으로 가장 효과가 컸던 zabbix DB 성능 최적화 기법을 정리한 것이다. 이것과 관련한…

  • Kubernetes Cluster Architecture in an Air-Gapped Environment

    Operating a Kubernetes cluster in a completely disconnected (air-gapped) environment requires more than just installation.All operational components — OS packages, container images, backup and recovery systems, and monitoring — must circulate entirely within the internal network. The following design illustrates a practical Kubernetes cluster architecture applicable to real-world air-gapped environments. 1. Overall Architecture This architecture…

  • 폐쇄망(Air-Gapped) 환경에서의 Kubernetes 클러스터 아키텍처

    외부 인터넷이 완전히 차단된 환경에서도(Air_Gapped) Kubernetes 클러스터를 안정적으로 운영하려면 단순히 클러스터를 설치하는 것만으로는 부족하다.운영체제 패키지, 컨테이너 이미지, 백업·복구, 모니터링 체계까지 내부망 내에서 완전하게 순환하도록 설계해야 한다. 아래의 구성은 실제 폐쇄망(Air-Gapped) 환경에서 적용 가능한 Kubernetes 클러스터 아키텍처의 예시다. 1. 전체 구조 개요 이 아키텍처는 보안 경계를 명확히 나눈 3계층 구조로 구성된다. 외부 사용자는 직접 내부망으로 접근할…

  • Kubernetes Cluster Architecture for Machine Learning (On-Prem)

    50-Node ML Kubernetes Cluster Design This document explains how to design a Kubernetes cluster optimized for machine learning workloads in an on-premises environment combining both CPU and GPU nodes.The core goals are efficient GPU resource utilization and high-performance I/O through a tiered storage architecture. 1. Overview The cluster consists of 50 nodes (15 GPU +…

  • Kubernetes Cluster Architecture for Machine Learning (On-Prem)

    50-node ML Kubernetes Cluster 설계 사례이 문서는 CPU와 GPU 노드가 혼합된 On-Prem 환경에서 ML 워크로드를 위한 Kubernetes Cluster를 어떻게 설계해야 하는지 설명한다.핵심 목표는 GPU 자원의 효율적 활용과 고성능 I/O를 위한 스토리지 계층화다. 1. 전체 구조 개요 클러스터는 총 50노드( GPU 15대 + CPU 35대 )로 구성된다.GPU 노드는 주로 학습(Training), CPU 노드는 전처리, 데이터 적재, 서빙(Serving)용으로…

  • E-Commerce Public Cloud Architecture (No Kubernetes) — Availability, Latency, Security, and Cost Optimization

    Based on the diagram below, this is a reference architecture for running an e-commerce service on the public cloud without Kubernetes. The goals are fourfold: high availability, low latency, strong security, and cost optimization—especially under burst traffic (e.g., flash sales). The examples assume AWS. 1) High-Level Overview Network Traffic Entry Application Security & Observability Endpoints…

  • e-커머스 Public Cloud 아키텍처(비-Kubernetes) — 가용성/응답시간/보안/비용 최적화까지

    아래 다이어그램을 기준으로, 쿠버네티스 없이 운영하는 e-커머스 public cloud 레퍼런스를 정리했다. 목표는 네 가지다: 가용성, 빠른 응답, 철저한 보안, 비용 최적화(특히 버스트 트래픽). AWS 기준으로 설명한 부분이니 참고 바란다. 1) 전체 구조 개요 2) 요청 흐름(두 갈래) 2-1. 정적/캐시 가능 콘텐츠 Client → CloudFront(+WAF) → S3(정적) | ALB(동적 캐시 가능 경로) 2-2. 동적/이벤트성 경로 3)…