ZabbixでNVIDIA GPUを正しくモニタリングするためには、
zabbix-agent2-plugin-nvidia-gpu プラグインが必要になる。
このプラグインは以下の方法で導入できる。
apt install zabbix-agent2-plugin-nvidia-gpuによるパッケージインストール- ソースコードからのビルド
本記事では ソースビルドによるインストール方法 をガイドする。
パッケージで問題なく導入できている場合は、本記事の手順を実施する必要はない。
ソースビルドを採用する理由
- パッケージインストールで問題が発生している環境向けのガイドであるため
- パッケージ版は、Zabbixリポジトリが指定した特定の OS・glibc・NVML バージョン に対して
固定コンパイルされたバイナリを使用している
そのため、OSバージョンやドライバ構成が異なると互換性問題が発生しやすい
一方、ソースビルドでは実際のノード環境の NVML・glibc を基準に直接コンパイルするため、
OS差異やドライバ差異の影響を受けにくく、より安定して動作する
Tip
特定のドライバ/カーネル構成
(Ubuntu 22.04 + Driver 55x / 57x + CUDA 12.x など)では、
Zabbix Agent2 が NVIDIA プラグインのロード直後に終了してしまう既知の不具合が存在する。
以下は、実際に報告されている公式イシュートラッカーの一例である。
(ZBX-25821 — agent2 がプラグインロード中にクラッシュ)
https://support.zabbix.com/browse/ZBX-25821
Tip
OSの種類によってコマンドやパスが若干異なる場合があるため、
必要に応じて環境に合わせて調整すること。
(第1回)NVIDIA GPU プラグインのソースインストール
インストール環境
- OS: Ubuntu 22.04
- Zabbix: 7.4
- GPU: NVIDIA GeForce RTX 4080 SUPER
- NVIDIA Driver:事前にインストール済み
- Zabbix Agent2:事前にインストール済み
1. Go 1.23 のインストール(未導入、または 1.23 未満の場合は必須)
cd /usr/local/src
wget https://go.dev/dl/go1.23.2.linux-amd64.tar.gz
rm -rf /usr/local/go
tar -C /usr/local -xzf go1.23.2.linux-amd64.tar.gz
echo 'export PATH=$PATH:/usr/local/go/bin' >> ~/.bashrc
source ~/.bashrc
go version # → 1.23.x が表示されれば正常
2. ビルドツールのインストール
apt update
apt install -y build-essential
3. NVIDIA GPU プラグインソースのダウンロード
cd /usr/local/src
wget https://cdn.zabbix.com/zabbix-agent2-plugins/sources/nvidia-gpu/zabbix-agent2-plugin-nvidia-gpu-7.4.4.tar.gz
tar xvf zabbix-agent2-plugin-nvidia-gpu-7.4.4.tar.gz
cd zabbix-agent2-plugin-nvidia-gpu-7.4.4
4. プラグインのビルド
CGO_ENABLED=1 go build -o zabbix-agent2-plugin-nvidia-gpu
5. プラグインのインストール
mkdir -p /usr/libexec/zabbix
install -m 0755 zabbix-agent2-plugin-nvidia-gpu /usr/libexec/zabbix/zabbix-agent2-plugin-nvidia-gpu
6. プラグイン設定ファイルの配置
install -m 0644 nvidia.conf /etc/zabbix/zabbix_agent2.d/plugins.d/nvidia.conf
⚠ 注意
サーバ環境によってプラグインディレクトリのパスが異なる場合があるため、/etc/zabbix/zabbix_agent2.d/plugins.d のパスは必ず自身の環境で確認すること。
7. 設定ファイルの編集
vi /etc/zabbix/zabbix_agent2.d/plugins.d/nvidia.conf
以下の2行が 必ず 設定されている必要がある。
Plugins.NVIDIA.System.Path=/usr/libexec/zabbix/zabbix-agent2-plugin-nvidia-gpu
Plugins.NVIDIA.Timeout=10
なぜ必要か
Path=
Agent2 が GPU プラグインのバイナリの場所を認識するためTimeout=
NVML の応答が遅延した際に Agent2 がタイムアウトで終了するのを防ぐため
つまり、
Agent2 がプラグインを正常にロード・実行するために必須の設定項目 である。
8. zabbix_agent2.conf の設定確認
以下が設定されていることを確認する。
Include=/etc/zabbix/zabbix_agent2.d/*.conf
Include=/etc/zabbix/zabbix_agent2.d/plugins.d/*.conf
9. Zabbix Agent の再起動
systemctl restart zabbix-agent2
systemctl status zabbix-agent2
以下のように正常に起動していれば、プラグイン導入は成功である。

まとめ
Zabbix Web UI 上で
「Nvidia by Zabbix agent 2」テンプレート を適用したホストを作成し、
その後 Grafana ダッシュボードを作成すれば完了である。
プラグインが正常に起動し、Zabbix 側で GPU メトリクスの収集が確認できれば、
以降の Grafana ダッシュボード構成は
既存の Zabbix–Grafana 連携手順と同一である。
本記事では GPU プラグインの導入手順にのみ焦点を当てており、
可視化構成については既存のシリーズで十分に解説しているため、ここでは割愛する。
Grafana GPU ダッシュボード適用例

🛠 마지막 수정일: 2025.12.15
💡 お困りですか?
Zabbix、Kubernetes、各種オープンソースインフラの構築・運用・最適化・障害解析が必要であれば、いつでもご連絡ください。
📧 メール: jikimy75@gmail.com
💼 サービス: 導入支援 | 性能チューニング | 障害解析コンサルティング
답글 남기기
댓글을 달기 위해서는 로그인해야합니다.