KubernetesのPod配置状況をNodeごとにわけて表示する方法
解決する悩み
kubectl get pod -o wide --all-namespaces
を実行したとき、Podの配置状況を把握しにくいという悩みを解決します。NodeごとにどのPodが配置されているかをスムーズに確認できる方法を紹介します。
背景
私個人のWEBサイト運用環境では、GCP の Kubernetes クラスタで Spot VM を活用しています。Spot VMはコスト削減に有効ですが、時間制限付きなので再起動が頻繁に発生します。ノードが再起動(ダウン)しても、多くの場合はPodも正常に起動してくれるので殆ど問題にならないのですが、それでも数ヶ月に1回くらいは、変に詰まったりしてリカバリ作業をすることがあります。(急ぎでなければ、次のダウンタイムまで放っておくこともありますのですけどね)
このため、トラブルが起きたときにNodeごとのPod配置状況を簡単に確認する必要があります。ダラダラと表示される Pod 一覧を見ていてもいいのですが、Nodeごとに表示したいと思うこともしばしばありました。
そのため、手軽にNode単位で確認できるコマンドがあれば、運用の効率化が図れると考えました。
1. kubectl get pod
だけではわかりにくい理由
Kubernetesのkubectl get pod
コマンドは、Podの一覧を表示するための便利なコマンドです。しかし、以下の課題があります:
- 情報が多すぎる:
-o wide
オプションで詳細情報を表示しても、全てのPodが一列に並び、Nodeごとにグループ化されていません。 - Node単位の視認性が低い:トラブルシューティング時に、どのNodeにどのPodが配置されているかを瞬時に把握するのが難しい。
2. 必要な情報だけを表示するカスタムカラムの活用
kubectl
には、出力をカスタマイズできる -o custom-columns
オプションがあります。この機能を使うことで、必要な情報だけを抽出し、RESTARTS
など不要な列を省略できます。
特にRESTARTS
列は、表記の揺れ(例: 19 (92m ago)
など)があり、区切り文字がズレてしまうことがあります。そのため、手っ取り早く表示するために非表示にすることにしました。
コマンド例
kubectl get pod -A -o custom-columns="NAMESPACE:.metadata.namespace,NAME:.metadata.name,READY:.status.containerStatuses[*].ready/.status.containerStatuses[*].restartCount,STATUS:.status.phase,AGE:.metadata.creationTimestamp,IP:.status.podIP,NODE:.spec.nodeName"
出力例
NAMESPACE NAME READY STATUS AGE IP NODE
default example-pod-1 1/1 Running 2024-12-12T08:00Z 10.244.0.1 node1
kube-system kube-dns-abcdef 3/3 Running 2024-12-11T07:50Z 10.244.0.10 node2
3. NodeごとにPodをグループ化して表示する方法
情報が整理されても、全Podが一列に並んだままでは視認性が低いです。この課題を解決するために、awk
を使って出力をNode単位にグループ化します。
ワンライナーでNode単位にグループ化
以下のコマンドを実行すると、NodeごとにPodがグループ化されて表示されます:
kubectl get pod -A -o custom-columns="NAMESPACE:.metadata.namespace,NAME:.metadata.name,READY:.status.containerStatuses[*].ready/.status.containerStatuses[*].restartCount,STATUS:.status.phase,AGE:.metadata.creationTimestamp,IP:.status.podIP,NODE:.spec.nodeName" | awk 'NR==1 {header=$0; next} {node=$NF; pods[node]=(node in pods ? pods[node] : header "\n") $0 "\n"} END {for (node in pods) print "\n=== NODE: " node " ===\n" pods[node]}'
コマンドの構造(解説)
-
kubectl get pod
部分kubectl get pod -A -o custom-columns="..."
**`A`**: すべての名前空間からPod情報を取得します。 **`o custom-columns`**: 出力するカラムを指定します。ここでは以下のカラムを定義しています: `NAMESPACE`: Podが所属する名前空間。 `NAME`: Podの名前。 `READY`: 各Pod内のコンテナが稼働している数と、合計コンテナ数(例: `1/1`)。 `STATUS`: Podのステータス(`Running`, `Pending`, など)。 `AGE`: Podが作成された日時。 `IP`: PodのIPアドレス。 `NODE`: Podが配置されているノード名。 の部分だけで、指定されたカラムの一覧を取得できます。
-
awk
部分
awk 'NR==1 {header=$0; next} {node=$NF; pods[node]=(node in pods ? pods[node] : header "\n") $0 "\n"} END {for (node in pods) print "\n=== NODE: " node " ===\n" pods[node]}'
NR==1 {header=$0; next}
:- 最初の行(ヘッダー行)を
header
変数に保存し、次の行にスキップします。 - これにより、ヘッダーを各ノードごとのデータの先頭に挿入する準備をします。
- 最初の行(ヘッダー行)を
node=$NF
:$NF
は現在の行の最後のフィールド(ここではNODE
列)を指します。node
変数にノード名を格納します。
pods[node]=(node in pods ? pods[node] : header "\n") $0 "\n"
:- ノードごとにデータをグループ化します。
- 初めてのノードの場合は
header
(ヘッダー行)を追加し、すでに存在するノードにはPod情報を追加します。
END {for (node in pods) print "\n=== NODE: " node " ===\n" pods[node]}
:- 最後に
pods
配列をループして、ノード名とそのノードに属するPod情報を出力します。
- 最後に
出力例
=== NODE: node1 ===
NAMESPACE NAME READY STATUS AGE IP NODE
default example-pod-1 1/1 Running 2024-12-12T08:00Z 10.244.0.1 node1
=== NODE: node2 ===
NAMESPACE NAME READY STATUS AGE IP NODE
kube-system kube-dns-abcdef 3/3 Running 2024-12-11T07:50Z 10.244.0.10 node2
4. 再利用のために .zshrc
に登録する方法
このコマンドを毎回入力するのは面倒なので、.zshrc
に関数として登録することで再利用性を高めます。
.zshrc
に関数を追加
以下の内容を .zshrc
に追記してください:
bash
コードをコピーする
# ノードごとにPodをグループ化して表示する関数
group_pods_by_node() {
kubectl get pod -A -o custom-columns="NAMESPACE:.metadata.namespace,NAME:.metadata.name,READY:.status.containerStatuses[*].ready/.status.containerStatuses[*].restartCount,STATUS:.status.phase,AGE:.metadata.creationTimestamp,IP:.status.podIP,NODE:.spec.nodeName" | awk 'NR==1 {header=$0; next} {node=$NF; pods[node]=(node in pods ? pods[node] : header "\n") $0 "\n"} END {for (node in pods) print "\n=== NODE: " node " ===\n" pods[node]}'
}
設定を反映
ターミナルで以下を実行して .zshrc
を反映します:
source ~/.zshrc
使い方
登録後、以下のコマンドで簡単にNodeごとのPod配置状況を確認できます:
group_pods_by_node
5. Kubernetesトラブル対応時の活用例
Node再起動やトラブル発生時に、このコマンドを使うと以下のような利点があります:
- 停止したNodeの確認:停止中のNodeに配置されていたPodを特定可能。
- Podの再配置確認:別のNodeに再スケジュールされたPodの状態を迅速に確認。
まとめ
kubectl
コマンドの基本的な使い方に加え、NodeごとにPod配置状況を整理する手法を紹介しました。ワンライナーや関数化により、日常業務での利便性が向上します。トラブル対応や運用効率化のために、ぜひ活用してみてください!