Azure上のKubernatesServiceクラスターを最新バージョン1.12.4にアップグレードしました。その後、ポッドとノードがプライベートIPによって通信できなくなったことを突然認識しました。
kubectl get pods -o wide -n kube-system -l component=kube-proxy
NAME READY STATUS RESTARTS AGE IP NODE
kube-proxy-bfhbw 1/1 Running 2 16h 10.0.4.4 aks-agentpool-16086733-1
kube-proxy-d7fj9 1/1 Running 2 16h 10.0.4.35 aks-agentpool-16086733-0
kube-proxy-j24th 1/1 Running 2 16h 10.0.4.97 aks-agentpool-16086733-3
kube-proxy-x7ffx 1/1 Running 2 16h 10.0.4.128 aks-agentpool-16086733-4
ご覧のとおり、ノードaks-agentpool-16086733-0にはプライベートIP10.0.4.35があります。このノードにあるポッドのログを確認しようとすると、次のようなエラーが発生しました。
取得ます。https:// AKS-agentpool-16086733から0:10250 / containerLogs / EMW-SIT / nginxの-SIT-展開-864b7d7588-bw966 / nginxの-SIT tailLines = 5000&タイムスタンプ=本当?:ダイヤルTCP 10.0.4.35:10250:I / oタイムアウト
このノードでもティラー(ヘルム)を取得しました。ティラーに接続しようとすると、クライアントPCから次のようなエラーが発生しました。
shmits-imac:〜andris.shmits01 $ヘルムバージョンクライアント:&version.Version {SemVer: "v2.12.3"、GitCommit: "eecf22f77df5f65c823aacd2dbd30ae6c65f186e"、GitTreeState: "clean"}エラー:転送ポート:接続のアップグレードエラー:バックエンドのダイヤルエラー: tcp 10.0.4.35:10250にダイヤル:I / Oタイムアウト
ポッドとノードがプライベートIPによって接続を失った理由を誰かが知っていますか?
したがって、クラスターを4ノードから2ノードにスケールダウンした後、問題は解消されました。そして、再び2ノードから4ノードにスケールアップした後、すべてが正常に機能し始めました
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加