科学の箱

科学・IT・登山の話題

IT

ESXiで実際のIPの範囲にIPアドレスが表示されない

投稿日:2014年3月26日 更新日:

ESXi上にあるゲストで不定期にネットワークリンクが切断されるという事象が過去1年ほど繰り替えし起きていた。

リンクは突然切断されることが多かった、特に大きな処理が動いていて、ネットワークパフォーマンスが高いということはなかった。ESXi上のゲストは2つであり、問題が発生していないESXiでは10以上のゲストが動いているために、ゲストの数が関係しているということもない。

リンクが切断されると、ESXiからの反応がないときもあるが9割以上はゲストのみのリンクが切断される。2つのゲストは両方が影響を受ける。リンクが切断されれば両方ともつながらないし復旧すれば同時にネットワークは復活する。

ESXi上のイベントには特に問題が発生している様子はない。またWindows上のイベントログにも特に目立ったメッセージはない。

Windows上ではNetwork接続は有効になっている。しかし外にはつながっていない状態である。IPアドレスは固定であるが、DHCPでは169が振られた状態となっている。

物理リンクがひとつ切れたとしてもロードバランシングにより次の物理リンクに引き継がれるはずであるが、その様子はなかった。

復旧させるための手順はいまいちはっきりしなかった。ESXIにも影響が出ているときにはManagement IPを再起動するとおおむね回復する。また場合によってはWindowsにおけるネットワークカードのdiablabe -> enableでも復旧することがあった。

今回問題が再発し、ESXiのmanagement IPの再起動、WindowsにおけるNICの再起動でも普及しなかったが、物理nicのチーミングおよびロードバランシングの設定を見直すことにより原因がわかった可能性が高いのでメモをしておく。

物理nicの一覧を比較すると、”実際のIPの範囲”にIPが出ていないNICがあることに気づいた。

vmnic

ロードバラシングを見てみると、vmnic0とvmnic1の組み合わせてactivenになっていた。このアダプタを観察しているとvmnic0が切断されることがあった。この時点でvmnic1とロードバラシングしていると考えていた。

“実際のIPの範囲”に何も表示されないことが気になり、検索をかけたところIPアドレスが入っていない場合にはそのNICが使われていない可能性があることがわかった。そうだとするとvmnic0が切れたらゲストにつながらなくなることも理解できる。

こちらのページを参考にしてesxtopコマンドでnicの通信を確認してみたところ以下のようになった。

  PORT-ID              USED-BY  TEAM-PNIC DNAME              PKTTX/s  MbTX/s    PKTRX/s
  16777218               vmnic0          - vSwitch0              0.00    0.00       8.01
  16777220               vmnic2          - vSwitch0            204.85    0.54     218.77
  16777221               vmnic3          - vSwitch0              0.00    0.00       0.00
  16777239               vmnic1          - vSwitch0              0.00    0.00       0.00

これによるとvmnic1とvmnic3はまったく使われていないことがわかる。

まず物理NICを認識しているかを確認する。

~ # esxcfg-nics -l
Name    PCI           Driver      Link Speed     Duplex MAC Address       MTU    Description
vmnic0  0000:01:00.00 tg3         Up   1000Mbps  Full   24:b6:fd:f6:16:68 1500   Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet
vmnic1  0000:01:00.01 tg3         Up   1000Mbps  Full   24:b6:fd:f6:16:69 1500   Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet
vmnic2  0000:02:00.00 tg3         Up   1000Mbps  Full   24:b6:fd:f6:16:6a 1500   Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet
vmnic3  0000:02:00.01 tg3         Up   1000Mbps  Full   24:b6:fd:f6:16:6b 1500   Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet

vswitchの構成を確認する。主にVLANID.

~ # esxcfg-vswitch -l
Switch Name      Num Ports   Used Ports  Configured Ports  MTU     Uplinks
vSwitch0         128         9           128               1500    vmnic0,vmnic2

  PortGroup Name        VLAN ID  Used Ports  Uplinks
  Management Network    4095     1           vmnic0,vmnic2
  VM Network            4095     4           vmnic0,vmnic2

メタ情報

inarticle



メタ情報

inarticle



-IT

執筆者:


  1. nkk より:

    私も同現象が発生し悩んでおりますので対策方法をご教授いただきたいです。

    • admin より:

      nkk様

      連絡が遅くなりました。この事象はESXi上でNICのドライバであるtg3を最新版にすることで解消できました。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Chefでhelloを実行してみる。

前提 Rubyがインストールされている VagrantがインストールされていてVirtualboxが起動している Chef, Knifeがインストールされている 手順 knifeコマンドを使ってcoo …

no image

vagrant 1.6.4でsshインタフェースにprivate_networkを指定するとエラーになる

vagrantではprivate networkを指定して、sshからアクセスできる。 vagrant1.6.4 Windows版ではprivate networkを指定するとなぜかエラーがでる。 c …

no image

muninのインストールと初期設定

インストール yum経由でインストールする。epelを有効にしておく。 yum –enablerepo=epel install munin ノードもインストールしておく。 yum –enable …

no image

Global Catalogサーバー

Active Directory環境ではDomainの情報がドメインコントローラ間でやり取りされる。すべての情報をやり取りすることは非効率である。その理由としては、 頻繁に使われる情報は決まっているこ …

no image

gem installでzlibが見つからないエラー

gem installでzlibが見つからないとのエラー。どうやらzlibをインストールするまえにrubyをインストールするとリンクがうまくいかないよう。 $ gem install xxxxxx E …

2014年3月
« 2月   4月 »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

side bar top



アーカイブ

カテゴリー