Mesosスレーブをそのマスターに接続しようとしています。スレーブがマスターに接続しようとするたびに、次のメッセージが表示されます。
I0806 16:39:59.090845 935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384 940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508 940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747 940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868 940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031 940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248 939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated
エラーは次のようです:
E0806 16:39:59.091384 940 socket.hpp:107] fd = 25でシャットダウンに失敗しました:トランスポートエンドポイントが接続されていません[107]
ホストは以下を使用して開始されました:
./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/ --zk=zk://10.129.62.61:2181/mesos --quorum=1
そして奴隷
./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos
ホストと同じVMでスレーブを実行すると、正常に動作します。
私はインターネットで多くの情報を見つけることができませんでした。VirtualBox 5で2つの仮想ボックス(Debian 8.1)を実行しています。ホストはWindows 7です。
編集1:
マスターとスレーブはどちらも専用VMで実行されます。
両方のVMのネクストワークは、ブリッジネットワークを使用して構成されます。
マスターからのifconfig:
eth0 Link encap:Ethernet HWaddr 08:00:27:cc:6c:6e
inet addr:10.129.62.61 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:595886271 (568.2 MiB) TX bytes:362423868 (345.6 MiB)
スレーブからのifconfig:
eth0 Link encap:Ethernet HWaddr 08:00:27:56:83:20
inet addr:10.129.62.49 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:397126834 (378.7 MiB) TX bytes:354116 (345.8 KiB)
編集2:
同様の問題がありました。私のスレーブのログはいっぱいになります
E0812 15:58:04.017990 2193 socket.hpp:107] Shutdown failed on fd=13: Transport endpoint is not connected [107]
私のマスターは
F0120 20:45:48.025610 12116 master.cpp:1083] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins
そしてマスターは死に、新しい選挙が起こり、殺されたマスターはupstart(私はCentos 6ボックスにいる)によって再起動され、潜在的なマスターのプールに追加されます。したがって、選出されたマスターは、マスターノードの周りにデイジーチェーン接続します。マスターとスレーブを何度も再起動しても、マスターの選択から1分以内に問題が再発することはありませんでした。
私の解決策は、このstackoverflowの質問(ありがとう)とgithub gist noteのヒントから来ました。
その要点は/etc/default/mesos-master
、クォーラム番号を指定することです(私の場合は、メソマスターの数に対して正しい必要があります3)。
MESOS_QUORUM=2
私はファイルに同じ情報を持っているので、これは私には奇妙に思えます /etc/mesos-master/quorum
しかし/etc/default/mesos-master
、mesos-mastersとslaves を再起動するためにそれを追加しましたが、問題は再発していません。
これがお役に立てば幸いです。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加