[Linux-ha-jp] drbd が primary にならない

アーカイブの一覧に戻る

H.Nakai nakai****@shink*****
2011年 9月 16日 (金) 14:47:54 JST


中井です。

ありがとうございます。

(2011/09/16 10:58), 岩崎@サードウェア wrote:
>  この症状は、Primaryノードの状態がPrimaryである状態の時にリセットされたり
>  すると出る状況ですね。落とした元PrimaryノードのステータスがOutdatedになって
>  接続が確率していない状態でPrimaryになれないというものです。
> 
>  これはスプリットブレインを回避するためのDRBDの安全装置です。
>  OutdatedはたしかにPrimaryへの強制昇格(--overwrite....オプション)でPrimary
>  にすることができますが、Secondaryノードとの接続が回復することでOutdated状態は
>  解消されます。
> 
はい。私の理解が間違っていないようなので、一安心です。

>  問題はどうして突然落とした状態になっているかというところなのですが、Primary
>  ノードシャットダウン時にデバイスにアクセスしているプロセスがあるとか、
>  リセットしてしまっているとか、落とし方で少し症状が変わる事があるので、その辺
>  いかがでしょうか。
> 
サーバを落とすときの順番でsmbが後ろだったので、smbを先に落とすように
しましたが、やはりときどき、単独で起動しません。
ただ、状況が少し変わりました。
messages の二行目のpeer()でconn( Connected -> Disconnecting ) に
なるのですが、最後の Terminating worker thread で
State change failed にならないときがあるのです。
失敗しないときは、単独でPrimaryで起動します。
失敗すると、単独でPrimaryになれません。
どうも二行目Disconnectingが原因ではないようです。
Terminating worker thread までは同じなんですが。

>  ▼参考資料
>  http://www.drbd.jp/users-guide/s-heartbeat-dopd.html
> 
シリアルケーブル接続は必須でしょうか?

# カーネルモジュールのdrbdがmessagesに出しているんですね。

宜しくお願いします。

-- 
-=-=-=-=  SHINKO ELECTRIC INDUSTRIES CO., LTD.           =-=-=-=-
=-=-=-=-    Research & Development Div.                  -=-=-=-=
-=-=-=-=      Designing Technology Development Dept.     =-=-=-=-
=-=-=-=-  Name:Hisakazu Nakai          TEL:026-263-3922  -=-=-=-=
-=-=-=-=  Mail:nakai****@shink*****      FAX:026-263-4562  =-=-=-=-





Linux-ha-japan メーリングリストの案内
アーカイブの一覧に戻る