[Linux-ha-jp] heartbeat の切り替え時の不具合について

アーカイブの一覧に戻る

Takatoshi MATSUO matsu****@gmail*****
2011年 5月 6日 (金) 13:14:25 JST


高橋さん
松尾です。

ver1モードで使ったことないのであまり自信ないのですが、
ログを眺めていると、server01側のhttpdの起動に失敗し、
その結果仮想IPもstopしたように見えます。

------------------
Apr 27 20:01:23 server01 ResourceManager[3555]: debug: /etc/ha.d/resource.d/IP
addr 10.100.1.82/24/eth0 start done. RC=0  ★仮想IP起動成功
~ 省略 ~
Apr 27 20:01:24 server01 ResourceManager[3943]: debug: /etc/ha.d/resource.d/ht
tpd  start done. RC=1  ★httpd起動失敗 (起動失敗なのにhttpdは動いいるのはおかしい)
~ 省略 ~
Apr 27 20:01:24 server01 ResourceManager[3943]: debug: /etc/ha.d/resource.d/ht
tpd  stop done. RC=0  ★httpd停止成功 (実際には停止しできていなかった?)
~ 省略 ~
Apr 27 20:01:24 server01 ResourceManager[3943]: debug: /etc/ha.d/resource.d/IP
addr 10.100.1.82/24/eth0 stop done. RC=0   ★仮想IP停止成功
------------------

実際にはserver01ではapacheは起動していたとのことなので、
/etc/ha.d/resource.d/httpd (スクリプト?) でどのような処理をやっているか追っかけてみるか、
この時のapache側のログを見てみると起動失敗の理由がわかるのではないでしょうか。

個人的には以下のような事象が起きたのではと予想します

  1. apacheがserver01ですでに起動していた
     - 誤って手動で起動や再起動した等
  2. /etc/ha.d/resource.d/httpd の処理がおかしい
     - httpdのstartやstopの処理の正常性をきちんと判断できていない。

server02再起動後に、server02で自動的にサービスが上がらないのは、
別の要因(設定?)のように思います。

以上ご確認ください。



Linux-ha-japan メーリングリストの案内
アーカイブの一覧に戻る