[Linux-ha-jp] 障害発生時に片系ノードのOSからの復旧後の不要nodeの削除について

アーカイブの一覧に戻る

岩崎@サードウェア iwasa****@3ware*****
2010年 4月 12日 (月) 17:45:06 JST


岩崎@サードウェアです

> 両系のheartbeatをstopさせて、DCの系のcib.xmlを修正して、DCではない系の
> cib.xmlを削除して起動すると、ダブリのnodeを削除できますが、出来れば
> コマンドで動的に削除出来ればと思っています。

こちらのご質問の主旨とは異なるかもしれませんが、フェイルを起こして交換し
たノードの復旧方法につきまして、復旧手順についてご確認いただいてはいかが
でしょうか。

Pacemakerでの復旧手順になってしまいますが、Pacemaker_Explainedのドキュメ
ント(4.5.2)に以下のように記載されています。

----
   1.Make sure the old node is completely stopped
   2.Give the new machine the same hostname as the old one
   3.Go to an active cluster node and look up the UUID for the old node
in /var/lib/heartbeat/hostcache
   4.Install the cluster software
   5.Copy ha.cf and authkeys to the new node
   6.On the new node, populate it's UUID using crm_uuid -w and the UUID
from step 2
   7.Start the new cluster node
----

交換したノードのUUIDについては、交換前のUUIDを crm_uuid -wで登録をしなお
してから復旧する手順となっています。Heartbeat2.1.3でも同じような形になる
のではないかと思いましてご回答差し上げました。

残念ながら動的に古いUUIDを削除する方法につきましては、わかりませんが、ご
参考になりますでしょうか。

【参考資料】Pacemaker_Explained
http://www.clusterlabs.org/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/index.html


-- 
----------------------------------------------------------------------
岩崎  登               (株)サードウェア

Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
iwasa****@3ware*****      URL: http://www.3ware.co.jp/
Phone: 047-496-3341      Fax: 047-496-3370



kinos****@tdc***** さんは書きました:
> 木下です。
> 
> heartbeat+drbdで構築した環境で片系のサーバーが障害発生して、
> OSからインストールし直さないといけない状態があったとします。
> 
> 死んだサーバーのstatusは、OFFLINEのままに、OSをインストールして
> heartbeatとdrbdを設定しました。
> 
> 死んだサーバーを再構築して、haertbeatをstartさせた時に、以下のように
> なります。
> 
> [root @ drbd1 ~]# crm_mon
> Defaulting to one-shot mode
> You need to have curses available at compile time to enable console mode
> 
> 
> ============
> Last updated: Mon Apr 12 15:54:11 2010
> Current DC: drbd1.localdomain (4cb1e44a-a722-4012-8a6a-ea2e727d9511)
> 3 Nodes configured.
> 1 Resources configured.
> ============
> 
> Node: drbd1.localdomain (4cb1e44a-a722-4012-8a6a-ea2e727d9511): online
> Node: drbd2.localdomain (282f35cb-5f46-4573-84de-8451d26c49f8): OFFLINE
> Node: drbd2.localdomain (611cf05e-eef9-4faa-8238-d288b15b1b72): online
> 
> Resource Group: group_1
>     IPaddr_10_20_65_50  (heartbeat::ocf:IPaddr):        Started
> drbd2.localdomain
>     drbddisk_2  (heartbeat:drbddisk):   Started drbd2.localdomain
>     Filesystem_3        (heartbeat::ocf:Filesystem):    Started
> drbd2.localdomain
>     pgsql_4     (heartbeat::ocf:pgsql): Started drbd2.localdomain
> [root @ drbd1 ~]#
> 
> 
> drbd2.localdomain(611cf05e-eef9-4faa-8238-d288b15b1b72)が新たにnodeとして
> 追加されたのですが、OFFLINEのnodeの
> drbd2.localdomain(282f35cb-5f46-4573-84de-8451d26c49f8)を削除したいのです
> が、
> heartbeatのサービスを停止せずに削除が出来るのでしょうか?
> 
> 今のところ、何種類かコマンドを実施しましたが、うまくいってません。
> 
> # crm_attribute -D -U drbd2.localdomain -u
> 282f35cb-5f46-4573-84de-8451d26c49f8
> # crm_master -D -i 282f35cb-5f46-4573-84de-8451d26c49f8
> # crm_master -D -U drbd2.localdomain -i
> 282f35cb-5f46-4573-84de-8451d26c49f8
> 
> 
> 両系のheartbeatをstopさせて、DCの系のcib.xmlを修正して、DCではない系の
> cib.xmlを削除して起動すると、ダブリのnodeを削除できますが、出来れば
> コマンドで動的に削除出来ればと思っています。
> 
> ご存知の方、いらっしゃったら教えてください。
> 
> 環境は、以下になります。
> 
> CentOS4.8 2.6.9-89.ELsmp
> heartbeat 2.1.3-3(v2モードで利用)
> drbd 8.3.2-6
> postgresql 8.4.1
> 
> eth0がサービスポート
> eth1が同期ポート
> ttyS0がシリアルの同期ポート
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan





Linux-ha-japan メーリングリストの案内
アーカイブの一覧に戻る