[Linux-ha-jp] corosyncのインターコネクト回線の質問

アーカイブの一覧に戻る

renay****@ybb***** renay****@ybb*****
2014年 1月 16日 (木) 09:31:36 JST


コヤマさん

こんにちは、山内です。

> > ご指摘の通りcorosync環境(及び、Heartbeatのv2モード以降)では、シリアルポートでのHA通信は利用できません。
> >
> > インターコネクト回線は専用でも併用でも個人的には回線の負荷状況によりますが、利用可能だと思っています。
> 
> やはり、シリアルポート経由ではインターコネクト回線はできないのですね。
> LANポート利用でも併用されておられるということなので、私もそうしたいと思います。
> 
> corosync-2.3.1
> pacemaker-1.1.10
> 
> host1                            host2
> eth0(192.168.1.7) ---  eth0(192.168.1.254)
> 
> ===== coronosync.conf ============
> totem {
>         version: 2
>         crypto_cipher: none
>         crypto_hash: none
>         secauth: off
>         interface {
>                 ringnumber: 0
>                 bindnetaddr: 192.168.1.0
>                 mcastaddr: 239.255.1.1
>                 mcastport: 5405
>                 ttl: 1
>         }
> }
> 
> logging {
>         fileline: off
>         to_stderr: no
>         to_logfile: yes
>         logfile: /var/log/cluster/corosync.log
>         to_syslog: yes
>         debug: off
>         timestamp: on
>         logger_subsys {
>                 subsys: QUORUM
>                 debug: off
>         }
> }
> 
> 
> quorum {
>         provider: corosync_votequorum
>         expected_votes: 2
> }
> 
> ====================================
> 
> 上記構成で試した所、ちょっとしたトラブルに見舞われています。
> 
> 
> # corosync-cfgtool -s
> Printing ring status.
> Local node ID -1062731513
> RING ID 0
>     id    = 192.168.1.7
>     status    = ring 0 active with no faults
> duo:/etc/corosync #
> 
> 
> 
> # corosync-quorumtool -l
> 
> Membership information
> ----------------------
>     Nodeid      Votes Name
> 3232235783          1 host1.private.com (local)
> 3232236030          1 host2.private.com
> (ホスト名は、書き換えてあります)
> 
> # corosync-cmapctl | grep members
> runtime.totem.pg.mrp.srp.members.3232235783.config_version (u64) = 0
> runtime.totem.pg.mrp.srp.members.3232235783.ip (str) = r(0) ip(192.168.1.7)
> runtime.totem.pg.mrp.srp.members.3232235783.join_count (u32) = 1
> runtime.totem.pg.mrp.srp.members.3232235783.status (str) = joined
> runtime.totem.pg.mrp.srp.members.3232236030.config_version (u64) = 0
> runtime.totem.pg.mrp.srp.members.3232236030.ip (str) = r(0) ip(192.168.1.254)
> runtime.totem.pg.mrp.srp.members.3232236030.join_count (u32) = 1
> runtime.totem.pg.mrp.srp.members.3232236030.status (str) = joined
> 
> ここで問題なのが、
> 
> corosync-cfgtool -s した時の ノードIDは -1062731513 なのに、
> corosync-quorumtool -l した時のノードIDが 3232235783 になっていることです。
> 本家のマニュアルでは、この値は各ホストごとに、同じ値になっていましたが、自分の環境では異なる値が出ている点です。
> これが、設定ミスによるものなのか、それともパッケージに問題があるのかが判断できないでおります。

私の方でも動作環境(corosync2.3.2+PM1.1.11)で確認してみましたが、このIDの相違には問題ないようです。
#私も、ID値の相違については、気にしていませんでした・・・
#気になるようでしたら、確認はしてみますが・・・

> # crm_mon -1
> Last updated: Thu Jan 16 00:18:49 2014
> Last change: Thu Jan 16 00:11:29 2014 by hacluster via crmd on host1.private.com
> Stack: corosync
> Current DC: host1.private.com (3232235783) - partition with quorum
> Version: 1.1.10-1.2-d9bb763
> 2 Nodes configured
> 0 Resources configured
> 
> Online: [ host1.private.com host2.private.com ]
> 
> 
> crm_mon を見る限り、同期がとれていますし、
> crm configure property no-quorum-policy=ignore などのセットアップをActiveで行うと、
> ちゃんと、standbyの方で反映されています。
> 
> 
> もうひとつの問題は、systemctl stop pacemaker.service や systemctl stop corosync.service
> した際に、素直に停止できず、30分~1時間ほどハングアップしてしまう点です。
> これが、systemdによる不具合なのか、pacemakerやcorosyncのパッケージ問題なのかが判断できていません。

実際に事象が起きた、OSのバージョンや動作環境(仮想?実?)はどうなっていますでしょうか?


以上、宜しくお願いいたします。






Linux-ha-japan メーリングリストの案内
アーカイブの一覧に戻る