[Linux-ha-jp] rrp_problem_count_thresholdについて

アーカイブの一覧に戻る

野村正 sprts****@gmail*****
2016年 7月 29日 (金) 09:50:09 JST


松島様


いつもお世話になっております。
ご回答いただきありがとうございます。

すでに本番運用中のサーバーで2.3.5-1にバージョンアップをするのはリスクが高いとの判断になり、ご回答いただきましたリンクの内容のパッチを適用し、事象が解消されたことを確認致しました。

ご回答いただき誠にありがとうございました。


以上、よろしくお願い致します。

2016年7月28日 2:18 Takehiro Matsushima <takeh****@gmail*****>:
> 野村さん
>
> お世話になっております、松島です。
>
> 先日Linux-HA JapanコミュニティでリリースされましたPacemaker 1.1.14と、その前のリリース1.1.13で次の操作をして比較しました。
> 1.1.14では、カウンタがDecrementすることを確認しました。
>
> 1. Corosyncで2本の冗長リングを構成
> 2. 2つのノードでクラスタを構成
> 3. 1つのリングのLANケーブルを抜く
> 4. corosync-cfgtool -sで当該インタフェイスがFAULTYになることを確認
> 5. LANケーブルを戻してFAULTYコンディションから自動復帰を確認
> 6. 再び同じLANケーブルを抜く
> 7. カウンタのIncrementを確認後、LANケーブルを戻す
>
> すでに解決されているかもしれませんが、以上お知らせします。
>
> 松島
>
>
> 2016年7月13日 13:44 Takehiro Matsushima <takeh****@gmail*****>:
>> 野村さん
>>
>> お世話になっております、松島と申します。
>>
>> おそらくcorosyncのこのバグが該当するかと思われます。
>> https://github.com/corosync/corosync/commit/8f284b26b3331e1ab252969ba65543e6d9217ab1
>>
>> Corosync 2.3.5で修正されておりますが、2.3.4以前ですとデクリメンタのリセットができないようです。
>> 申し訳ございません、私はcorosync-cfgtool -r以外の方法を知らず、これでリセットできないとなるとお手上げです…。
>>
>> パッチを当ててリビルドすれば解消されるかと思いますが…
>>
>> お力になれず、大変申し訳ございません。
>>
>> 松島
>>
>>
>> 2016年7月13日 10:17 野村正 <sprts****@gmail*****>:
>>> いつもお世話になっております。
>>>
>>> 現在下記のバージョンのPacemaker、Corosyncを使用しております。
>>> pacemaker-1.1.12-1
>>> corosync-2.3.4-1
>>> CentOS6.5
>>>
>>> Corosyncのパラメータは下記を設定しております。
>>> token = 20000
>>> rrp_problem_count_threshold = 10
>>> rrp_problem_count_timeout = 110000
>>>
>>> Heartbeatを2本で構成しており、そのうちの一本が障害の為、rrp_problem_count_threshold値を
>>> 超過し、crm_mon -Arfで確認したところ、FAULTYとなっており
>>> 障害が発生したHeartBeatの復旧後、corosync-cfgtool -sにてリセットをかけました。
>>>
>>> 通常、rrp_problem_count_threshold値以内でHearbeat通信が復旧した場合
>>> rrp_problem_count_timeoutが経過後にDecrementされていく認識ですが
>>> 現在ネットワークに問題があり、1時間に1度の頻度でHeartBeat通信が失敗しますが
>>> 1度FAULTYになってしまったためか、countがDecrementされず、Heartbeatの通信失敗の都度
>>> Incrementされてしまう状態です。
>>>
>>> 上記状態で、Pacemakerのクラスター再起動以外に、正常にcountがDecrementされるように
>>> する方法はございますでしょうか。
>>>
>>>
>>> 以上、よろしくお願い致します。
>>> _______________________________________________
>>> Linux-ha-japan mailing list
>>> Linux****@lists*****
>>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan



Linux-ha-japan メーリングリストの案内
アーカイブの一覧に戻る