renay****@ybb*****
renay****@ybb*****
2011年 5月 23日 (月) 10:32:52 JST
高橋さん こんにちは、メイトリックスの山内です。 postgreSQL自体にstartがかかっている気配がないまま、リソースの移動処理(状態遷移)が終わっていますので、何かcib情報に問題があると思われます。 /var/lib/heartbeat/pengine/pe-warn-25.bz2 のファイルがあると少しわかるかも知れません。 Heartbeatバージョンが2.1.3と古めなので、状態遷移の作成にxxx_ech_db01サーバの消失(ログでいうLOST)が関連しているかも知れません。 以上、よろしく御願いいたします。 --- On Fri, 2011/5/20, takahasi hideo <hideo_tk960****@hotma*****> wrote: > 高橋と申します。 > > heartbeat、DRBD、postgresqlを使用して、 > データベースクラスタサーバを構築しております > > xxx_ech_db01サーバ (master)障害が発生時、 > xxx_ech_db02サーバ(slave)にフェイルオーバーを行うように設定しております。 > > xxx_ech_db01サーバ障害(postgresにて処理に負荷が発生し、postgresのサービスが異常終了)が発生した時に、 > xxx_ech_db02サーバにフェイルオーバーされていたのですが(masterにはなっており、mountもされていました) > がpostgresのサービスが起動しておりませんでした。 > > サーバ構成は以下になります。 > 2台とも同じものとなっております > OS RedHat ES4.0 > > ◆カーネルバージョン: > Linux 2.6.9-67.ELsmp #1 SMP Wed Nov 7 13:56:44 EST 2007 x86_64 x86_64 x86_64 GNU/Linux > heartbest 2.1.3 > DRBD 0.7.2 > postgres8.2.3 > > 前々回にもxxx_ech_db01サーバに障害(postgresにて処理に負荷が発生し、postgresのサービスが異常終了)が発生した時は、 > xxx_ech_db02サーバにフェイルオーバーが、 > 実行され、postgresのサービスも正常に起動しておりました。 > > syslogを確認いたしましたところ、 > 前々回は以下のログが出力されておりましたが、 > 今回のログには出力されておりませんでした。 > > tengine: [5011]: info: send_rsc_command: Initiating action 34: start pgsql0_start_0 on ech-db02 > crmd: [18567]: info: do_lrm_rsc_op: Performing op=pgsql0_start_0 key=34:0:0:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx) > lrmd: [18564]: info: rsc:pgsql0: start > > 原因が分からず困っております。 > ほかに必要な情報はございますでしょうか? > > cib.xmlのファイル設定は以下となります。 > <cib generated="true" admin_epoch="0" have_quorum="true" ignore_dtd="false" num_peers="2" cib_feature_revision="2.0" crm_feature_set="2.0" epoch="106" num_updates="3" cib-last-written="Fri Mar 18 04:25:44 2011" ccm_transition="2" dc_uuid="xxxxxx-fb58-4b77-8755-aee23da6a63d"> > <configuration> > <crm_config> > <cluster_property_set id="cib-bootstrap-options"> > <attributes> > <nvpair id="cib-bootstrap-options-dc-version" name="dc-version" value="2.1.4-fb84f606a422 tip"/> > </attributes> > </cluster_property_set> > <cluster_property_set id="default_cluster_properties" score="10"> > <attributes> > <nvpair id="default-sticky" name="default_resource_stickiness" value="INFINITY"/> > </attributes> > </cluster_property_set> > </crm_config> > <nodes> > <node id="XXXXXXXX-ff8a-429a-81c2-db36ebb522e7" uname="xxx-ech-db01" type="normal"/> > <node id="XXXXXXXX-fb58-4b77-8755-aee23da6a63d" uname="xxx-ech-db02" type="normal"/> > </nodes> > <resources> > <master_slave id="ms-drbd0"> > <meta_attributes id="ma-ms-drbd0"> > <attributes> > <nvpair id="ma-ms-drbd0-1" name="clone_max" value="2"/> > <nvpair id="ma-ms-drbd0-2" name="clone_node_max" value="1"/> > <nvpair id="ma-ms-drbd0-3" name="master_max" value="1"/> > <nvpair id="ma-ms-drbd0-4" name="master_node_max" value="1"/> > <nvpair id="ma-ms-drbd0-5" name="notify" value="yes"/> > <nvpair id="ma-ms-drbd0-6" name="globally_unique" value="false"/> > </attributes> > </meta_attributes> > <primitive id="drbd0" class="ocf" provider="heartbeat" type="drbd"> > <instance_attributes id="ia-drbd0"> > <attributes> > <nvpair id="ia-drbd0-1" name="drbd_resource" value="drbd0"/> > </attributes> > </instance_attributes> > </primitive> > </master_slave> > <group id="postDb"> > <primitive class="ocf" provider="heartbeat" type="IPaddr" id="iPaddr"> > <instance_attributes id="ia_ipaddr"> > <attributes> > <nvpair id="ia_ipaddr" name="ip" value="192.168.XX.XXX"/> > </attributes> > </instance_attributes> > </primitive> > <primitive class="ocf" provider="heartbeat" type="Filesystem" id="fs0"> > <meta_attributes id="ma-fs0"> > <attributes/> > </meta_attributes> > <instance_attributes id="ia-fs0"> > <attributes> > <nvpair id="ia-fs0-1" name="fstype" value="ext3"/> > <nvpair id="ia-fs0-2" name="directory" value="/data"/> > <nvpair id="ia-fs0-3" name="device" value="/dev/drbd0"/> > </attributes> > </instance_attributes> > </primitive> > <primitive class="ocf" provider="heartbeat" type="pgsql" id="pgsql0"> > <instance_attributes id="ia-pgsql0"> > <attributes> > <nvpair id="ia-pgsql0-1" name="pgctl" value="/usr/local/pgsql/bin/pg_ctl"/> > <nvpair id="ia-pgsql0-2" name="psql" value="/usr/local/pgsql/bin/psql"/> > <nvpair id="ia-pgsql0-3" name="pgdata" value="/data/pgsql/data/"/> > <nvpair id="ia-pgsql0-4" name="pgdba" value="postgres"/> > <nvpair id="ia-pgsql0-6" name="logfile" value="/var/log/postgresql/postgresql_log"/> > </attributes> > </instance_attributes> > <operations> > <op id="apPostgreSQLDB_start" name="start" timeout="60s" on_fail="fence"/> > <op id="apPostgreSQLDB_monitor" name="monitor" interval="30s" timeout="60s" on_fail="fence"/> > <op id="apPostgreSQLDB_stop" name="stop" timeout="60s" on_fail="fence"/> > </operations> > </primitive> > </group> > </resources> > <constraints> > <rsc_location id="rsc_location_group_1" rsc="ms-drbd0"> > <rule id="prefered_location_group_1" role="Master" score="100"> > <expression id="prefered_location_group_1_expr" attribute="#uname" operation="eq" value="xxx-ECH-DB01"/> > </rule> > </rsc_location> > <rsc_order id="drbd0_before_fs0" from="postDb" action="start" to="ms-drbd0" to_action="promote"/> > <rsc_colocation id="fs0_on_drbd0" to="ms-drbd0" to_role="Master" from="postDb" score="infinity"/> > </constraints> > </configuration> > </cib> > > 以上 よろしくお願いします。 > > > >