Yukinobu Hamuro
hamur****@adm*****
2004年 6月 5日 (土) 12:30:55 JST
園部さん、羽室です。 ご無沙汰しております。 解説が整備できておらず申し訳ありません。 以下に、スーパーでのバスケット分析にアソシエーションルールを適用した例を用いて説明します。 「A⇒B(例 A:パンを購入、B:牛乳を購入)」というアソシエーションルールを考えます。 Aの条件を満たす人数:10人 Bの条件を満たす人数:20人 A∧Bの条件を満たす人数:5人 顧客のトータル人数:100人 としますと、 antecedent A consequent B itemSize 2 (パンと牛乳) antecedentCnt 10 consequentCnt 5 consequentTotal 20 totalCnt 100 support 0.05 ( 5/100, consequentCnt/totalCnt ) confidence 0.5 ( 5/10, consequentCnt/antecedentCnt ) lift 2.5 ( 0.05/(0.1*0.2) support/((antecedentCnt/totalCnt) * (consequentTotal/totalCnt)) ) supportとは、ABの共起確率です。 confidenceとは、Aという条件におけるBの起こる確率(条件付確率です)。 liftとは、ABが独立事象として考えた場合に期待される共起確率に対する実際の共起確率(support)の比です。 1以上で関連が高いということがいえます。 itemSize(頻出アイテム集合のサイズ)は、antecedentとconsequentに含まれるアイテムの総数です。 例えば、 「パン&バター⇒牛乳」の場合は3となります。 「*⇒牛乳」の場合は1となります。 アソシエーションルールを表構造で表現するのはあまりよくない方法で、特にantecedentに複数のアイテムが出てくると「A,B」のように項目の中に項目が含まれるという 第一正規化を無視した構造となり扱いにくくなります。この点は、次期バージョンでPMML対応にするなどして改良を加えるつもりです。 グラフ表示についてですが、MUSASHIをSVGに完全に対応させていこうかと考えています(現在SVGの勉強中です)。 http://www.asahi-net.or.jp/~uf4k-nkjm/SVG/ http://www.w3.org/TR/2001/REC-SVG-20010904/index.html ちなみにSVGのビューアーはブラウザにプラグインすることが可能で(例えばAdobe SVG viewer)、HTMLのembed タグで埋め込むことができ、MUSASHIを利用したWEB上での reportingに大きな可能性が見えてきます(MUSASHI+PHP+SVG)。 現在のところ、xtbar,xtpie,xtline,xtscatterというコマンドを作成し、グラフをSVGで出力しようと考えています。 もし、グラフ構造の視覚化のコマンドなどができれば、それは素晴らしいなと考えています。 出力されたグラフの要素をドラッグしたりすることも可能なようなので、機能的にある程度満足のいくものが実現可能だと考えています。 とりあえずは、ノードとエッジを別ファイルで持たせ、それらを入力にしてSVGを出力するコマンドなどが考えられると思います。 また、既に鷲尾先生がグラフ構造をPMMLで記述するための仕様を作られていますので、それを入力データとして利用することもOKだと思います。 よろしくお願いします。 sonobe kazuo さんは書きました: > >おはようございます。みなさま、お久しぶりです。 >そのべ@こまがわ です。 > >さっそくですが… > >musashi_textの方でもアソシエーション分析を使ってみよう >と考えています。今、…dm/xtasrule/test 以下のファイルを >見てるのですが、出力ファイルの見方がわかるようになる資料な >どはないでしょうか? >もしあるようならお教え下さい。よろしくお願いいたします。 > >musashi_textの中でも結果をグラフ表示するつもりですが、 >一緒に、ファイル名(xtasruleの出力)を指定してグラフ表示する >単機能のプログラムを作ろうかと思ってます。何か「こういうプ >ログラムがあれば…」という希望のようなものはありますでしょ >うか? > >///////////////////////////////////////////// rsl1 ><?xml version="1.0" encoding="euc-jp"?> ><xmltbl version="1.1"> ><header> ><field no="1" name="antecedent"></field> ><field no="2" name="consequent"></field> ><field no="3" name="itemSize"></field> ><field no="4" name="antecedentCnt"></field> ><field no="5" name="consequentCnt"></field> ><field no="6" name="consequentTotal"></field> ><field no="7" name="totalCnt"></field> ><field no="8" name="support"></field> ><field no="9" name="confidence"></field> ><field no="10" name="lift"></field> ></header> ><body><![CDATA[ >* 02 1 10 7 7 10 0.7 0.7 1 >04 02 2 7 4 7 10 0.4 0.5714285714 0.8163265306 >02 04 2 7 4 7 10 0.4 0.5714285714 0.8163265306 >03 02 2 7 6 7 10 0.6 0.8571428571 1.224489796 >02 03 2 7 6 7 10 0.6 0.8571428571 1.224489796 >03,04 02 3 4 3 7 10 0.3 0.75 1.071428571 >02,04 03 3 4 3 7 10 0.3 0.75 1.071428571 >02,03 04 3 6 3 7 10 0.3 0.5 0.7142857143 >* 04 1 10 7 7 10 0.7 0.7 1 >05 04 2 3 3 7 10 0.3 1 1.428571429 >… >… >//////////////////////////////////////////////// > > >-- > / kazuo sonobe <fuja2****@bj8*****> >☆ / 信号処理技術の解説ページ「蜂波の眼」作成中 >☆ <http://www009.upp.so-net.ne.jp/hachinami/> > >_______________________________________________ >MUSASHI-users mailing list >MUSAS****@lists***** >http://lists.sourceforge.jp/mailman/listinfo/musashi-users > ---- Yukinobu Hamuro hamur****@adm*****