ブログデータからのBTRON構造データ作成 Wiki @ SF.jp:

思いつきサブプロジェクト


TargetDataSample 思いつき PlanOne PlanTwo


本題  トップページ http://blog2btron.sourceforge.jp/ サイドページ http://www6.atpages.jp/raycy/blog2btron/door ブログデータからのBTRON構造データ作成 Wiki @ SF.jp: ページへようこそ。 二案ある。

  • 第一案は、ブログデータを超漢字データに移行する。
  • 第二案は、テキストベースミニマムBTRONの表現系・操作系(つかんでぽん、ぱ。移動コピー擬似”実身”生成)へ

だいたい、こんな感じかなと思うところを書いておく。 まずは、BTRONの実身仮身のデータ構造を知らねばならぬのだろう。実身仮身のアナロジー

第一案の超漢字への移行プロセスでも、データを超漢字用に超漢字の外部システムで作ってから持ち込むか 超漢字にデータを持ち込んでから、実身仮身化するか。

第二案のテキストベースミニマムBTRONの表現系が、一番簡単な部分だと考えている。 というか、まずは、既存ブログデータの(リンク関係の)解析が要ろう。

BTRONの実身上には参照先の仮身が載っている、ないし、記載されている

  • 実身「本文、参照先仮身0、、n」。

ところがブログデータでは

  • ブログ記事「本文、トラックバック被参照先0・・・n」

また、本文中に参照先が重複して埋め込まれている場合もあろう。

  • ブログ記事「本文(埋め込まれた参照先ブログ記事0・・・k)、トラックバック被参照先ブログ記事0・・・n」

したがって、単純に、BTRON構造というなら

  • ブログ記事「本文(埋め込まれた参照先ブログ記事0・・・k)、

までの部分をいうのかな?否?

  • ブログ記事「本文と、仮身相当リンク群(埋め込まれた参照先ブログ記事0・・・k、と∪、トラックバックをつけた参照先ブログ記事0・・・n、との和集合)」

まずは対象とするブログデータの構造から一部を取り出し、解析することとしたい。 TargetDataSample 思いつき PlanOne