Hiroyuki Komatsu
komat****@taiya*****
2004年 1月 12日 (月) 04:57:19 JST
At Mon, 12 Jan 2004 01:50:47 +0900, TOKUNAGA Hiroyuki wrote: > On Sun, 11 Jan 2004 18:58:15 +0900 > Hiroyuki Ikezoe <poinc****@ikezo*****> wrote: > > > その妄想とても面白そうなのでひろゆき(い)も乗せてもらいます。 > > ページのソースよりも画面に表示されている部分の方がよさそうですね。 > > 2003年までの私では無理でしたが、最近GeckoのDOMを理解しつつあるので > > 2004年にはいけるでしょう。 > > Aタグの中身を予測入力に使いたい、とかいう場合にはソースの方が都合がよ > さそうに思えます。でも、そんなシチュエーションがあるのかどうかは、疑問。 ソース全体だと、でかいファイルの時に都合が悪いですね。理想なのは ・ソース全部 ・画面表示部分のみのソース ・カーソル位置 が取得できることです。まあ、最初はソース全体が取得できればいいのでは ないかなあ。 > > ただこれ、gtk+のimmodulesに文字列を送るインターフェースがあるのかどう > > なのか。この辺は徳永さんが詳しい?足永さんも詳しそう。 > > あと、ブラウザから渡す文字列は文章全体でよいんですよね? > > わかち書きは誰がやってくれるんでしょう? ... > あと、わかち書きは最終的にはKAKASIとかChasenとかMecabに投げる事になる > と思いますが、それはPRIMEとかが適切に処理してくれることを期待して、風博 > 士としては単に文字列を送るだけで十分だとと思います。 わかち書き部分は IME 側の仕事だと思います。 処理の流れとしては、 1. uim が風博士にクエリー送信 2. 風博士が uim に HTML ソースを送信 3. uim が PRIME に HTML ソースを中継 4. PRIME が HTML ソースを元に変換辞書を作成 (uim = 入力フロントエンド, 風博士 = アプリケーション, PRIME = 入力バックエンド, HTML ソース = データ) でしょうか。uim の負担が大きい…。 風博士が取得したデータを全部蓄積していって、PRIME など他の アプリケーションがそこから適宜データを活用する方法というのもあります。 画面表示部分のみを取得するとか、そういった細かいことはできませんが uim への負担はゼロです。 # 無駄が多いことと、都合の悪いページまで蓄積されてしまうので、 # これはこれで工夫が必要ですけども。 ご参考までに: http://taiyaki.org/doc/wiss2002/slide/ -- 小松弘幸 ----------------------- http://taiyaki.org/