Re: gcanna.ctd の頻度について (Anthy-dev 2478) - Anthy

田畑です。

UTUMI Hirosi wrote:
>>Anthyの場合(多分、Cannaも)、頻度の数字が同じであれば
>>辞書ファイル中の順序を使いますが、頻度の数字があれば
>>それを優先します。

> あるいは次のようなスクリプトを書いてくださると安全かもしれません:
> 見出語ごとに頻度数字の並びをチェックして、A > B > C の並びに
> なっていないものに対してエラーメッセージを出す。
警告ぐらいは出していいかなと思います。ただし、cannadicの編者の
すぎもとさんもファイルを直接編集してはいないと聞いてますし、
テキストエディタで直接編集というのはあまりお勧めしません。

と言ってしまうと、*現状では*プログラムを書けない人が辞書関連で
まとまった作業をするのはお勧めできないと言ってるのとほぼ等価ですが、
残念ながら、*現状は*そうですとしか言えません。
心苦しいですが、ここでごまかしても誰かの利益にはならないので
現状認識を正直に言っておきます。

#お勧めしないとは言いましたが、やってくださるのはありがたいです。
#でも、今のやりかただと差分を受け取る方も疲れますね。

> 別件ですが、辞書の形式について。
> 今後どのような形をとられるか分からないのですが、
> 一語に対して複数行を必要とする形式だと
> gcanna.ctd が数十万行になって編集が難しくなってしまいます。
> (現在 92,000 行。私は kwrite で編集しています)
> その辺りも考慮に入れて新形式をお考えいただけましたら幸いです。
前も言った気がするのですが、ツールで解決するのが正しいと思います。
たとえば、メーラーや2ch viewerのようなフロントエンドや一般的な
Bug Tracking Systemのようにウェブブラウザから操作できる
ユーザインタフェースをもったソフトを作り、送られてきた差分を
ほかの単語での扱いと比較しながらGUIで決めれるというのが欲しいです。

僕自身は大したマージ作業やってませんけど、手でやるのは結構辛いです。
-- 
--
 CHAOS AND CHANCE!
  Yusuke TABATA

Anthy

[Anthy-dev 2478] Re: gcanna.ctd の頻度について