[mecab-users 400] サロゲートペアの扱い

アーカイブの一覧に戻る

川代雄太 yutax****@gmail*****
2010年 2月 18日 (木) 10:03:29 JST


初めまして。川代と申します。

MeCabの辞書にはUTF-8が使用できますが、サロゲートペアも正しく扱う(ユーザ辞書などに登録ができる、生文に含まれていても正しく解析できるなど)ことはできるのでしょうか。
また、サロゲートペアも正しく扱える場合、運用時に特別に考慮しなければならないことなどは有りますでしょうか。

以上、ご教示いただければ幸いです。
よろしくお願いいたします。
-------------- next part --------------
HTMLの添付ファイルを保管しました...
ダウンロード 



mecab-users メーリングリストの案内
アーカイブの一覧に戻る