ダウンロードリスト

Sponsored link

プロジェクト概要

Sumibiは統計的アプローチを使ったローマ字漢字変換エンジンです。Internet上にある無数のドキュメントをコーパスとして利用し、辞書を育てて楽しむ新感覚の漢字変換エンジンの開発です。 ソースコードリポジトリはこちらに移動しました。 https://github.com/kiyoka/Sumibi.org

システム要件

システム要件が設定されていません

リリース時刻: 2006-07-14 00:12
testing 0.7.0 (1 個のファイル 非表示)

リリースノート

Sumibiエンジンのムダな処理のリダクションと演算過程のHTML出力機能が目玉です。
PythonからSumibiWebApiを呼び出すサンプルをバンドルしました。

変更履歴

- sumibi
1. -d オプションで演算過程をHTML出力できるようにした。(出力先は ./out 固定)
2. 変換候補の評価パラメータを変更した
(パラメータ sumibi-evaluate-balance)
3. 大量の演算時間がかかってしまう問題を修正した。
1) bi-gram skip-bi-gram の評価値の組合せを最大 8x8=64パターンに制限した。
(その変数 sumibi-candidate-top-limit の値は .sumibiで調整可能)
制限しない場合5000パターン以上の計算をする場合もあった
4. ムダなSQLのリダクションを行った。
1) SQLのWHERE句の条件が id = 0 の様な意味の無いクエリを発行しないようにした。
- サンプル
1. python SOAPpyモジュールからアクセスするサンプル(SumibiWebApiSample.py)を追加した。
( Thanks to Yusuke Muraoka )