自動読み推定(発音推定)のための文字列アライメントツールです.多対多のアライメントを提供します.部分的にアライメントの正解を与える部分的アノテーションやある特定の表記と読みの対応付けを他の対応付けよりも有利にしたり禁止したりできます.また,特殊な表記と読みの対応付け(AAA,トリプルエーなど)を検出する機能があります.
アライメント後のデータを学習データとして発音推定のためのモデルを構築し,それを使って発音推定を行いたい場合は, 発音推定に関する学習手法と発音推定を行う予測器(デコーダー)が実装された slearp ( http://sourceforge.jp/projects/slearp/ ) を使用してください.
開発者は以下の通りです.
奈良先端科学技術大学院大学
情報科学研究科 情報処理学専攻
知能コミュニケーション研究室 博士後期課程
久保 慶伍 (Keigo Kubo)
Mpaligner is the many-to-many string alignment tool based on the generative model which is modified to find a minimum mapping between two strings, such as notation and pronunciation. Mpaligner has some functions. The partial annotation function enables you to give correct alignment to part data by manpower (to provide Semi-supervised training). The detection function of special data detects data that is difficult to do alignment (for example [AAA, tri'plei]). The data which alignment is done is employed as training data. For example, when two strings which alignment is done are notation and pronunciation, it is employed as training data to construct a model for grapheme-to-phoneme conversion (g2p conversion). The license of mpaligner is GNU GPL.
Developer implementing mpaligner is below.
NAIST(Nara Institute of Science and Technology)[[BR]]
Graduate School of Information Science[[BR]]
Augmented Human Communication Laboratory[[BR]]
The Doctoral Program[[BR]]
Keigo Kubo
自動読み付与(発音付与)のための文字列アライメントツールです.
多対多のアライメントを提供し,与えられた2つの文字列の最小パターンを見つけます.
アライメント結果は未知語に対する読み付与などに使用されます.
部分的にアライメントの正解を与える部分的アノテーションやある特定の表記と読みの
対応付けを他の対応付けよりも有利にしたり禁止したりできます.
また,特殊な表記と読みの対応付け([AAA,トリプルエー]など)を検出する機能があります.
ライセンスは GNU GPL です.
開発者は以下の通りです.
奈良先端科学技術大学院大学[[BR]]
情報科学研究科 情報処理学専攻[[BR]]
知能コミュニケーション研究室 博士後期課程[[BR]]
久保 慶伍 (Keigo Kubo)