Unicodeに対応した文字単位のNグラム解析プログラム。
morogram-0.7.3a.exe は、師さん作の Unicode対応 N グラムツール morogram の拡張& Windows 用実行形式版です。
Win32 実行形式に変換する前の morogram-0.7.3a.pl と morogram-sort-0.7.3a.c も同梱してあります。オリジナルの morogram 同様、自由に改変・配布してかまいません。
ソート方法をCombSortからQuickSortに変えてみました。
メモリ使用量が気になる場合は旧バージョンmorogram-0.7.3.exeを使ってください。2.62MBのファイル(源氏物語, utf8)をノートパソコン(Pentium M 1.60GB 2GB RAM)を使って20分(従来は30分くら?)で処理できます。苦情がなければこのままQuickSortでいきます。
mgsm.exe 修正&追加。これはオマケです。