[morogram-users] Win32 スタンドアロン版 morogram-0.7.1x.exe

アーカイブの一覧に戻る

dune FZH01****@nifty*****
2004年 5月 5日 (水) 22:42:32 JST


極悪です。

morogram の Win32 実行形式バグフィックス&拡張版 
morogram-0.7.1x.exe です:

  http://hpcgi1.nifty.com/dune/gwiki.pl?f
    tools/morogram-0.7.1x.zip - 889KB

上の zip にはいろいろ入れてますが、sourceforge にはバイナリ
とソースを分けてそのうちアップします。



旧版 morogram-0.7.1w は

1. 空白や改行が削除されない(バグ。僕のせいじゃない)
2. --BOM 指定時 EF BB BF ではなく FE FF が出力される(勘違
   い)

というバグがありました。申し訳ない。

その後、山田さんに 1. のバグを教えていただいて修正した 
morogram-0.7.1w 第二版は、1.のバグはなおっていますが、
--e オプション(文字参照 &nnnnnn;)が正常に働きません。

morogram-0.7.1x.exe はこれらのバグを修正しています。

注意としては

1. --p(Delete Punct)オプションで削除される文字がオリジナル
   の morogram と 異なっています。
2. ABCとabcを同一視します(ワイドキャラクタのアルファ
   ベットの大文字と小文字を区別しない)。

1.は削除する文字を Named Unicode properties で指定している
ためです(Mark, Punctuation, Symbol, Separator を削除;
cf. http://www.unicode.org/reports/tr18/index.html)。 

2.は僕の勝手な都合です。これをやめさせるには --c(Case 
sensitive)オプションを指定します(ABC と abc,ABC と
abcを区別するようになります)。

また、会社の上司が製品にワン・フューチャ入れろ、とウルサイの
で(morogram と関係ないけど)、--w(単語モード)と簡単な 
GUI も組み込んでいます。--I,--O による入出力エンコードの指定
もできますが、先ずはユニコードのみの版 morogram-0.7.1x.exe 
を出します。要望があれば morogram-0.7.1xJ.exe や 
morogram-0.7.1xCJKT.exe なども出せます。



D:% morogram-0.7.1x.exe --f=4 --g=4 --p D:\DATA\電脳国文学\AOZORA\takuboku\TAKUBOK3.utf8 2>nul |sortl -WU +0nr |tosjis |head
28      ふるさと        4
19      ふるさとの      5
19      るさとの        4
18      かなしみ        4
14      かなしき        4
13      のかなし        4
12      なつかし        4
12      のごとく        4
12      りしかな        4
11      ごとくに        4

D:% morogram-0.7.1x.exe --w D:\DATA\電脳国文学\AOZORA\takuboku\TAKUBOK3.utf8 2>nul |sortl -WU +0nr |tosjis |head
4       かなしきは      1
4       秋の風吹く      1
3       こころよく      1
3       何がなしに      1
3       わが友の        1
3       ふるさとの      1
2       一握の砂        1
2       しっとりと      1
2       かなしくもあるか        1
2       気がつけば      1

D:%
-- 
極悪, FZH01****@nifty*****
http://hpcgi1.nifty.com/dune/gwiki.pl?




morogram-users メーリングリストの案内
アーカイブの一覧に戻る