NHocrについての表示カテゴリ(タグ)ツリーNHocr - 日本語文字認識プログラムSince Sep 8, 2008 / Last update: Aug. 30, 2014 この文書は nhocr: OCR engine for Japanese language (Google Code) にある紹介文を日本語訳し、若干の変更を加えたものです。 NHocrについてNHocr は日本語等に対応したコマンドライン形式の 文字認識(OCR)プログラムです。 NHocr は画像中の日本語文字(ひらがな、カタカナ、漢字等) やASCII文字/シンボルを認識します。 NHocr は、学術関係者に公開された実験的な部分ソースを除いては、 おそらく最初のオープンソース日本語OCRソフトウェアです。 NHocr はウェブサービス WeOCR でも利用できます。
このプログラムは実験的な意味が強く、
文字認識の精度に限界があります。 NHocr で用いられている文字特徴量は、 '90年代後半に堀らによって提案された 外郭局所モーメント特徴 (Peripheral Local Moment, P-LM) が基本になっています。 NHocr は元々、作者の週末プログラミングの成果物です。 開発は遅いかもしれません。 現バージョンにおける制約事項
サポートされるプラットフォームと要件Solaris SPARC/x86 と Linux が正式にサポートされます。 NHocr はその他のUNIX(ライク)な環境やMS-Windowsでも 動作するかもしれません。 NHocrをコンパイルするには、FreeType2の開発環境(ライブラリ)が必要です。 0.21以前のNHocrは、下記サイトで入手できる O2-tools パッケージに依存しています。 ライセンス
新版には Apache License 2.0 が適用されます。 © 2008-2014 Hideaki Goto |