NHocrについての表示カテゴリ(タグ)ツリーNHocr - 日本語文字認識プログラムSince Sep 8, 2008 / Last update: Oct 1, 2008 この文書は nhocr: OCR engine for Japanese language (Google Code) にある紹介文を日本語訳し、若干の変更を加えたものです。 NHocrについてNHocr は日本語に対応したコマンドライン形式の 文字認識(OCR)プログラムです。 NHocr は画像中の日本語文字やASCII文字/シンボルを認識します。 NHocr はフリーのオープンソースな OCRソフトウェアとしてリリースされる予定です。 NHocr はウェブサービス WeOCR でも利用できます。
このプログラムは実験的な意味が強く、
文字認識の精度に限界があります。 NHocr は元々、作者の週末プログラミングの成果物です。 開発は遅いかもしれません。 現バージョンにおける制約事項
サポートされるプラットフォームと要件
後に決定の予定です。 コードの入手性開発がまだ初期の段階なので、当面の間、 ソースコードは共同研究者のみに公開の予定です。 一般へのソース公開は 2009.2Q に予定されています。 NHocr で用いられている文字特徴量は、 '90年代後半に堀らによって提案された 外郭局所モーメント特徴 (Peripheral Local Moment, P-LM) が基本になっています。 現在、文字特徴量の抽出のためのコードは、 Google Code のサイトにて ダウンロード可能です。 ライセンス
後に決定の予定です。 © 2008 Hideaki Goto |