プロジェクトの説明

テッセラクト OCR 3.02 ナーガリー文字スクリプトのテキストを認識するための hin.traineddata を提供します。しかしヒンディー語トレーニング テキスト、イメージ、ボックス ファイルは提供されません、更なる改善、traineddata の精度を向上することは困難です。認識がより正確で高速 OCRed するテキストと同じ/類似のフォントを訓練した場合注意します。Google と tesseract_ocr の開発者が取り組んで向上の traineddata を取得する同じ同じに関する情報はありません。フォントの種類、トレーニング テキストを試しているし、traineddata ファイルを掲載する予定これら OCR を使用することができます希望で様々 なデバナガリ文字フォントの様々 なスキャン デバナガリ文字のテキストの本。Sanskrit2003 フォント

(このプロジェクト概要は機械翻訳されたものです) 翻訳してみる 原文を表示する

ダウンロード

レビュー
あなたの評価
レビューする