Special.java (Special.java( 外部リンク: SF.net): 1,422 バイト)のダウンロードが開始されます。開始されない場合,左のリンクをクリックしてください。

ファイル情報

ファイルサイズ
1,422 バイト
MD5
a86014b05e1fa2436dd3bec454587e71

プロジェクト概要

自動要約文書の簡潔な要約を提供します。これで私はドメインに依存しない、単一文書要約テキスト生成問題への対処に統計的アプローチを提示します。Web ページの内容を要約するため使用することもできますのカテゴリに文を分割する私の論文が含まれていますソルトン ベクトル空間モデル。サマライザーは当初、区切り記号に基づく文にドキュメント全体を分割します。2 番目のステップは不必要な単語をドキュメントから削除することです。ストップ ワードを削除した後のドキュメントが、独特の単語再度改訂され。ユニークな単語は同じ意味を持っている、またはドキュメントに余分であるかもしれないものです。これらは、ステミングと呼ばれる方法で削除されます。ステミング メカニズムを使用して単語の出現が計算され、結果がどのように何回も彼らが発生して発生した文の数の形式で表示されます。