ダウンロードリスト

プロジェクト概要

dbaclはdigramicベイズテキスト分類器です。いくつかのテキストを与えられると、以前に学習したドキュメントコレクションの一つより似ている入力を推定し、事後確率を計算します。受信メールをspam、work、playのような任意のカテゴリーにソートし、または単にフランス語テキストから英語テキストを区別できます。国際的な文字セットを完全サポートし、最大エントロピー原則に基づく高度な統計モデル使用します。
プロジェクトのリリース情報やプロジェクトリソースの情報です。
注: プロジェクトリソースの情報は Freecode.com ページからの引用です。ダウンロードそのものは、OSDNにホスティングされているものではありません。

2006-03-26 11:13
1.12

これは、ごちゃごちゃの修正や改良のずんぐりした人です。新しいhypexコマンドは、TREC 2005のオプションファイルは、チェスのエッセイはtarballに含まれます。解析エンジンにいくつかの改善、さまざまなアーキテクチャ上で新しい電子文字のオプションとバグ修正。コンピレーション問題を含め、行われた、固定されたlibslang2のサポートが追加されました。
タグ: Major feature enhancements
This is a hodge-podge of fixes and improvements. A
new hypex command, the TREC 2005 options files,
and an essay on chess are now in the tarball.
Several improvements to the parsing engine were
made, including a new -e char option and bugfixes.
Compilation problems on various architectures were
fixed, and libslang2 support was added.

2005-07-02 11:20
1.11

このリリースではいくつかのバグ修正は、- wスイッチの動作のクリーンアップは、"複雑さ"会計アルゴリズムchangeedとのマニュアルページとチュートリアルの組織を改善しました。
タグ: Code cleanup
This release fixed some bugs, cleaned up the behaviour of the -w switch, changeed the "complexity" accounting algorithm, and improved the organization of the man page and tutorials.

2005-05-20 13:16
1.10

このリリースでは様々なバグ修正とドキュメントのデフォルトのスイッチ処理の小さな使い勝手の向上が含まれます。主要加えTREC spamjigと高速で学習のための改善されたメモリのマッピングをサポートしています。
タグ: Major feature enhancements
This release includes various bugfixes and small usability improvements in the documentation and default switch handling. The major addition is support for the TREC spamjig and improved memory mapping for faster online learning.

2004-11-13 09:27
1.9

このリリースでは、- Xスイッチを補完するために)(- Uの新しい地図信頼スコア追加、いくつかの新たな得点のタイプで、(-商品メール:theaders)電子メールのヘッダのトレースのための新しい解析スイッチmailinspect。カテゴリー学習するだけでなく、ファイル名、および新しいヘッダーマイニングツール(hmine)の予備的な作業ディレクトリ名を受け入れます行われた。カテゴリーのファイルが'で'ポータブルデフォルトのフォーマットに書き込まれます。
タグ: Major feature enhancements
This release added a new MAP confidence score (-U, to complement the -X switch), some new scoring types in mailinspect, and a new parsing switch for trace headers in email (-T email:theaders). Category learning now accepts directory names as well as file names, and preliminary work on a new header mining tool (hmine) was performed. Category files are now written in 'portable' format by default.

2004-07-29 09:47
1.8.1

多くのバグが発見されたのを修正しました。テストスイートの将来の低下を防ぐために追加されました。このチェックを使用して呼び出すことができます。メモリ管理、分類、高速で大規模な高速化を与え、推定信頼スコア今- Xスイッチを介して入手可能ですが改善されました。いくつかのドキュメントの変更が行われた。
タグ: Major bugfixes
Many bugs were discovered and fixed. A test suite
was added to prevent future regressions. It can be
called using make check. Memory management was
improved, giving a large speedup in classification
speed, and a putative confidence score is now
available via an -X switch. Some documentation
changes were made.

プロジェクトリソース