ダウンロードリスト

プロジェクト概要

サリーは、一連の文字列のベクトルのセットにマッピングするためのツールです。このマッピングを埋め込むと呼びます、テクニック機械学習・ データマイニング文字列データの解析に適用することができます。それはテキスト文書、DNA シーケンス、またはログ ファイルなどのデータを使用できます。ベクトル空間モデルまたはバッグ オブ ワーズ モデルが使用されます。文字列は一連の各機能がベクトル空間の 1 つのディメンションに関連付けられている機能によって特徴付けられます。それぞれの文字列機能の出現はカウントされます。また、バイナリまたは TF ・ IDF 値を計算できます。ベクトルは、LibSVM、プレーン テキストで出力することができます。 または Matlab の書式を設定します。

システム要件

システム要件が設定されていません
プロジェクトのリリース情報やプロジェクトリソースの情報です。
注: プロジェクトリソースの情報は Freecode.com ページからの引用です。ダウンロードそのものは、OSDNにホスティングされているものではありません。

2012-12-28 06:46
0.8.1

位置指定の n-gram さまざまなシフトでのサポートが追加されました。いくつかのマイナーなバグが修正されました。
Support for positional n-grams with varying shift has been added. Several minor bugs have been fixed.

2012-08-30 07:25
0.8.0

ストップ ワードと周波数閾値処理のサポートが追加されました。構成は簡略化されていますより透過的です。いくつかのバグが修正されました。
Support for stop words and frequency thresholding has been added. The configuration has been simplified and is more transparent. Several bugs have been fixed.

2012-05-19 03:52
0.7.1

構成とマニュアルが改善されました。
The configuration and manual have been improved.

2012-05-14 05:18
0.7

署名付きの文字列を埋め込むためのサポートが追加されました。いくつかのマイナーなバグが修正されました。
Support for signed embedding of strings has been added. Several minor bugs have been fixed.

2012-02-07 07:31
0.6.4

位置および並べ替え n グラム (n-パーマ) のサポートが追加されました。つまり、今も n グラム文字列と n グラム、シンボル ソート位置にバインド抽出できます。
Support for positional and sorted n-grams (n-perms) has been added. That is, you can now also extract n-grams bound to a position in strings and n-grams whose symbols are sorted.

プロジェクトリソース