ダウンロードリスト

プロジェクト概要

DataCleanerでは、検証、およびマイナーETLのようなタスクは、データ·プロファイリングを実行することができ、データの品質分析ツールです。これらの活動は、あなたのデータが有用とあなたのビジネスの状況に適用可能であることを確実にするために、データ品質を管理および監視するのに役立ちます。それは、マスターデータ管理(MDM)の方法論、データ·ウェアハウス·プロジェクト、統計調査、抽出·変換·ロード活動のための準備や、その他に使用することができます。

システム要件

システム要件が設定されていません
プロジェクトのリリース情報やプロジェクトリソースの情報です。
注: プロジェクトリソースの情報は Freecode.com ページからの引用です。ダウンロードそのものは、OSDNにホスティングされているものではありません。

2013-01-22 21:29
3.1.2

Web サービス (一覧) メトリックの値を取得するための監視アプリケーションに追加されました。Table lookup コンポーネント結合セマンティクスを設定可能なプロパティとして追加することによって改善されました。EasyDQ コンポーネントは、構成オプションと、豊富な重複排除結果インターフェイスをさらに追加、アップグレードされています。パフォーマンスの向上は、このリリースの特定のフォーカスされています。DataCleaner のエンジンでさらに以前に覆われていたではないストリーミング処理アプローチ特定のコーナー ケースを活用する強化されています。
タグ: Minor feature enhancements, Minor bugfixes
A Web service was added to the monitoring application for getting a (list of) metric values. The 'Table lookup' component has been improved by adding join semantics as a configurable property. The EasyDQ components have been upgraded, adding further configuration options and a richer deduplication result interface. Performance improvements have been a specific focus of this release. Improvements have been made in the engine of DataCleaner to further utilize a streaming processing approach in certain corner cases which was not covered previously.

2013-01-05 06:50
3.1.1

日付と時刻分布アナライザー週数、月数、および年数を追加解析オプションが展開されている関連。オプション「記述統計」オプション番号のアナライザーと日付/時刻アナライザーに線監視 Web アプリケーションのタイムライン グラフに追加されました今の小さな点があります。2 つの新しいトランスフォーマー Uuid を生成するため、タイムスタンプを生成するために追加されています。アドホック クエリは DISTINCT 句を含めることができます今 ※-ワイルドカード、およびサブクエリ、およびテキスト ケース問題に向かってフォールトトレラントは。
タグ: Minor feature enhancements
The date and time related analysis options have been expanded, adding distribution analyzers for week numbers, months, and years. An optional "descriptive statistics" option has been added to the Number analyzer and the Date/time analyzer The lines in the timeline charts of the monitoring Web application now have small dots in them. Two new transformers have been added for generating UUIDs and for generating timestamps. Now ad hoc queries can contain DISTINCT clauses, *-wildcards, and subqueries, and are fault-tolerant towards text-case issues.

2012-12-18 12:20
3.1

データ品質の Kpi は、今ちょうど未フォーマットの数式 (数式) として定義できます。アドホック SQL クエリすべてのデータストア (DB、CSV、Excel、および詳細) に向けて発射することが可能になりました。値マッチャー新しい解析オプションが追加されました。この分析では、予期しない値のフィールドを識別するは簡単です。ジョブ、コピー ジョブ、削除などの管理機能を直接 UI に公開する方が楽されてきた。それが結果をタイムラインに配置するために歴史的なデータ品質の基準を変更することが可能しました。
Data Quality KPIs can now be defined as formulas (mathematical expressions), not just raw metrics.
It is now possible to fire ad-hoc SQL queries towards all datastores (DB, CSV, Excel, and more). A new analysis option, the Value matcher, was added. With this analysis, it's easy to identify unexpected values in a field. Management of jobs, including copying and deleting jobs, has been made a lot easier by exposing the functionality directly in the UI. It has been made possible to change historic data quality metrics in order to reposition results into the timeline.

2012-01-03 11:15
2.4.1

このリリースは軽微なバグ修正、パフォーマンスの改善、およびいくつかの新しい機能を追加します。間の重要なものは大幅改善バッチ読み込みパフォーマンス、便利な「データの書き込み」メニュー、メイン ウィンドウをダブルクリック Javascript トランス ・ フィルター、修正、潜在的なデッドロックは、アプリケーションの起動時にシンタック スカラー リングのジョブ コンポーネントの名前を変更します。
タグ: Minor feature enhancements, Minor bugfixes
This release adds minor bugfixes, performance improvements, and a few new features. Among the important ones are greatly-improved batch loading performance, a convenient "write data" menu in the main window, double-click renaming of job components, syntax coloring in the Javascript transformer and filter, and fixes for a potential deadlock when starting the application.

2011-12-15 07:54
2.4

MongoDB データベースでは、両方の読み取りおよび書き込み操作をサポートします。EasyDQ.com は、顧客 DQ 雲の機能との統合。重複検出 (別名。重複除外/ファジィ マッチング) アナライザー。テーブルから複数の値のルックアップを行うため、「テーブル ルックアップ」コンポーネント。あらゆる種類のテーブル (などデータベース、CSV ファイル、Excel シート、または MongoDB コレクション) にレコードを挿入するため、「テーブルの挿入」コンポーネント。コマンドラインからにインストルメント化可能パラメータのジョブはジョブ レベル変数。
タグ: Major feature enhancements, mongodb, ETL, xml. lookup, customer data
Support for MongoDB databases, both for read and write operations. Integration with EasyDQ.com, which provides Customer DQ functions in the cloud. Duplicate detection (aka. Deduplication / Fuzzy matching) analyzers. A "Table lookup" component for doing lookups of multiple values from a table. An "Insert into table" component for inserting records into any kind of table (e.g. database tables, CSV files, Excel sheets, or MongoDB collections). Job-level variables which allow for parameterizable jobs that can be instrumented from the command line.

プロジェクトリソース