プロジェクトの説明

デュークは、高速かつ柔軟な記録リンケージ エンジンです。従来のブロック (キーによってソート) アプローチを使用しないが、Lucene 代わりに依存しています。これは、高パフォーマンス (~ 10 分で 1,000,000 のレコードを処理することができる)。デュークは、コマンドラインから実行できますがまたインクリメンタル リンク アプリケーションを簡単に構築できるように API を持っています。CSV、JDBC、SPARQL、NTriples からのデータの読み取りをサポートし、またコンパレータ文字列と文字列の正規化の数をサポートしています。

(このプロジェクト概要は機械翻訳されたものです) 翻訳してみる 原文を表示する

レビュー
あなたの評価
レビューする