heritrix-1.0.0.tar.gz (heritrix-1.0.0.tar.gz( 外部リンク: SF.net): 7,993,504 バイト)のダウンロードが開始されます。開始されない場合,左のリンクをクリックしてください。

ファイル情報

ファイルサイズ
7,993,504 バイト
MD5
4281b351b5e02138d8ce8e98083bd1ee

プロジェクト概要

archive-crawler プロジェクトは、Heritrix を構築しています。柔軟で拡張可能、堅牢でかつスケーラブルなウェブクローラです。インターネットでアクセスできるコンテンツの取得、アーカイブ、そして多様性と広がりの分析ができます。