フォーラム: 【移行しました】サポート (スレッド #38601)

Subversionのファイルをクロールする方法 (2017-04-28 13:27 by tamori_naoto #79772)

Tortoise SVNを利用しており、
SVNにあるWordやPDFなどをクロールさせて、
検索結果を表示できればと考えています。

一度SVNでローカルか共有フォルダなどにダウンロードして、
それを直接クロールすることができるのですが、
全体の容量が多いため直接SVNをクロールできれば助かります。

SVNはWeb上でもファイルをツリー上に表示できるので、
FESSのWebクローラーでリポジトリのURLをクロールしたところ、
1.0 text/xsl /svnindex.xslしかクロールされなかったため、
上記のxslの中身を直接クロールできれば理想的だと思っています。

何かご教示いただけると助かります。
よろしくお願いします。

メッセージ #79772 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Subversionのファイルをクロールする方法 (2017-04-28 23:08 by shinsuke #79773)

XSLTでSVNを表示させたことがないのでわかりませんが、
HTMLとしてパースできないので、インデックスされないと
思います。XSLTでなく、HTMLとして表示させるようにして、
クロールさせれば良いと思います。
#79772 への返信

メッセージ #79773 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Subversionのファイルをクロールする方法 (2017-05-01 09:04 by tamori_naoto #79789)

ご回答いただき、ありがとうございます。
上記のXSLTではなくHTMLとしてクロールさせる方法を
ご教示いただけないでしょうか。
お手数をおかけし大変恐縮ですがよろしくお願いいたします。
#79773 への返信

メッセージ #79789 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Subversionのファイルをクロールする方法 (2017-05-09 20:14 by mshibata #79816)

以下のような感じ (httpd.conf) で XSLT 以外の普通のディレクトリリスティング (HTML) の口も1つ作っておいて、Fess のパスマッピングで
http://hostname/svn2fess/http://hostname/svn/
...のようにパスを読み替え、Web クロールの設定ももっぱら
http://hostname/svn2fess/.*
...に対して行う。

...というのをウチではやってます。

IP アドレス、パス等、ウチ固有の情報は適当に読み替えてください。

<Location "/svn/">
DAV svn
SVNParentPath "C:\TracLight\projects\svn"
SVNListParentPath on
SVNIndexXSLT "/svnindex.xsl"
Order allow,deny
Allow from 192.168.0.0/19

AuthName trac
AuthUserFile "C:\TracLight\projects\trac.htdigest"
Require valid-user
AuthzSVNAccessFile "C:\TracLight\projects\svnauthz"
</Location>

<Location "/svn2fess/">
DAV svn
SVNParentPath "C:\TracLight\projects\svn"
SVNListParentPath on
Order allow,deny
Allow from 192.168.28.55 // Fess サーバーからしかアクセスできなくしておく。
AuthType Digest
AuthName trac
AuthUserFile "C:\TracLight\projects\trac.htdigest"
Require valid-user
AuthzSVNAccessFile "C:\TracLight\projects\svnauthz"
</Location>

#79789 への返信

メッセージ #79816 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Subversionのファイルをクロールする方法 (2017-05-09 20:17 by mshibata #79817)

[メッセージ #79816 への返信]
コピペの段階で一行消えておりました。

<Location "/svn/"> ~ </Location> の間にある空行は
AuthType Digest
...が入ります。
#79816 への返信

メッセージ #79817 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Subversionのファイルをクロールする方法 (2017-06-28 14:04 by tamori_naoto #80008)

いろいろご教授いただき、ありがとうございました。
SVNサーバーの設定を変えることができなかったため、
一度ローカルに落としたファイルを、
パスマッピングでURLを変更することにしました。

ちょっとどんくさいですが、
直接ローカルのファイルを参照させるよりかはマシかなと思います。


[メッセージ #79817 への返信]
> [メッセージ #79816 への返信]
> コピペの段階で一行消えておりました。
>
> <Location "/svn/"> ~ </Location> の間にある空行は
> AuthType Digest
> ...が入ります。
#79817 への返信

メッセージ #80008 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする