猫山さんの日記

写真付きで日記や趣味を書くならgooブログ

Fessを試してみよう(10)クロール対象から除外

2022-06-09 | 日記

WORDファイルのサムネイルを作らないようにしたら、
サムネイル作成が滞りなく進むようになった。
いよいよクロール対象を課全体に拡大しよう。

課のフォルダは、秘書係、広報係、情報係の3つに分かれている。
ユーザーは課全体にアクセス権を持っているけれど、
検索結果に他の係のファイルが出てくると邪魔になるので、
クローラーは係ごとに作った。
広報係と情報係は1つないし2つのフォルダにまとまっているので、
「パス」を1行か2行設定するだけで良い。
秘書係は課のフォルダ内を好きに使っているので、
「パス」は課全体として、
「クロール対象から除外するパス」に広報と情報を設定する。
これで昨夜実行してみたら、朝になってもまだサムネイルを作成している。
何かおかしい。

fess-thumbnail.logを覗いてみたら、
秘書係のジョブが広報と情報のサムネイルを作っている。
ちょっと、入らんといて!
公式の説明をよく見たら、「クロール対象から除外するパス」は正規表現だった。
で、どうするんだっけ?
しばらく使わないとすぐに忘れてしまう。
・・・正規表現を何回見直しても、クロール対象から除外してくれない。

もしかして、日本語対応の問題かな、と検索してみたらそうだった。
https://ja.osdn.net/projects/fess/forums/18580/35827/
行ごとにおまじないが必要だって(先頭に書くだけではダメ)。
#DISABLE_URL_ENCODE
.*/広報係/
#DISABLE_URL_ENCODE
.*/情報係/