Fessの2回目Crawl所要時間は59分だった。
初回の124分より速いのは、2回目だから?それとも空いていたから?
いずれにしても長い。もっと速くならないかな。
ちょっとログを覗いてみよう。
/var/log/fess/fess-crawler.logに
java.lang.OutOfMemoryError: Java heap spaceが出てる。
デフォルトのままでは不足するようだ。
fessとcrawlerの両方を512mから2gにしたらエラーは出なくなった。
/etc/sysconfig/fess
FESS_HEAP_SIZE=2g
/etc/fess/fess_config.properties
jvm.crawler.options=\
-Xmx2g\n\
Dashboardにload averageが表示されている。
Crawler動作中は3.5くらいになっていることに気づいたので、
仮想プロセッサを2から4に増やした。
/var/log/fess/fess-suggest.logにもエラーが出てる。
org.opensearch.OpenSearchStatusException: OpenSearch exception [type=illegal_state_exception, reason=The number of tokens produced by calling _analyze has exceeded the allowed maximum of [10000]. This limit can be set by changing the [index.analyze.max_token_count] index level setting.]
長い文章にはトークン(キーワード)が10000以上含まれているからだ。
無視してよさそう。
/var/log/fess/fess-thumbnail.log
WARN msofficeThumbnailGenerator is failed (exit code:1, timeout:false): [${path}/generate-thumbnail, msoffice, ${url}, ${outputFile}]
同じエラーが大量に出ている。
オフィスファイルすべてにこのエラーが出ている気がする。
LibreOfficeとImageMagickをインストールしないといけないみたい。
https://fess.codelibs.org/ja/14.1/config/thumbnail.html#ms-office
一度インストールしてみて、有用かどうか試そう。
不要ならサムネイル作成自体実行しないようにすればCrawl時間を節約できそう。