crawlerのメモリを減らしすぎたようで、メモリ不足で止まってしまった。
2022-06-23 17:47:30,397 [IndexUpdater] ERROR IndexUpdater is terminated.
java.lang.OutOfMemoryError: Java heap space
少し増やし、-Xmx1536mにしてみた。
また、elasticsearchのメモリを指定してなかったので、-Xms4g -Xmx4gにしてみた。
これで最後まで走ってくれるかな?
複数の課がアクセスできるフォルダをクロールしたので、
試しに検索してみたら何もヒットしなかった。
どうやらネストしたアクセス権には対応していないらしい。
アクセス権を列挙しておこう。
クロールし直さないと反映しないので、漏れがないように気を付けよう。
次はラベルを試してみよう。
例えばうちの係では、情報処理、統計調査、答弁書、区長要望
という風に絞り込みできると便利だ。
設定してみたけど反映しない。
たぶんこれもクロールし直しが必要なんだろう。