Linuxサーバを定期的にかつ自動的にハードウエア・リセットする仕組みを実装した。Linux/Cronと、いわゆるリブータとの連動での実現だ
このサーバーは、USB3で外付けミラーHDDを三系統接続している。そのうちの一系統が、動作がおかしくなる。その際は、サーバーを再起動すると概ね復旧するが、まれに復旧に失敗する。その際は、電源をOFF/ONする再起動を実施することで回復ができる
この運用障害を、一週間に一度自動再起動することで回避できないかを試行する。この仕組みは、監視カメラなどでも有用だ
実機は15TほどをUSB3のミラーHDDで運用している。サーバーとその周辺装置のUSB3外付けHDDは同じ電源管理システムの管理下にある。電源管理システムは、サーバーの稼働監視をすることができ、電源OFF-ONを自動化できる
いつもアクセスありがとうございます。匠技術研究所で運用している大規模Linuxサーバーの自動電源OFF-ONと再起動情報を共有します