監視対象のログにerrorの文字列が出力されたら障害判定するようにしていたのですが、導入当初は動いていたものが突然動かなくなるといった事象が発生しました。
当初エージェントのログに出力されていた、”cannot stat”という文字や”not supported”といった文字はサーバーに送る文字列がないため、出力されていたもので、対象の文字が出力されれば正常に検知し通知されることはテストでも確認していました。
※この正常に監視できる状態でもWebコンソールから見ると対象のアイテムは”ZBX_NOTSUPPORTED”といった表記になります。
改めて確認はしましたが、当初は動いていたので当然PermissionやOwnerの設定におかしなところはありませんでした。
原因がまったくわからなかったので、再起動してみたら動くようになりました・・・。
っていう気持ち悪い問題。
今のagentのversionは2.2.11だったので、いったん検証環境を2.2.16にあげて再検証を行う。