システムを安定稼働させるためには、日頃の効率的なシステム管理が大切です。 そのためには、システムのリソースは足りているかどうか、 アプリケーションやプロセスは正常に稼働しているかなど、 システム全体の稼働状況をリアルタイムに把握することが重要です。
監視対象のサーバーやネットワーク機器が数百から数千台あるような大規模システムでは、 システム全体の稼働状況を把握するために大手ソフトウェアベンダーから 販売されている高価な統合監視ソフトウェアを利用する必要がありました。 中小規模のシステムではコストの問題からそのような監視ソフトウェアの導入が難しいことがほとんどです。
しかし、近年普及してきたNagiosやHobbit・ZABBIXなどのオープンソースソフトウェアを使用することにより、 ソフトウェアコストをかけずに導入することが可能となります。
Nagiosはシステムとネットワークの統合監視ソフトウェアです。オープンソースで開発が続けられており、 商用ソフトウェアに劣らないほどの機能と柔軟性を備えています。また、Linux上で稼働し、 特殊なハードウェアは不要です。
ネットワークに接続された機器を様々な方法で監視し、障害発生時あるいは復旧時に決められた方法で通知を行います。 また、Webインターフェースを備え、監視対象の状態や変化のログの閲覧、あるいは監視の操作が行えるようになっています。
監視対象の機器やサービスに異常が発生した場合、管理者に通知することができます。ホストやサービスごとに通知先を変更したり、復旧するまで何度も通知を行ったりすることも可能です。また、電子メールや携帯メール以外の方法で通知することもできます。エスカレーション機能も備えています。
「親」を定義することで停止や未到達のホスト群の決定もしくは区別を支援することができます。この機能により、あるルータ下にサーバーが複数ある環境で、ルータに障害が発生した場合に管理者が受信する通知メールは1通で済みます。
イベントハンドラ機能は、サービスやホストをチェックした後、状態が変化した場合に追加で任意のコマンドを実行できる機能です。例えば、チェックして異常があった場合、自動で再起動を行う、データベースに記録するといったことが可能です。
Nagiosはプラグインを通して監視を行います。プラグインを自作することで、独自のサービス監視が可能となります。
監視中のサービスやホストの現在の状態に加え、過去の障害データを分析するレポーティング機能、Nagiosデーモン自身を操作する外部コマンドインターフェースが備わっています。
アイビスは、Nagiosにより約200台の機器・約1100のサービスを監視している実績があり、蓄積された多くのノウハウがあります。 この実績とノウハウでお客様のシステム運用を支援致します。