ここから本文です

【Oracle Database 12c対応】トラブル未然防止/迅速解決のための「アラートログ監視の5大キーワード」

9/21(木) 11:38配信

@IT

 本連載「Oracleサポート出張所」は、「Oracle Database」で発生するトラブルを「どんな方法で」「どのように」解決していくか。長年、筆者がOracle Databaseのサポート業務で培ってきた経験を基に、Oracle Databaseの運用管理をする上で「より円滑に、かつ成長を見据えて業務を推進していく」ために必要なノウハウを紹介していきます。

 前回は、トラブル解決の第一歩となる「アラートログの見方」を解説しました。今回は、「そのアラートログから、何を監視すべきか」のポイントを解説します。

●アラートログの的確な監視は、トラブルの未然防止や迅速解決につながる

 サポートセンターには、トラブルだけでなく運用管理に関する問い合わせも数多く寄せられます。中でも多いのが「アラートログに問題のあるメッセージが出力された場合にメンバーに通知して共有することを検討しています。この場合、どんなメッセージを対象にして監視すべきでしょうか」といったものです。実はこちら、意外と多くの方から問い合わせがあります。

 アラートログはOracle Databaseで発生したさまざまなイベントが記録されたログです。つまり、アラートログを的確に監視しておくことが、トラブルを未然に防ぎ、迅速なトラブル対応を実現する第一歩になります。

 ここではアラートログの監視で有効となるキーワードと、その理由を解説します。監視すべきメッセージは環境ごとに異なるので、全てではなく、必要に応じて取捨選択をし、監視する時間帯なども検討するのがポイントです。キーワードは以下の通りです。

●Enterprise Edition+Diagnostics Packのライセンス環境ならば、監視の自動化が可能

 アラートログ監視に当たっては、Enterprise Edition+Diagnostics Packのオプションライセンスがある環境ならば、Oracle Enterprise Manager上でメトリック設定と通知機能を使うことで容易に実現できます。エラーだけでなく、個別のしきい値なども設定した上で管理者へアラートメールで通知する仕組みを自動化できます。

 一方、Enterprise Editionのみ、あるいはStandard Editionライセンスの環境でも、サードパーティー製の監視製品を利用するか、tailコマンドでアラートログを確認し、ユーザー自身で特定のメッセージが出力された際に通知するスクリプトをcronで定期的に実行するなどの方法で実現できます。

 例えば筆者の所属するアシストが提供している「iDoctor監視サービス」は、アラートログに出力されたOracle Databaseエラーメッセージも監視対象にできます。運用上予期され、かつ業務に影響のないエラーについては「特定の時間帯で発生するORA-XXXXXは無視する」といった例外処理も設定できます。

●いま一度、アラートログの内容をチェックしよう

 今回はアラートログの中で監視しておくべきメッセージを5種類紹介しました。アラートログには膨大な量のログが記録されます。全てのメッセージの意味を把握するのは困難ですし、そもそも「特に何を監視すべきか」はシステムにより異なります。しかし、今回紹介した「最低限押さえるべきポイント」を押さえておけば、システム固有の個別対策においてもその起点になるはずです。

 参考までに、筆者が過去にサポートを担当した重篤なトラブルの中には、「トラブルが発生する数日前からアラートログに警告やエラーが出力されており、その予兆を示していた。アラートログを的確に監視してさえいれば、トラブルは未然に防げた/ここまで重篤にはならなかった」と悔やまれることが多くあります。

 トラブルの未然防止、早期発見、早期対策のために、まずは自身が管理するシステムでどんなメッセージが出力されているのか、アラートログをいま一度チェックすることから始めてみてください。

●筆者紹介

大野高志(おおのたかし):株式会社アシスト サービス事業部 サポートセンター。2007年にアシスト入社後、Oracle Databaseのサポート業務に従事。2017年現在はサポート業務の傍ら、顧客の未解決トラブルを1つでも多く減らせるよう、サポートセンターに蓄積されている調査のノウハウを社内外に伝える活動を行っている

最終更新:9/21(木) 11:38
@IT