AI
「ログを見に行く」をゼロに〜AIによるログの理解と判断支援で実現する、Slack完結型のアラート運用〜
日々鳴り続けるシステムアラート。その運用において、「Splunkを開いて該当のログを検索する」「StackTrace等の長大なエラーログを読み解き、影響や対応要否を判断する」という作業は、エンジニアに高い認知負荷と心理的ハードルを強いていました。その結果、対応の属人化や初動の遅れが生じ、アラート確認の定例会議は長時間化してチームは疲弊していました。
本セッションでは、この「アラート疲れ」を解消し、毎日30分以上かかっていた定例会議を5-10分へと1/3以下に短縮した「AI駆動オペレーション」の実践事例を紹介します。社内FaaS(Funk)、Splunk API、そして生成AI(ChatAI Proxy)を連携させ、ログ収集から原因分析、対応判断の支援までをSlack上で完結させるシステムアーキテクチャとその構築アプローチを共有します。
- 社内FaaSとSplunk APIを用いたイベントドリブンなログ自動検索の仕組み
- 「ログを探す・読む」から「AIが翻訳し、診断結果を届ける」UXへの転換
- 過去の対応事例をプロンプトに組み込み、AIの診断精度を向上させる手法
- 自動スタンプ等のルールベースとLLMを組み合わせた「人の意思決定を軽くする」設計
- ツールを横断せず、なるべくSlackのみで完結させる運用フロー構築のポイント
単なる生成AIの試験導入の話ではなく、「既存の運用フローにいかにAIを組み込み、現場の認知負荷を劇的に下げるか」という実践的なOps改善の知見を共有します。
日々のアラート対応や運用保守業務に課題を感じているエンジニアや、生成AIを実際の業務フローに組み込んで具体的な効果を出したいと考えている方にとって、明日から現場で再利用できる設計パターンと運用ノウハウをお届けします。
