LY Corporation Tech-Verse 2026

AI

AI가 경보 대응 엔지니어가 될 때까지 : 로그 해석과 판단의 자동화로 운영 부하를 삭감한 실천

시간
5:00 - 5:15 PM JST
언어
JA

매일 끊임없이 울리는 시스템 알림. 그 운영 과정에서 “Splunk를 열어 해당 로그를 검색하고”, “긴 에러 로그나 StackTrace를 읽어 영향도와 대응 필요 여부를 판단하는” 작업은 엔지니어에게 높은 인지 부하와 심리적 장벽을 요구하고 있었습니다. 그 결과 대응이 특정 담당자에게 의존하게 되거나 초기 대응이 지연되는 일이 발생했고, 알림 확인을 위한 정례 회의는 점점 길어지며 팀 전체의 피로도가 높아지고 있었습니다.

본 세션에서는 이러한 “알림 피로”를 해소하고, 매일 30분 이상 소요되던 정례 회의를 5-10분으로, 기존 대비 1/3 이하로 단축한 “AI 기반 운영”의 실천 사례를 소개합니다. 사내 FaaS 플랫폼인 Funk, Splunk API, 그리고 생성형 AI인 ChatAI Proxy를 연계하여, 로그 수집부터 원인 분석, 대응 판단 지원까지의 전체 흐름을 Slack 안에서 완결할 수 있도록 한 시스템 아키텍처와 구축 접근 방식을 공유합니다.

본 세션에서는 다음 내용을 다룹니다.

  • 사내 FaaS와 Splunk API를 활용한 이벤트 기반 로그 자동 검색 구조
  • “로그를 찾고 읽는” 경험에서 “AI가 로그를 해석하고 진단 결과를 전달하는” UX로의 전환
  • 과거 대응 사례를 프롬프트에 반영하여 AI 진단 정확도를 높이는 방법
  • 자동 리액션 등 룰 기반 자동화와 LLM 기반 추론의 역할 분담을 통해 “사람의 의사결정을 가볍게 만드는” 설계 방식
  • 여러 도구를 오가지 않고 Slack 안에서 완결되는 운영 플로우를 구축하기 위한 실무 포인트

이는 단순히 생성형 AI를 시험적으로 도입한 사례가 아닙니다. 기존 운영 플로우에 AI를 어떻게 자연스럽게 내장하고, 현장의 인지 부하를 어떻게 극적으로 낮출 수 있는지를 보여주는 실전적인 Ops 개선 사례입니다.

일상적인 알림 대응이나 운영·유지보수 업무에 어려움을 느끼고 있는 엔지니어, 그리고 생성형 AI를 실제 업무 플로우에 통합해 구체적인 효과를 내고자 하는 분들에게, 바로 현장에서 재사용할 수 있는 설계 패턴과 운영 노하우를 제공합니다.


Toshiki Nagasaki

LY CorporationMedia Search Domain/Ads Development SBU/Search Ad Development Unit/Development Division 2

2017년 신입 사원으로 SIer에 입사했습니다. 이후 웹 서비스 기업에서 커머스 및 맛집 검색 사이트의 검색 엔진 개발을 거쳐, 2025년 LY Corporation에 경력직으로 입사했습니다. 현재는 쇼핑 검색 광고(SSA, Shopping Search Ads)의 검색 엔진 시스템 개발 및 유지보수·운영을 담당하고 있습니다.

모든 세션