Claude / Gemini / Codex CLI 에이전트는 K8s 장애를 얼마나 잘 다룰까? (AIOps Agent Benchmark)

9개 에이전트를 같은 조건에서 10개 K8s 장애 시나리오에 돌려보니, 효율 티어가 플래그십을 앞섰고, 브랜드마다 운영 과제를 다루는 성격이 뚜렷이 갈렸다.

2026년 5월 27일 · 4 분 · Hoon Jo