Claude / Gemini / Codex CLI 에이전트는 K8s 장애를 얼마나 잘 다룰까? (AIOps Agent Benchmark)
9개 에이전트를 같은 조건에서 10개 K8s 장애 시나리오에 돌려보니, 효율 티어가 플래그십을 앞섰고, 브랜드마다 운영 과제를 다루는 성격이 뚜렷이 갈렸다.
9개 에이전트를 같은 조건에서 10개 K8s 장애 시나리오에 돌려보니, 효율 티어가 플래그십을 앞섰고, 브랜드마다 운영 과제를 다루는 성격이 뚜렷이 갈렸다.