시장 브리프AI Agent 與工作流 / AI Agent / workflow / evals3분 읽기

첫 AI Agent 파일럿은 검토 가능한 워크플로에서 시작해야 한다

업데이트 2026/6/3한국어

OpenAI의 Codex 세무 Agent 사례, Anthropic의 사용자 연구, IBM의 Agent 설명은 같은 결론으로 모인다. 첫 AI Agent 파일럿은 업무가 검토되고 기록되며 수정될 수 있는지부터 확인해야 한다.

Cover image: Source image: Anthropic · source-attributed official article image

핵심 포인트

첫 AI Agent 파일럿은 반복되고 검토 가능하며 되돌릴 수 있는 업무에서 시작해야 한다.
OpenAI의 Codex 사례는 작업 기록과 평가 loop가 도입 품질을 좌우한다는 점을 보여준다.
ALTOS LAB은 출처, 기록, 사람의 수정, 회귀 평가를 갖춘 뒤 자율성을 넓히는 방식을 권한다.

자율성보다 검토와 복구를 먼저 증명해야 한다。OpenAI, Anthropic, IBM의 자료를 함께 보면 AI Agent 시장 신호는 “무엇을 할 수 있는가”에서 “업무로 관리할 수 있는가”로 이동하고 있다. ALTOS LAB은 첫 Agent 파일럿을 화려한 자동화가 아니라 검토 가능한 워크플로에 두어야 한다고 판단한다.

최신 배경: Agent는 운영 시스템으로 이동하고 있다

OpenAI의 Codex 세무 Agent 사례에서 봐야 할 지점은 세무 자동화 자체만이 아니다. 실무자의 수정, 제품 작업 기록, 평가 케이스를 연결해 Agent가 다음 개선으로 이어지는 loop를 만든 점이다. 실패가 기록되고 분류되고 다시 테스트되는 구조가 있다.

Anthropic의 81,000명 사용자 연구는 사람들이 AI에 원하는 것을 일상의 언어로 보여준다. 사람들은 반복 업무를 줄이고, 인지 부담을 낮추고, 통제감을 잃지 않은 채 일을 진행하고 싶어 한다. IBM의 Agent 설명도 관찰, 추론, 계획, 행동을 하나의 흐름으로 다룬다. 세 출처는 Agent 도입이 업무 설계라는 점을 보여준다.

가장 큰 자동화 아이디어부터 시작하지 말아야 한다

완전 자동 고객 대응, 전략 보고서 생성, 부서 간 의사결정 보조는 매력적으로 보인다. 하지만 권한, 데이터 품질, 책임 범위, 실패 후 복구가 한꺼번에 얽힌다. 첫 파일럿으로는 위험이 크다.

더 좋은 시작점은 고객 답변 초안, 영업 리서치 카드, 문서 사전 검토, 콘텐츠 출처 정리다. 이런 업무는 반복되고 입력이 비교적 안정적이다. 검토자가 분명하고 오류 유형도 정리하기 쉽다; 팀은 실패를 다음 평가 케이스로 바꾸는 연습을 할 수 있다. 눈에 띄는 demo는 아니다. 그러나 AI 업무를 운영하는 근육을 만든다.

ALTOS LAB 판단

Agent 파일럿의 목표는 AI가 사람처럼 보이는 것이 아니다. ALTOS LAB 판단은 다르다: 조직이 AI 작업을 관찰하고 평가하고 고칠 수 있음을 증명하는 것이 먼저다. 출처, 작업 기록, 사람의 수정, 회귀 평가가 없으면 demo에 가깝다. 이 네 가지가 갖춰질 때 자율성을 넓히는 결정이 가능해진다.

이번 주 먼저 할 일

이번 주에는 먼저 후보 업무를 출처, 권한, 검토자, 테스트 케이스, 롤백 경로 다섯 칸으로 적어 보세요. 빈칸이 있으면 아직 출시할 때가 아닙니다.

출처

Building self-improving tax agents with Codex · OpenAI · 2026/5/27
OpenAI and Thrive describe how practitioner review, product traces and Codex-driven evaluation targets turned a tax agent into a workflow that can improve after real use.
What 81,000 people want from AI · Anthropic · 2026/3/18
Anthropic reports a large multilingual user study about what people want from AI, including lower cognitive load, more meaningful work and stronger control.
What are AI agents? · IBM Think · 2026/6/3
IBM explains AI agents as systems that observe, reason, plan and act across tools and workflows, useful as a baseline definition for enterprise pilots.