ColumnAI agent interface contracts, MCP, Agents SDK, ADK, and enterprise implementation7 分鐘閱讀

Bago bumili ng AI agent framework, isaayos muna ang kontrata sa interface

更新 2026/06/14Filipino

OpenAI, Anthropic, at Google ADK point to the same operator risk: teams buy agent frameworks before defining tool approval, evidence, and rollback decisions.

圖片來源： ALTOS LAB editorial visual

Key Points

Magpatupad ng malinaw na kontrata ng context at awtorisasyon bago pumasok sa framework decision.
Ang Anthropic, OpenAI, ADK, at MCP ay pare-parehong nangangailangan ng hiwalay na antas ng proseso at kontrol.
Ang NIST AI RMF 1.0 ang gabay para siguraduhin na ang AI agent ay may ebidensiya at rollback plan sa bawat yugto.

Bandang 9:10 ng umaga, Liza, isang operations lead sa kompanya ng serbisyo, nagbukas ng apat na proseso gamit ang AI: update ng invoice, pagtatala ng support case, draft ng pangungusap sa kliyente, at follow-up sa bodega. Lahat natapos parang maganda. Ngunit sa huling pagsusuri, isang pagbabago sa presyo ay naipatupad kahit walang dokumentadong pahintulot.

Ito ang klasikong pattern sa maraming kumpanya: mabilis ang output, pero hindi malinaw kung sino ang may pananagutan at saan babalik ang gawain kapag mali. Ang isyu ay hindi makina, kundi kontrata sa operasyon.

[IMAGE:opening]

> Pananaw ng ALTOS LAB: Hindi dapat magsimula sa pagpili ng framework. Magsimula sa apat na pilosopiya ng kontrata: context, aksyon, approval, at rollback.

Unang hakbang: I-define muna ang context contract

Sa Building Effective AI Agents ni Anthropic, malinaw na mensahe: magsimula sa maliit, gamitin ang agent-style system lang kung kailangan, at ipakita ang pagitan ng fixed na proseso at agent na may mas malikhaing hakbang. Kung ang gawain ay laging may iisang landas, huwag pilitin bilang agent.

Magandang kontrata ng context ay sasabihin: aling data source ang puwedeng gamitin, hanggang anong petsa, anong field ang bawal i-edit, at anong metadata ang dapat lumabas sa bawat resulta. Kapag wala nito, magiging mahirap mag-rollback o mag-audit sa totoong oras.

Ikalawang hakbang: Ihiwalay ang pagpapatupad at pag-apruba

Ayon sa dokumentasyon ng OpenAI, ang Responses API ay angkop sa isang model turn na may logic sa application side, habang ang Agents SDK ay para sa mas malawak na paghawak sa orkestrasyon, aplikasyon ng aksyon, approval at status ng proseso. Sa praktikal na operasyon, ang app ang may hawak ng kontrol.

Gawin ang tatlong antas ng pagtanggap: 1) Safe suggestion: pagsusuri at draft lang. 2) Conditional action: may draft na kailangan ng tao. 3) Direct action: pagpapatupad sa system pagkatapos maaprubahan.

Sa kategoryang pera, kontrata, at kliyente, panatilihin muna sa antas ng tao hanggang natitiklang stable ang sistema.

[IMAGE:mechanism]

Ikatlo: I-prepare ang ebidensiya at proseso ng pagbabalik

Ipinapakita ng Google ADK ang cycle na build, interact, evaluate, deploy. Nakatulong ito dahil pinipilit ang team na hindi agad mag-scale nang hindi na-a-assess ang bawat yugto. May suporta rin ito sa multi-agent setup at paggamit ng MCP sa mga koneksyon, pati local CLI at Web UI debugging.

Ang MCP ay inihahambing bilang USB-C para sa AI apps dahil kaya nitong mag-ugnay ng data, tools, at proseso sa mas simple na paraan. Pero mas maraming koneksyon, mas kailangan ang detalyadong kontrata. Kung may agent na nakakabit sa billing at may isa pa sa customer records, kailangan maingat ang panuntunan ng pakinabang ng bawat pinanggalingan.

Sa NIST AI RMF 1.0, na boluntaryo, ang core ay trustworthiness sa design, development, use, at evaluation. Ang GenAI profile noong 2024-07-26 at concept note para sa critical infrastructure noong 2026-04-07 ay nagdadagdag ng diin sa impact at recovery discipline. Hindi ito biro ng dokumento lang, ito ay patakaran ng operasyon.

Checklist na puwedeng gawin ngayong linggo

Payo ng ALTOS LAB: huwag umasa sa speed bilang sukatan; sukatan ang kakayahan ng rollback at pamamahagi ng responsibilidad.

Gumawa ng standard interface contract para sa bawat team.
Isaad ang roles: sino ang nagmumungkahi, sino ang nag-aapruba, sino ang humahawak sa rollback.
Itakda ang daily pause rule kapag may dalawang risky failure.
Mag-log ng ebidensiya: source ID, action ID, operator, oras, at kung saan bumalik ang case.
Magsagawa ng dalawang linggong pilot sa iisang kategoryang mababago nang mabilis.
I-test ang scenario na mali ang input, at ang output ay kailangang ibalik sa manual queue.

Kapag hindi pa ito kayang gawin, itigil muna ang scaling. Mas mahalaga ang malinaw na kontrata kaysa mapabilis na deployment.

Ang kontrata dito ay hindi dapat lang nakasulat sekali. Tuwing linggo, i-update ang kontrata mula sa tunay na kaso sa operasyon, at tiyakin na may malinaw na panuntunan pagbalik kapag may output na hindi inaasahan o may side effect.

Abstract handoff map for AI agent context, tool permissions, and approval boundaries — A safe AI agent program starts with the handoff contract, not the tool list.

Abstract workflow diagram showing evaluation loops and rollback checkpoints for AI agents — Approvals, evidence, and recovery paths must be visible before agent work scales.

Sources

Anthropic, Building Effective AI Agents · Anthropic · 2024/12/19
Anthropic recommends starting with the simplest viable workflow, separating predefined workflows from dynamic agentic behavior, and adding orchestration only where it creates practical value.
OpenAI Agents SDK · OpenAI · 2026/06/14
OpenAI describes the Agents SDK as a framework for orchestration, tool calls, approvals, tracing, and stateful agent applications.
Google Agent Development Kit documentation · Google · 2025/04/09
Google ADK emphasizes building, interacting with, evaluating, and deploying agents, including multi-agent and tool-connected workflows.
Model Context Protocol introduction · Model Context Protocol · 2026/06/14
MCP presents an open standard for connecting AI applications with data, tools, and workflows through a shared protocol.
NIST AI Risk Management Framework · NIST · 2024/07/26
NIST AI RMF 1.0 frames trustworthy AI across design, development, deployment, evaluation, and ongoing risk management.

Tommy

ALTOS LAB 產品與 AI 導入編輯，關注企業流程、生成式搜尋與能真正落地的決策框架。