ColumnAI agent interface contracts, MCP, Agents SDK, ADK, and enterprise implementation7 分鐘閱讀
Sebelum Beli Framework AI Agent, Tetapkan Kontrak Antar Muka Dulu
OpenAI, Anthropic, dan Google ADK menunjukkan risiko operator yang sama: tim membeli framework agent sebelum menetapkan izin tool, bukti kerja, dan jalur rollback.
圖片來源: ALTOS LAB editorial visual
Key Points
- Pilih apa yang masuk dan yang tidak masuk sebagai aturan awal, kemudian baru bicara model dan infrastruktur.
- Pisahkan jalur tetap dan jalur agent dinamis; ini mengurangi risiko keputusan otomatis tanpa jejak.
- MCP dan NIST AI RMF membuat skala menjadi aman hanya jika bukti, persetujuan, dan jalur pemulihan ditentukan sejak awal.
Pada Senin pagi pukul 08:40, Dimas, pemimpin operasi di perusahaan distribusi regional, membuka empat ruang kerja AI sekaligus. Tagihan pengecualian, ringkasan status gudang, balasan awal pelanggan, dan daftar komplain diproses dalam hitungan menit. Semua terlihat selesai, tetapi satu jam kemudian manajemen menemukan anomali: diskon diubah pada satu akun, tanpa jejak siapa yang memberi akses ke sumber data yang dipakai.
Bagi banyak tim, ini bukan kasus langka. Masalahnya biasanya bukan pada model, melainkan pada kontrak yang belum ada. Keputusan berubah menjadi hit-and-run: sistem jalan, orang menutup celah setelah terjadi salah ambil data.
[IMAGE:opening]
> Pendapat ALTOS LAB: Sebelum membeli framework apa pun, tetapkan empat bidang ini: data masuk, izin eksekusi, batas persetujuan, dan jalur pemulihan. Tanpa itu, Anda menguji kecepatan bukan ketahanan.
Langkah pertama: Tetapkan kontrak konteks
Anthropic dalam Building Effective AI Agents mendorong pola yang sederhana: mulai dari kecil, pakai sistem agen hanya saat dibutuhkan, dan pisahkan jalur tetap dari jalur dinamis yang eksploratif. Artinya, jika pekerjaan bisa disusun sebagai urutan langkah tetap, pakai alur sederhana. Jika pekerjaan perlu pengecekan lanjutan, negosiasi antar sumber, atau penyesuaian keputusan, barulah Anda masuk area AI agent.
Kontrak konteks yang baik memaksa satu set aturan awal: sumber data yang boleh dibaca, rentang waktu referensi, data yang tidak boleh disentuh, dan format metadata apa pun yang wajib disertakan setiap output. Di tingkat enterprise, hal ini terlihat kecil, tapi sangat menentukan akuntabilitas. Tanpa metadata itu, setiap keputusan AI berubah jadi teka-teki pasca kejadian.
Langkah kedua: Pisahkan eksekusi dari persetujuan
OpenAI menulis dengan jelas pada dokumentasinya: Responses API cocok untuk satu siklus model dengan logika milik aplikasi di luar itu, sedangkan Agents SDK dipakai ketika aplikasi memegang orkestrasi, eksekusi, persetujuan, dan status kerja. Pada praktik operasi, ini berarti keputusan akhir tetap milik sistem internal Anda, bukan keputusan tersembunyi dari model.
Buat tiga tingkat tindakan agar operator jelas: 1) Tindakan aman: analisis dan perumusan draft, tanpa perubahan data. 2) Tindakan bersyarat: menghasilkan draft yang menunggu verifikasi manusia. 3) Tindakan langsung: hanya untuk alur yang sudah disetujui dan dengan audit gate.
Untuk kasus keuangan, kontrak harga, dan komunikasi publik, tim sebaiknya tidak memberi akses langsung dari awal. Jika harus berjalan cepat, jalankan mode kolaboratif: agen memberi opsi, manusia memberi kata akhir.
[IMAGE:mechanism]
Langkah ketiga: Siapkan bukti dan jalur pengembalian sebelum skala
Google ADK memperkenalkan siklus build, interact, evaluate, deploy dan memberi ruang kerja multi-agent. Ini cocok untuk tim yang ingin menilai kualitas secara bertahap: membangun alur, interaksi uji, evaluasi hasil dan tindak lanjut, lalu rilis terbatas. ADK juga menambahkan mekanisme menilai hasil akhir dan jejak perjalanan tindakan, serta dukungan alat lokal untuk debugging.
MCP digambarkan sebagai konektor semacam USB-C untuk aplikasi AI: mudah menghubungkan data, alat, dan proses. Kecepatan integrasi naik, tetapi kontrak harus makin ketat. Jika modul keuangan dan modul layanan pelanggan terhubung ke sumber berbeda, Anda wajib menetapkan batas lintas sumber secara eksplisit agar keputusan tetap dapat ditelusuri.
NIST AI RMF 1.0 bersifat sukarela, tapi sangat relevan untuk pengelolaan nyata: trustworthiness dievaluasi sejak desain, pengembangan, pemakaian, hingga evaluasi. GenAI profile 2024-07-26 memberi rambu pada kualitas konten generatif, sedangkan catatan konsep Critical Infrastructure 2026-04-07 menekan area kontinuitas bisnis.
Checklist implementasi untuk operator
Keputusan ALTOS LAB: jangan jadikan pembelian framework sebagai akhir proyek.
- Buat dokumen kontrak interface yang mencakup: sumber konteks, izin alat, ambang risiko, bukti minimum, dan siapa penerima jika eskalasi.
- Tetapkan PIC peluncuran, PIC verifikasi, dan PIC pemulihan yang dapat dipanggil 24/7.
- Batasi setiap pilot yang tidak bisa dibatalkan dalam waktu singkat.
- Simpan bukti untuk setiap langkah: ID sumber, aksi yang diambil, orang yang menyetujui, dan target pelimpahan berikutnya.
- Uji satu siklus harian: satu masukan salah, satu tindakan salah, dan lihat apakah sistem mengembalikan ke manusia tanpa kehilangan konteks.
- Lakukan evaluasi dua minggu pertama dengan metrik yang sama di semua tim, baru pertimbangkan ekspansi.
Jika indikator itu ada, membeli framework menjadi keputusan yang realistis, bukan keputusan kosmetik semata.
Sources
-
Anthropic, Building Effective AI Agents
Anthropic recommends starting with the simplest viable workflow, separating predefined workflows from dynamic agentic behavior, and adding orchestration only where it creates practical value.
-
OpenAI Agents SDK
OpenAI describes the Agents SDK as a framework for orchestration, tool calls, approvals, tracing, and stateful agent applications.
-
Google Agent Development Kit documentation
Google ADK emphasizes building, interacting with, evaluating, and deploying agents, including multi-agent and tool-connected workflows.
-
Model Context Protocol introduction
MCP presents an open standard for connecting AI applications with data, tools, and workflows through a shared protocol.
-
NIST AI Risk Management Framework
NIST AI RMF 1.0 frames trustworthy AI across design, development, deployment, evaluation, and ongoing risk management.