Catatan Lab AI | ALTOS LAB Journal

Kategori

Quality Assurance— Catatan implementasi AI, alat, dan produk.

Kualitas Model Biasanya Menurun Sebelum Tim Menyadarinya

OpenAI Evals, riset Anthropic, leaderboard Hugging Face, dan literatur arXiv menunjukkan risiko yang sama: kualitas model bergeser ketika data, tugas, dan perilaku pengguna berubah.

Kolom市場專欄8 menit baca