AI Lab Notes | ALTOS LAB Journal

カテゴリー

AI Evaluation— AI 実装、ツール、プロダクトのノート。

OpenAI Evals、Anthropicの研究、Hugging Faceのleaderboard、arXivの評価研究が示すのは、データ、タスク、利用者行動が変わるとモデル品質も徐々にずれるということです。

コラム市場專欄8 分で読めます