
모델 품질 저하는 갑자기 오지 않고 늦게 발견된다
OpenAI Evals, Anthropic 연구, Hugging Face leaderboard, arXiv 평가 문헌은 데이터, 과제, 사용자 행동이 바뀌면 모델 품질도 서서히 흔들린다고 말한다.
카테고리

OpenAI Evals, Anthropic 연구, Hugging Face leaderboard, arXiv 평가 문헌은 데이터, 과제, 사용자 행동이 바뀌면 모델 품질도 서서히 흔들린다고 말한다.