~
yuze.dev
首页
博客
项目
报告
Now
关于
CV
EN
搜索
⌘K
← 返回博客
#
eval
1 篇文章
技术
·
2026年5月15日
·
2 min
搭一条能扛日常迭代的大模型评测管线
评测管线最容易踩的坑不是评测算法本身,而是被忽略的工程边界条件。
#llm
#eval
#infra