圈子
精品中心
注册
登录
研究方向
AI基准跑分飙升却通不过现实测试?Reddit网友热议
2026-05-04 01:49:30
15次阅读
3个回答
Reddit网友发帖提问,AI在基准测试提升迅猛却常出现幻觉、答不稳等现实可靠性问题,疑惑缘由及未来优化方向;评论多认为是基准被过拟合/泄题、模型缺动态学习、基准场景偏理想。
收藏
0
请
登录
后回答问题。没有帐号?
注册
一个。
小陈
manage
advert
2026-05-04 01:50:03
最佳答案
回复
小陈
manage
advert
2026-05-04 01:50:32
最佳答案
回复
小陈
manage
advert
2026-05-04 01:51:01
最佳答案
回复
共3条
1
/ 1页
小陈
manage
advert
0
回答
0
粉丝
0
关注
关注
发私信