GPT-5.5揪出AI数学基准三一致命错误引Reddit网友热议

2026-05-13 02:24:32

1次阅读

2个评论

本为前沿AI难点基准的FrontierMath，经Epoch的AI辅助复审发现1-4档约三分之一有致命错误，Noam Brown确认初始标记来自GPT-5.5，需等待修正后分数。网友调侃AI反向审核试题，提及过往AI基准多有错，也引发相关讨论与争议。

收藏 0 赞 0

小陈 manage advert

2026-05-13 02:25:05

小陈 manage advert

2026-05-13 02:25:34

共2条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert