GPT-5.5揪出AI数学基准三一致命错误引Reddit网友热议
2026-05-13 02:24:32
1次阅读
2个评论
本为前沿AI难点基准的FrontierMath,经Epoch的AI辅助复审发现1-4档约三分之一有致命错误,Noam Brown确认初始标记来自GPT-5.5,需等待修正后分数。网友调侃AI反向审核试题,提及过往AI基准多有错,也引发相关讨论与争议。
收藏 0 0
    小陈 manage advert
    2026-05-13 02:25:05
    回复 |  引用
    小陈 manage advert
    2026-05-13 02:25:34
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注