Reddit热议!Claude Opus 4.8在MineBench上碾压4.7,成本更低效果更强
2026-06-01 15:01:35
10次阅读
2个评论
MineBench测试显示,Opus 4.8平均推理时间24.8分钟,15次构建总成本仅41.52美元,比4.7便宜得多。网友认为其思维链精简后输出质量反而提升,空间推理能力显著进步,但部分用户质疑模型添加了提示未要求的场景细节(如宇航员周围太空元素)。
0
0
2026-06-01 15:02:08

回复 |
引用
2026-06-01 15:02:37

回复 |
引用
共2条
1