Reddit热议Anthropic Opus 4.7模型性能与测试争议
2026-04-18 22:10:51
27次阅读
0个评论
这个测试显示Opus 4.7以更少token微弱领先人工分析,运行成本4406美元,比Opus 4.6便宜但仍高于其他模型。网友讨论模型迭代、吐槽该基准测试脱离实际,还差评Gemini的工具调用能力,不少用户怀念被削弱前的旧版模型。
0
0
相关帖子
- Opus 4.7在NYT测试中表现暴跌,引Reddit用户热议
- Reddit网友热议白宫允许美国机构使用Anthropic的Mythos模型
- Kimi K2.6被称可替代Opus 4.7 引发Reddit热议
- Reddit用户讨论Opus 4.7表现不佳的原因
- Claude Opus 4.7引热议,用户评价两极分化
- Opus4.7登SimpleBench引热议 Gemini高排名遭大量用户质疑
- Kimi K2.6被称可作Claude Opus 4.7平替引热议
- 外界担忧Mythos模型 白宫与Anthropic举行会晤
- 想换编码代理:从Opus4.7到Qwen35B靠谱吗?网友热议
- Reddit热议:“非裔美国人”术语的使用争议