网友热议27B密集模型优于397B MoE模型的原因
2026-04-23 13:16:31
74次阅读
0个回答
Reddit用户询问Qwen的27B密集模型为何优于397B MoE模型,评论称该优势多体现在编码等特定基准测试,密集模型全参数激活,MoE活跃参数少;大模型在长上下文逻辑、世界知识更强,性能也与模型迭代、训练质量相关。
收藏 0

登录 后回答问题。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注