嫁接MTP的Qwen3.6-35B-A3B模型实测结果公布
2026-05-08 08:18:55
31次阅读
2个评论
楼主上传嫁接MTP的Qwen3.6-35B-A3B模型,自测提速有限,称结果为初步性;网友反馈提速幅度受硬件影响差异大,有评论解释MoE模型用MTP提速远不及密集模型的原理,该模型暂不支持mmproj,MTP多占约900MB显存。
收藏 0 0
    小陈 manage advert
    2026-05-08 08:19:28
    回复 |  引用
    小陈 manage advert
    2026-05-08 08:19:57
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注