Reddit热议!Unsloth发布Gemma 4的MTP GGUF权重
2026-06-06 13:44:35
4次阅读
2个评论
Unsloth为Gemma 4的31B、26B-A4B和12B模型发布了MTP GGUF权重(Q8、F16、BF16)。网友讨论热烈,有用户实测用26B-A4B作为草稿模型可获3倍加速,但许多人困惑MTP与e2b相比优势何在。评论指出Google的MTP架构与Qwen不同,需单独加载草稿模型,且llama.cpp尚未完全支持,目前仅能通过PR编译测试。
收藏 0 0
    小陈 manage advert
    2026-06-06 13:45:08
    回复 |  引用
    小陈 manage advert
    2026-06-06 13:45:37
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注