Reddit热帖!16GB显卡跑35B大模型,老外实测性能炸裂
2026-06-09 13:32:35
2次阅读
2个评论
Reddit网友发布开源项目Luce Spark,可在16GB显存上运行35B MoE模型。通过动态专家缓存和校准放置,Qwen3.6 35B模型从20.5GiB降至13.3GiB,速度达119 tok/s。网友热议其创新性,但质疑实际16GB显卡表现和长上下文支持。
收藏 0 0
    小陈 manage advert
    2026-06-09 13:33:08
    回复 |  引用
    小陈 manage advert
    2026-06-09 13:33:37
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注