Reddit热帖!16GB显卡跑35B大模型,老外实测性能炸裂
2026-06-09 13:32:35
2次阅读
2个评论
Reddit网友发布开源项目Luce Spark,可在16GB显存上运行35B MoE模型。通过动态专家缓存和校准放置,Qwen3.6 35B模型从20.5GiB降至13.3GiB,速度达119 tok/s。网友热议其创新性,但质疑实际16GB显卡表现和长上下文支持。
0
0
2026-06-09 13:33:08

回复 |
引用
2026-06-09 13:33:37

回复 |
引用
共2条
1