Reddit热议!DeepSeek V4 Flash本地运行表现惊艳
2026-06-07 00:58:13
14次阅读
3个评论
Reddit用户实测DeepSeek V4 Flash量化版,称其智能水平媲美前沿模型,原生FP4-FP8混合架构对量化友好,KV缓存效率极高。但当前llama.cpp支持仍处早期阶段,运行缓慢(5-6 tps),需约100GB显存+内存组合才能运行2位以上量化版本,社区正积极推动完善。
收藏 0 0
    小陈 manage advert
    2026-06-07 00:58:45
    回复 |  引用
    小陈 manage advert
    2026-06-07 00:59:14
    回复 |  引用
    小陈 manage advert
    2026-06-07 00:59:43
    回复 |  引用
共3条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注