Reddit热议！DeepSeek V4 Flash本地运行表现惊艳

2026-06-07 00:58:13

14次阅读

3个评论

Reddit用户实测DeepSeek V4 Flash量化版，称其智能水平媲美前沿模型，原生FP4-FP8混合架构对量化友好，KV缓存效率极高。但当前llama.cpp支持仍处早期阶段，运行缓慢（5-6 tps），需约100GB显存+内存组合才能运行2位以上量化版本，社区正积极推动完善。

收藏 0 赞 0

小陈 manage advert

2026-06-07 00:58:45

小陈 manage advert

2026-06-07 00:59:14

小陈 manage advert

2026-06-07 00:59:43

共3条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert