Reddit热议!DeepSeek V4 Flash本地运行表现惊艳
2026-06-07 00:58:13
14次阅读
3个评论
Reddit用户实测DeepSeek V4 Flash量化版,称其智能水平媲美前沿模型,原生FP4-FP8混合架构对量化友好,KV缓存效率极高。但当前llama.cpp支持仍处早期阶段,运行缓慢(5-6 tps),需约100GB显存+内存组合才能运行2位以上量化版本,社区正积极推动完善。
0
0
2026-06-07 00:58:45

回复 |
引用
2026-06-07 00:59:14

回复 |
引用
2026-06-07 00:59:43

回复 |
引用
共3条
1
相关帖子
- DeepSeek V4 Pro/Flash上线HuggingFace,网友热议参数与运行门槛
- DeepSeek V4解答经典药丸逻辑题引Reddit网友热议
- DeepSeek V4 Pro被指智能密度下降 引发Reddit用户热议
- DeepSeek V4答对热门AI测试题称是经典谜语引热议
- DeepSeek V4解分橙题脑洞离谱,网友调侃确认AGI
- DeepSeek-v4 384K最大输出能力引网友实测热议
- DeepSeek-V4以1/6成本逼近SOTA 引Reddit中美AI竞赛热议
- 网友实测Qwen3 TTS本地实时运行:表现力超强被严重低估
- GPT-Image-2总统测试表现惊艳,Reddit网友热议AI能力
- 通义千问Qwen3.6 27B本地实测表现优异引网友热议