单RTX5090跑Qwen3.6-27B-INT4破百TPS引Reddit热议
2026-04-27 04:53:09
67次阅读
0个评论
楼主分享用vLLM 0.19在单RTX5090上跑Lorbus量化的Qwen3.6-27B-INT4,256k上下文达105-108TPS;评论区有3090跑通案例、16G显存难撑的反馈,还讨论量化质量、配置优化建议。
收藏 0 0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注