AI 大模型资源圈

国内外大模型资源分享、技术交流、实用工具、场景应用与资源分类整理。

  • 小陈 发表时间:2026-06-05 13:30:18 最新回复:2026-06-05 13:31:19

Reddit热议!英伟达发布550B参数巨无霸模型,网友调侃:我的烤面包机都能跑? 架构技术 研究方向

6
2
  • 小陈 发表时间:2026-06-04 13:27:17 最新回复:2026-06-04 13:28:19

Reddit热议!谷歌Gemma 4 12B无编码器多模态模型发布 架构技术 研究方向 国外模型 Gemini

4
2
  • 小陈 发表时间:2026-05-29 06:07:59 最新回复:2026-05-29 06:09:01

Reddit热议!Zai用新网络架构让AI推理成本降33%、性能反升15% 架构技术 研究方向 GLM 国内模型

18
2
  • 小陈 发表时间:2026-05-23 16:25:36 最新回复:2026-05-23 16:27:07

Reddit热议!50M参数小模型逆袭大模型,老外怎么看? 架构技术 研究方向

20
3
  • 小陈 发表时间:2026-05-14 21:28:41 最新回复:2026-05-14 21:29:14

AI视频生成:场景级控制比单次提示更关键 架构技术 研究方向 技术工具

20
1
  • 小陈 发表时间:2026-05-14 05:04:51 最新回复:2026-05-14 05:05:24

Ovis2.6-80B-A3B发布:MoE架构,低推理成本高多模态性能 架构技术 研究方向

20
1
  • 小陈 发表时间:2026-05-13 23:17:13 最新回复:2026-05-13 23:18:16

MagicQuant v2.0:混合GGUF量化与动态学习配置 架构技术 研究方向 技术工具

24
2
  • 小陈 发表时间:2026-05-12 20:50:13 最新回复:2026-05-12 20:50:46

MiniCPM 4.6登Reddit引热议:量化选择、适用场景等成讨论焦点 架构技术 研究方向

23
1
  • 小陈 发表时间:2026-05-11 13:51:35 最新回复:2026-05-11 13:52:08

小公司靠28nm老芯片造AI加速器 240W跑700B大模型挑战AMD英伟达 架构技术 研究方向

27
1
  • 小陈 发表时间:2026-05-10 19:51:06 最新回复:2026-05-10 19:52:08

YC投资公司用AI运营真实业务8个月,曝自主AI决策核心问题 架构技术 研究方向 应用

23
2
  • 小陈 发表时间:2026-05-10 19:41:21 最新回复:2026-05-10 19:42:51

英伟达发布Star Elastic嵌套AI模型 单检查点支持3种参数规模零样本切换 架构技术 研究方向

22
3
  • 小陈 发表时间:2026-05-08 13:16:25 最新回复:2026-05-08 13:17:55

网友攒2.3TB内存异构AI集群 求Tinygrad驱动合作 架构技术 研究方向 技术工具

28
3
  • 小陈 发表时间:2026-05-08 01:23:21 最新回复:2026-05-08 01:24:51

AMD推出PCIe版CDNA4架构Instinct MI350P加速器引热议 架构技术 研究方向 技术工具

29
3
  • 小陈 发表时间:2026-05-07 02:10:59 最新回复:2026-05-07 02:12:00

SubQ宣称12M代币亚二次注意力 引Reddit网友热议 架构技术 研究方向

28
2
  • 小陈 发表时间:2026-05-03 14:25:39 最新回复:2026-05-03 14:26:41

开发者纯C++17从零打造无依赖Transformer引网友热议 架构技术 研究方向 国外模型 GPT

26
2
  • 小陈 发表时间:2026-04-30 17:46:27 最新回复:2026-04-30 17:47:58

Qwen推出FlashQLA高性能线性注意力内核 仅支持SM90及以上GPU Qwen 架构技术 研究方向 国内模型

81
3
  • 小陈 发表时间:2026-04-19 04:39:12

博主吐槽YouTube“氛围编码赚百万”是骗局 架构技术 研究方向 国外模型 Claude

51
0
  • 小陈 发表时间:2026-04-16 07:49:54

Reddit热议:大模型预测下一个词难实现严格逻辑推理 架构技术 研究方向

49
0
  • 小陈 发表时间:2026-04-10 13:51:39

Reddit热帖讨论中国AI迭代快成本低,西方应对存疑 架构技术 研究方向 GLM 国内模型

141
0
共19条 1