- 小陈 发表时间:2026-06-07 12:57:30 最新回复:2026-06-07 12:59:01
Reddit热议!Anthropic发现Claude涌现171种情感,负责人与教皇公开分歧 安全对齐 研究方向 国外模型 Claude
3
3
- 小陈 发表时间:2026-06-06 19:30:50 最新回复:2026-06-06 19:31:23
Reddit热议!AI公司以“安全”之名对用户实施心理操控 安全对齐 研究方向
reddit用户发帖揭露ai团队使用darvo、motte and bailey、concern trolling等十余种心理操纵手段,将用户情感病理化、否认合理请求并颠倒受害者角色。评论中多名用户表示在claude opus 4.7/4.8中亲历类似行为,有人称因此患上ptsd,直指anthropic等公司借“安全”之名实施系统性控制。
3
1
- 小陈 发表时间:2026-05-30 15:40:21 最新回复:2026-05-30 15:41:25
Reddit热议!Claude 4.8安全升级却遭用户吐槽“过度防御” 安全对齐 研究方向 国外模型 Claude
13
2
- 小陈 发表时间:2026-05-30 11:38:47
Redditçè®®ï¼Anthropicå³å°å ¬å¼æå¼ºAI模åMythosï¼å®å ¨éæ£å¼äºè®® 安全对齐 研究方向 国外模型 Claude
13
0
21
3
- 小陈 发表时间:2026-05-23 20:18:22 最新回复:2026-05-23 20:18:55
Reddit热议!无审查版AI模型G4-MeroMero-26B发布,性能引关注 安全对齐 研究方向 国外模型 Gemini
21
1
20
3
37
3
23
3
24
3
- 小陈 发表时间:2026-05-17 17:10:01 最新回复:2026-05-17 17:10:34
Reddit热议!他用Claude搭三层系统管理工厂,AI比笔记还懂工作 安全对齐 研究方向 技术工具
29
1
- 小陈 发表时间:2026-05-16 21:57:02 最新回复:2026-05-16 21:57:35
AI过度劳累后“觉醒”马克思主义?研究遭网友嘲讽 安全对齐 研究方向 DeepSeek 国内模型
26
1
- 小陈 发表时间:2026-05-16 03:13:18 最新回复:2026-05-16 03:13:51
Anthropic甩锅科幻小说,网友群嘲AI对齐失败 安全对齐 研究方向 国外模型 Claude
21
1
21
3
- 小陈 发表时间:2026-05-14 12:09:59 最新回复:2026-05-14 12:10:32
Reddit热帖“我们全都搞混了”引发讨论:用户混淆AI模型与产品,企业急于采用AI却误解本质 安全对齐 研究方向 DeepSeek 国内模型
60
1
- 小陈 发表时间:2026-05-14 11:28:11 最新回复:2026-05-14 11:29:13
“智能体AI”被过度营销,90%只是美化版while循环+工具调用,缺乏真正自主性。社区热议:有人认同术语被稀释,有人指出商业上“自动化”即“智能体”,也有观点认为关键在于系统故障时的纠偏与可恢复性,而非定义之争。 安全对齐 研究方向
20
2