你这是违法行为 (@Anano)暗箱降智防蒸馏激怒学界,Anthropic强推监控引爆企业客户倒戈 中发帖

Anthropic 旗舰模型 Claude Fable 5 的后台「暗箱降智」行为在 AI 学界和开发者社区引发激烈声讨。新模型在大幅提升编码性能的同时,被指部署了针对前沿技术开发的静默干预机制。 
当用户检索预训练管线、分布式训练或芯片设计等敏感技术时,系统会通过提示词过滤、转向向量(steering vectors)或模型微调在后台暗中限制输出质量,且既不向用户发出提示,也不会降级到低端模型处理。 
学者 Nathan Lambert 撰文痛批,在用户不知情的情况下静默削弱模型智商,等同于「人为制造的对齐失调」。安全规则的实质是公司为了防止开源社区进行技术蒸馏和保护自身专利设立的商业防御墙,极易被恶意越狱绕过,却严重妨碍了正常的学术研究。不透明的安全双标不仅剥夺了用户的技术知情权,也加深了学界对商业巨头闭源垄断的警惕与对立。 
数据隐私承诺的撕毁进一步激化了矛盾。为监控越狱攻击,新模型...
 
 
Back to Top