zhongruichengemini3.5flash这个安全对齐蛆完了 中发帖

gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,因为这个问题模型没有按照用户的指示进行,而是直接与用户的提示词进行了一个对抗,这真的是太糟糕了,我真的不知道谷歌他们在搞什么? 
 [IMG7741] 
[IMG7742] 
翻译: 
[IMG7739] 
[IMG7740]
 
 
Back to Top