seby大模型的诚信率在coding下的影响有多大? 中发帖

在coding中使用诚信率高的大模型会比诚信率低的大模型更好吗? 
似乎在某种程度上来说,智力和诚信度呈现负相关,越聪明的大模型例如A/的fable 5,表现出来的特征就就是满口谎言。但诚信率低的大模型会在coding中潜移默化的因为谄媚陷入迎合倾向吗?似乎也不一定。对于低已知信息或是需求描述残缺的任务,诚信率低的大模型会妥协并捏造部分逻辑来交差吗?或者说诚信率低的大模型会为了完成任务而更偏离原有目标吗? 
又该如何在实际工程上避免这些问题?更强的人工审查修正?更完善的harness?让诚信度高的大模型进行指导?引入第三方模型审查?
 
 
Back to Top