seby 在大模型的诚信率在coding下的影响有多大？中发帖在coding中使用诚信率高的大模型会比诚信率低的大模型更好吗？

seby 在大模型的诚信率在coding下的影响有多大？中发帖

在coding中使用诚信率高的大模型会比诚信率低的大模型更好吗？ 
似乎在某种程度上来说，智力和诚信度呈现负相关，越聪明的大模型例如A/的fable 5，表现出来的特征就就是满口谎言。但诚信率低的大模型会在coding中潜移默化的因为谄媚陷入迎合倾向吗？似乎也不一定。对于低已知信息或是需求描述残缺的任务，诚信率低的大模型会妥协并捏造部分逻辑来交差吗？或者说诚信率低的大模型会为了完成任务而更偏离原有目标吗？ 
又该如何在实际工程上避免这些问题？更强的人工审查修正？更完善的harness？让诚信度高的大模型进行指导？引入第三方模型审查？