pandalin (@pandalin_ai)同样的模型和 Prompt,为什么 Codex 写中文论文明显不如 ChatGPT 网页版? 中发帖

最近在做一个体量比较大的中文学术写作项目,主力工具一直是 Codex。不过用得越多,越明显感觉到一个问题:Codex 写出来的中文“人味”比较弱。 
这种情况在 5.55.4 模型上都存在。内容通常不能说错,逻辑也基本完整,但读起来容易生硬、机械,句式重复,段落之间的衔接也不够自然。尤其是在论文润色、扩写和重组论述时,模型味会比较明显。 
于是我简单做了一个对比实验: 

使用同一段论文原文;
输入完全相同的润色任务和 Prompt;
分别在 Codex 和 ChatGPT 网页版中运行;
尽量保持模型版本和其他条件接近。

结果在我的样本里,ChatGPT 网页版的输出明显更加自然,可读性和流畅性也更好;Codex 的版本则更像是在“完成修改指令”,虽然形式上完成了任务,但文字经常缺少自然的语气和节奏。 
目前我能想到几种可能: 

Codex 的 system prompt 更偏...
 
 
Back to Top