pandalin (@pandalin_ai) 在同样的模型和 Prompt，为什么 Codex 写中文论文明显不如 ChatGPT 网页版？中发帖最近在做一个体量比较大的中文学术写作项目，主力工具一直是 Codex

pandalin (@pandalin_ai) 在同样的模型和 Prompt，为什么 Codex 写中文论文明显不如 ChatGPT 网页版？中发帖

最近在做一个体量比较大的中文学术写作项目，主力工具一直是 Codex。不过用得越多，越明显感觉到一个问题：Codex 写出来的中文“人味”比较弱。 
这种情况在 5.5 和 5.4 模型上都存在。内容通常不能说错，逻辑也基本完整，但读起来容易生硬、机械，句式重复，段落之间的衔接也不够自然。尤其是在论文润色、扩写和重组论述时，模型味会比较明显。 
于是我简单做了一个对比实验： 

使用同一段论文原文；
输入完全相同的润色任务和 Prompt；
分别在 Codex 和 ChatGPT 网页版中运行；
尽量保持模型版本和其他条件接近。

结果在我的样本里，ChatGPT 网页版的输出明显更加自然，可读性和流畅性也更好；Codex 的版本则更像是在“完成修改指令”，虽然形式上完成了任务，但文字经常缺少自然的语气和节奏。 
目前我能想到几种可能： 

Codex 的 system prompt 更偏...