@impouo 在 又重度用了几天,DeepSeekV4的幻觉问题还是要注意 中发帖
使用环境:deepseek官方接口+最新版OpenCode
DeepSeekV4 pro-max(以下简称v4)的上下文能力,阅读能力,简单的推理理解能力毋庸置疑。但是最近重度用了一阵子发现,就算和kimi比,v4还是存在幻觉问题。
举个例子,我让agent去读取我的大论文并扩写10%,kimi会来回写一些车轱辘话分析的话来凑字数,v4直接开始编数据编结论 但要是说遣词造句,表达水平确实还是v4更胜一筹。
所以我现在使用v4都是会使用kimi对git diff进行二次监督修正,保证幻觉不会耽误正事。