遐蝶 (@Castorice) 在 各位佬用龙虾、Hermes Agent类型软件的时候,模型幻觉严不严重啊?有解决方案吗? 中发帖
继上贴,【龙虾平替】Hermes Agent内置的Copilot渠道的幻觉实在太严重了!气死我了!💢 - #7,来自 Castorice
本人高强度体验了几天,发现GitHub Copilot的Gemini-3.1-pro幻觉极其严重,跑长任务,我中途追踪进度都总是欺上瞒下,阴奉阳违,总之做长任务和挂后台的任务可以说压根做不了。完全不符合“数字替身”这个名号。目前没办法,主要用中转站的较新grok(幻觉还是严重,干不了事情)和claude。额度不怎么够用,而且体验也没那么好。各位佬一般都是怎么用的?什么渠道?会有上述这些情况吗?跑长任务、Deep Research、改bug的情况是怎么样的?不得不说Claude code是真的好用。目前查了下,貌似去买DeepSeek官方的api能解决上述问题?