老文 (@taichuy)模型降智-正是测试各位harness能力时候了-大佬们把焚决交出来 中发帖

我是用gpt 5.5 的pro 20x, 使用sub2api反代,最近gpt 5.5 已经快降到和Gemini一桌了。 
想着去any那边蹭一下claude ,结果发现好家伙,AI双神双双陨落。 
怎么办,换国模吗。。。也不是不行,但是我觉得这样不是办法,所以我决定死磕。 
1flowbase 开发就不应该绑定模型能力,俗话说,潮水褪去之后,才知道谁在裸游。 
我打算借此机会,给你1flowbase迭代skills和harness 功能能力。 
根据我最近观察,gpt 5.5 在一些短任务上其实完成还算是可以,但是长任务就算规划再好,一压缩就绷不住了。。。 
因此,最近开始小任务开始调教,首先限制他执行预算: 
1.首选开发之前要先对齐任务,让他先复述一下可能结果,首先不能让他理解错了 
 [image] 
2.然后限制测试预算,不跑重门禁 
在实践中发现,现在1flowbase中很多时候...
 
 
Back to Top