林翩翩 (@xg_ame)为什么我们需要代码索引工程 中发帖

AI 编程越来越常见,但有一个问题经常被忽略: 
模型开始写代码之前,必须先理解代码库。 
这一步不是免费的。 
Agent 需要知道哪些文件相关,哪些测试相关,哪些配置会影响结果。如果没有清晰的入口,它就只能自己搜索、读取、判断,再慢慢建立上下文。 
代码库越大,这个过程越容易变成主要成本。 
很多 token 并不是花在真正解决问题上,而是花在确认“该看哪里”。很多工具调用也不是为了修改代码,而是为了寻找上下文。很多返工也不是因为模型不会写代码,而是因为一开始看的地方就不对。 
代码索引工程的作用,就是提前把代码库整理成 Agent 可以查询的上下文入口。 
它不是把整个仓库塞给模型,也不只是关键词搜索。它更像是在代码库和 Agent 之间加了一层结构:当任务出现时,Agent 可以先知道哪些内容更相关,再开始阅读、修改和验证。 
我们最近做了一个对比实验。 
同一个 OpenClaw...
 
 
Back to Top