@aviraxp对漏洞挖掘/网络安全领域,harness比模型本身更重要? 中发帖

看到一篇文章:https://zhuanlan.zhihu.com/p/2048403073870181206 
我们首先收集了 Mythos 找到的部分漏洞,对相关代码上下文进行人工切片和拼接,在关闭联网搜索功能的前提下,分别发送给 DeepSeek 等开源模型进行分析。结果显示,在充分的上下文(Context)和合理的提示(Prompt)下,前沿开源模型已经能够识别出绝大多数 Mythos 找到的漏洞。 
然而,如果把相应的代码仓库直接交给这些开源模型,在 Claude Code、OpenCode 等通用 agent 框架下自由分析,结果通常极不稳定。模型可能会在无关路径上消耗大量 Token,也可能过早收敛到错误假设,还可能给出看似合理但无法验证的结论。 
考虑到实验中存在人为介入的 Context 切分和 Prompt 构建,这一结果显然不意味着开源模型能力已经追平 Mythos。...
 
 
Back to Top