@aviraxp 在对漏洞挖掘/网络安全领域，harness比模型本身更重要？中发帖看到一篇文章：

@aviraxp 在对漏洞挖掘/网络安全领域，harness比模型本身更重要？中发帖

看到一篇文章：https://zhuanlan.zhihu.com/p/2048403073870181206 
我们首先收集了 Mythos 找到的部分漏洞，对相关代码上下文进行人工切片和拼接，在关闭联网搜索功能的前提下，分别发送给 DeepSeek 等开源模型进行分析。结果显示，在充分的上下文（Context）和合理的提示（Prompt）下，前沿开源模型已经能够识别出绝大多数 Mythos 找到的漏洞。 
然而，如果把相应的代码仓库直接交给这些开源模型，在 Claude Code、OpenCode 等通用 agent 框架下自由分析，结果通常极不稳定。模型可能会在无关路径上消耗大量 Token，也可能过早收敛到错误假设，还可能给出看似合理但无法验证的结论。 
考虑到实验中存在人为介入的 Context 切分和 Prompt 构建，这一结果显然不意味着开源模型能力已经追平 Mythos。...