Etwxr9防投毒方案:利用codex pretooluse hook让第三方LLM审查agent tool use 中发帖

最近中转投毒的报告比较多,向AGENT接入不可信任的第三方LLM API必定伴随着巨大的安全风险。除了尽可能做到沙盒隔离之外,利用可信的LLM审查agent的读取、编辑等指令也是一个办法。作为一个纯小白,经过和AI的商讨,AI大概给我讲明白了。 
这个是codex的方案,claude code我没有研究。 
官方文档:Hooks – Codex | OpenAI Developers 
pretooluse hook可以让codex每次执行tool use的指令前,执行提前配置好的指令并等待返回确认,例如运行一个python脚本,并将tool use相关信息传递过去。 
随后,py脚本就可以调用deepseek api,让可信任又便宜的ds flash来检查codex要做的事情是否危险,要写的代码是否夹带私货。 
这样做的好处是可以让可信任的AI智能地判断安全风险,但同时也受到审查AI本身...
 
 
Back to Top