中国三峡大学硕士刘战 (@sanxialiuzhan) 在 整理了一份「从论文到代码」的课件,偏 Codex 复现论文用 中发帖
这份是偏“论文复现怎么落代码”的 PPT,主要拿强化学习论文举例。
里面不是讲怎么让 Codex 一口气写完整项目,更多是把事情拆小:先拆 Env、Agent、Training Loop、Evaluation,再一段段让 Codex 生成、跑 smoke test、看 traceback、继续修。
我觉得比较有用的地方是几页 prompt:
论文 Methods 怎么拆成 Gym Env
reward 怎么对齐论文里的目标函数和约束
怎么接 CleanRL 的 PPO 骨架
跑不起来时怎么让 Codex 顺着报错修
站内好像不能直接传 pptx,我压成 zip 了,里面就是原 PPT。
从论文到代码.zip (184 KB)
有做论文复现/学术编程的佬可以看看,里面的 prompt 直接改论文名和文件名就能用。