中国三峡大学硕士刘战 (@sanxialiuzhan)整理了一份「从论文到代码」的课件,偏 Codex 复现论文用 中发帖

这份是偏“论文复现怎么落代码”的 PPT,主要拿强化学习论文举例。 
里面不是讲怎么让 Codex 一口气写完整项目,更多是把事情拆小:先拆 Env、Agent、Training Loop、Evaluation,再一段段让 Codex 生成、跑 smoke test、看 traceback、继续修。 
我觉得比较有用的地方是几页 prompt: 

论文 Methods 怎么拆成 Gym Env
reward 怎么对齐论文里的目标函数和约束
怎么接 CleanRL 的 PPO 骨架
跑不起来时怎么让 Codex 顺着报错修

站内好像不能直接传 pptx,我压成 zip 了,里面就是原 PPT。 
从论文到代码.zip (184 KB) 
有做论文复现/学术编程的佬可以看看,里面的 prompt 直接改论文名和文件名就能用。
 
 
Back to Top