Lurume (@user2778)我把 Superpowers 改造成了一个更适合做深度学习模型改进的版本 中发帖

最近我基于原版 Superpowers,做了一个更偏深度学习研究场景的个性化版本:superpowers_DL。 
原版项目本身很有启发,它更偏软件工程工作流,适合做需求拆解、实现推进、代码协作这类任务。 
但我自己的主要场景其实不太一样。我更常做的是: 

读论文
改模型
设计实验
debug 训练
分析结果
判断这次改动到底是不是真的有效

做久了以后我会越来越明显地感觉到一个问题: 
很多时候,深度学习研发的瓶颈根本不是“代码写得慢”,而是实验流程太容易失控。 
比如: 

还没把假设想清楚,就先把模型改了
baseline 没有对齐,最后结果不好解释
训练一出 NaN、发散、OOM,就开始凭经验乱试
单次跑涨点就很兴奋,但 seed、配置、评测口径其实都没控好
失败实验没有沉淀记录,过两周又重复踩一遍同样的坑

所以我做这版 superpowers_DL,核心目标不是让 AI “帮...
 
 
Back to Top