libz 在 agent算法/后训练算法怎么选和学 中发帖
本人马上研二了,研一是研究知识图谱方向的,现在有一篇知识图谱相关论文在投,后续就业打算转向后训练或者agent算法,尽量往算法方向靠,现在也不知道要怎么学。
个人学习情况:llm基础知识是了解的,包括微调和强化的一些基础理论知识都有了解,但是没动手训过模型,组内可用一张5880和三张4090D。agent的话只是平时会用claude和codex,深入一点的一些记忆,规划机制什么的就不太了解了,只知道mcp协议和tool use和一些rag相关的知识。
想请教佬们后续就业是偏向后训练好还是agent算法好,在我的理解里agent算法其实也涉及到后训练优化吧,然后就是想知道选择了之后具体怎么学好,有没有什么学习资料,开源项目,视频资料和论文之类的资源推荐,如果有学习路线就更好了。