libz 在 agent算法/后训练算法怎么选和学中发帖本人马上研二了，研一是研究知识图谱方向的，现在有一篇知识图谱相关论文在投，后续就业打算转向后训练或者agent算法，尽量往算法方向靠，现在也不知道要怎么学

libz 在 agent算法/后训练算法怎么选和学中发帖

本人马上研二了，研一是研究知识图谱方向的，现在有一篇知识图谱相关论文在投，后续就业打算转向后训练或者agent算法，尽量往算法方向靠，现在也不知道要怎么学。 
个人学习情况：llm基础知识是了解的，包括微调和强化的一些基础理论知识都有了解，但是没动手训过模型，组内可用一张5880和三张4090D。agent的话只是平时会用claude和codex，深入一点的一些记忆，规划机制什么的就不太了解了，只知道mcp协议和tool use和一些rag相关的知识。 
想请教佬们后续就业是偏向后训练好还是agent算法好，在我的理解里agent算法其实也涉及到后训练优化吧，然后就是想知道选择了之后具体怎么学好，有没有什么学习资料，开源项目，视频资料和论文之类的资源推荐，如果有学习路线就更好了。