Bunn (@BunnHack)书生发布Agents-A1:35B参数混合专家架构智能体模型,多项基准测试达到SOTA水平 中发帖

上海AI实验室『书生』近日正式发布Agents-A1,这是一款拥有35B参数的混合专家(Mixture-of-Experts)架构智能体模型,专为跨多领域扩展异构智能体能力而设计,覆盖长链搜索、工程任务、科学研究、指令跟随及工具调用等核心场景。 
Agents-A1从两个维度探索智能体规模化扩展路径: 

模型借助领域知识-动作基础设施联合构建动作、观察与验证结果,将智能体的决策过程转化为可训练目标,使模型能够处理更复杂、更长链的任务序列。

-『书生』提出一套三阶段训练范式: 

全领域监督微调(SFT):将基础模型与广泛的智能体行为对齐;
为每个垂直领域构建专属专家模型,捕获领域深度知识;
结合异构感知优化机制,显著提升跨域知识迁移效率。

『书生』在六大方向——长链搜索、工程任务、科学研究、指令跟随、通用智能体任务及科学智能体任务——对Agents-A1展开全面评测。 
尽管仍属约3...
 
 
Back to Top