kang (@kang0225)关于具身智能的一些思考 中发帖

什么叫具身智能?具身智能不就是广义的让机器使用机器嘛。 
让机器使用机器,有两种思路,一种是把工具的使用流程算法化(这就类似于机器的组装过程),但这种方法过于局限了,只要是稍微复杂一点的工具,那机器人就做不了。 
所以我们有了第二种思路,也就是VLA,类似于大语言模型的发展,我们希望模型可以去学习人类的轨迹,从而来学会工具的使用。 
但这种方法其实也是有局限性的,显而易见就是数据量的严重匮乏。 
其实从人类自身的学习阶段其实很明显的可以发现,我们的具身智能还走在人类的婴儿期阶段。我觉得蹒跚学步这个词就很形象的形容当前的具身的方向。通过让VLA去学习各种轨迹,学会应该如何初步的去操作某些常用的工具。这必然意味着在他没有见过的工具,他可能甚至都不知道从何处下手,他如果只见过了抓取杯子的行为,那必然是没有见过使用锤子的行为,那你让一个只会用杯子的婴儿去拿起锤子干活,这显然有点不符合常理。 
所以...
 
 
Back to Top