点点点…点娘! (@Guandengle) 在 米哈游搞了一个视频角色表演生成模型 LPM 1.0 中发帖
简单来说就是
用视频来驱动虚拟角色实时“表演”(动作+表情)的AI模型系统
声音是外界给的
可以是第三方 TTS(比如语音合成),可以是已有录音,可以是实时麦克风输入
它负责根据这些音频把角色表达出来
支持任意时长生成
具体可以去看文档
很适合那种用数字人的场景