@xvx一个人搞了两个月,聊聊用 AI 做短视频自动生成的技术方案和踩坑 中发帖

最近半年一直在折腾一个项目——用 AI 自动生成短视频。起因是身边做小生意的朋友总问我能不能帮忙剪视频发抖音,我想这事儿应该能自动化,就开始做了。 
分享一下技术方案和踩过的坑,希望对有类似想法的朋友有参考价值。 

整体架构 
用户上传素材 + 输入文案
    ↓
TTS 语音合成(MiniMax / 火山引擎)
    ↓
根据语音时长自动分配素材时间轴
    ↓
云端渲染(转场、字幕、BGM)
    ↓
成品视频

后端 FastAPI + MySQL,前端 Vue 3,视频渲染走云端 API,手机端用 Capacitor 套了个壳。一个人全栈,没有团队。 

几个有意思的技术点 
1. TTS 选型 
试了一圈,最后主力用 MiniMax speech-2.8-hd,中文多音字准确率目前最好。火山引擎作为补充,主要是剪映生态的独有音色(奶气萌娃、广告解说这种)。Azure 的...
 
 
Back to Top