@xvx 在 一个人搞了两个月,聊聊用 AI 做短视频自动生成的技术方案和踩坑 中发帖
最近半年一直在折腾一个项目——用 AI 自动生成短视频。起因是身边做小生意的朋友总问我能不能帮忙剪视频发抖音,我想这事儿应该能自动化,就开始做了。
分享一下技术方案和踩过的坑,希望对有类似想法的朋友有参考价值。
整体架构
用户上传素材 + 输入文案
↓
TTS 语音合成(MiniMax / 火山引擎)
↓
根据语音时长自动分配素材时间轴
↓
云端渲染(转场、字幕、BGM)
↓
成品视频
后端 FastAPI + MySQL,前端 Vue 3,视频渲染走云端 API,手机端用 Capacitor 套了个壳。一个人全栈,没有团队。
几个有意思的技术点
1. TTS 选型
试了一圈,最后主力用 MiniMax speech-2.8-hd,中文多音字准确率目前最好。火山引擎作为补充,主要是剪映生态的独有音色(奶气萌娃、广告解说这种)。Azure 的...