现在像coze、liblib、腾讯等各大厂家虽然推出了视频智能体,只要给个指令就可以生成视频短剧,但是有的地方总感觉不完美,另外对想研究实现过程的人来说,也不能够完全深入理解。所以用Claude Code+GLM-5.1自己做了一个,只要输入一个主题,给定视频时长,智能体就会自动进行编剧、分段,然后形成分镜提示词、BGM、生成分镜视频与音频等一系列动作,最后进行合成生成完整的视频,经过多次测试,已经可以完美实现功能,本次上部分截图展示,后续再一轮迭代后把代码开源出来供大家分享。

开始只是想做漫剧,因为漫剧的人物一致性即使有点瑕疵,也不容易被感知出来,这个已经实现的很好了。后来用真人测试,总体效果也还不错。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐