实验室正式开源了 OpenTalking,一个面向实时交互场景的 AI 数字人对话框架。
OpenTalking其打通了 LLM、语音识别、语音合成、WebRTC 音视频播放和多种数字人驱动模型,支持实时对话、视频生成、视频克隆以及私有化部署。无论是快速搭建 Demo,还是进一步开发可落地的数字人应用,OpenTalking 都希望提供一套开放、灵活、可扩展的技术底座。
欢迎大家体验、Star、提 Issue、贡献代码,也欢迎对数字人、语音交互、多模态 AI 感兴趣的开发者和研究者一起交流共建。
GitHub:
https://github.com/datascale-ai/opentalking

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐