FireRedASR 是小红书开源的语音识别模型,支持识别普通话、方言和英文。它分为两个版本:

  • FireRedASR-LLM:效果最佳,普通话识别开源领先,利用 LLM 处理语音数据。
  • FireRedASR-AED:采用 AED 架构,兼顾效率和效果。

简单来说,FireRedASR 提供了两种不同的解决方案,一种追求极致的性能,另一种则在性能和效率之间找到平衡。目前代码和模型已经开源。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐