小红书开源 FireRedASR：支持普通话、方言和英文的语音识别模型

三花AI

840人浏览 · 2025-02-12 09:58:40

三花AI · 2025-02-12 09:58:40 发布

FireRedASR 是小红书开源的语音识别模型，支持识别普通话、方言和英文。它分为两个版本：

FireRedASR-LLM：效果最佳，普通话识别开源领先，利用 LLM 处理语音数据。
FireRedASR-AED：采用 AED 架构，兼顾效率和效果。

简单来说，FireRedASR 提供了两种不同的解决方案，一种追求极致的性能，另一种则在性能和效率之间找到平衡。目前代码和模型已经开源。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

使用 Reasonix 接入 DeepSeek：从零搭建你的 AI 编程助手

AI Agent技术社区

从理论到落地：基于TOGAF+FastGPT的企业级Agent需求调研与构建实战

企业级AI Agent项目失败通常源于需求调研不足，而非技术问题。本文结合TOGAF框架和FastGPT工具，提出了一套系统化的需求调研方法论：需求调研六大维度：业务目标、干系人、功能需求、数据需求、技术约束和治理合规，全面覆盖Agent构建要素。实施流程：通过准备、收集、分析、验证、文档化五个阶段，结合4W1H框架，确保需求管理的系统性和可追溯性。 FastGPT实践：利用其知识库管理、流程