语音识别指标计算 WER

语音识别 WER 是什么意思。

AI视觉网奇

1826人浏览 · 2025-07-28 16:48:29

AI视觉网奇 · 2025-07-28 16:48:29 发布

目录

CER（Character Error Rate）

WER = Word Error Rate（词错误率）

🧮 WER 计算方式

✅ 理解要点

CER（Character Error Rate）

语音识别中的 CER（Character Error Rate） 是衡量语音识别系统准确性的一个重要指标，表示预测文本与参考文本在字符级别上的差异程度。

CER（Character Error Rate）定义：
CER 是编辑距离（Levenshtein 距离）与参考文本字符总数的比值：

语音识别 WER 是什么意思

WER = Word Error Rate（词错误率）

在语音识别（ASR, Automatic Speech Recognition）领域，WER 是一个常用的性能评估指标，全称是：WER = Word Error Rate（词错误率）

🧮 WER 计算方式

WER 是通过比较 识别结果（Hypothesis） 和 真实文本（Reference） 之间的差异来计算的，公式如下：

WER=S+D+IN\text{WER} = \frac{S + D + I}{N}WER=NS+D+I

其中：

S（Substitutions）：替换错误数（识别成了其他词）
D（Deletions）：漏识别的词数
I（Insertions）：多识别出的词数
N：真实文本中的词总数（即 Reference 中的词数）

📌 示例

假设真实文本是：

我爱自然语言处理

识别结果是：

我喜欢语言处理

对比：

“爱” → “喜欢”：1 个替换（S）
“自然” 被删掉：1 个删除（D）
没有额外多出的词：0 个插入（I）
总词数 N = 4

则：

WER=1（S）+1（D）+0（I）4=0.5=50%\text{WER} = \frac{1（S）+ 1（D）+ 0（I）}{4} = 0.5 = 50\%WER=41（S）+1（D）+0（I）=0.5=50%

✅ 理解要点

WER 越低越好，0% 表示识别完全正确。
常见语音识别模型，比如 Whisper、Kaldi、Wav2Vec2，在高质量数据上 WER 可以低至 5% 以下。
对于方言、多语种或嘈杂环境，WER 通常会高一些。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

cover

后端接入 AI Agent：Tool Calling 网关、幂等与审计日志实战

AI Agent技术社区

cover

AI导出鸭惊了！DeepSeek代码手机导出保姆级实操，不看亏一套海景房

AI Agent技术社区

OpenClaw vs Hermes Agent：企业级执行 vs 自我进化，一文读懂怎么选！

AI Agent 开源双子星深度对比：OpenClaw（GitHub 26.4w⭐）主打工程化落地，四层记忆+20+渠道+13,700+技能，适合企业自动化；Hermes Agent（53天10w⭐）主打闭环学习，四级记忆+自动技能进化+3,200+社区技能，越用越聪明。两者可互补组合：OpenClaw 做稳定执行引擎，Hermes 做持续学习大脑。短期落地选 OpenClaw，长期陪伴选 Her

AI Agent技术社区

所有评论(0)

查看更多评论

AI视觉网奇

已为社区贡献10条内容