很多大语言模型数不对 “strawberry” 中 “r” 的数量,主要是由模型的技术原理和特性导致的
·
很多大语言模型数不对 “strawberry” 中 “r” 的数量,主要是由模型的技术原理和特性导致的,具体原因如下:
- Token 化机制的天然缺陷:大模型处理文本时会先将字符序列转换为子词单元(Token),这可能导致字母级信息丢失。如 “strawberry” 可能被分词为 “str-aw-berry”,“berry” 中的两个 “r” 被合并为一个 Token,模型难以追踪每个字母的具体位置,可能误认为是一个整体而非两个独立字母。
- 注意力机制与长程依赖:
- 注意力权重归一化:Transformer 的注意力权重会被归一化,导致无法有效累积计数信息。当统计 “r” 的数量时,模型可能因注意力分散而漏数。
- 训练数据偏差:若训练数据中存在大量拼写错误,如 “strawbery”,模型会将错误模式泛化,影响对正确单词中字母数量的判断。
- 词表大小限制:当字符数量超过模型维度,例如 Llama 3.1 的 405B 参数,计数任务的准确率会显著下降。
- 任务特性与模型能力不匹配:大模型的能力分布不均衡,表现为复杂任务强、简单任务弱,语义理解强、形式计算弱,模式匹配强、逻辑推理弱。它擅长理解 “草莓” 的含义,却不擅长准确统计字符,依赖训练数据中的统计规律,而非符号逻辑。同时,模型 “无自我认知” 特性使其无法判断自身是否擅长计数任务,也不会主动调用工具辅助计数。
更多推荐


所有评论(0)