【ZEGO即构开发者日报】华为开源openPangu-R-7B-Diffusion扩散语言模型;商汤科技发布并开源原生多模态模型架构NEO;Mistral AI 推出 Mistral 3 系列模型..
中国AI与游戏产业双线突破:华为开源7B扩散语言模型创数学推理新纪录;商汤发布原生多模态架构NEO,实现视觉语言深层融合;MistralAI推出675B参数开源模型。同时,SensorTower数据显示中国手游厂商在海外表现亮眼,超30家进入收入TOP100,点点互动、库洛等厂商在SLG、二次元等细分领域取得突破。
🔨「产品技术」
1.华为开源openPangu-R-7B-Diffusion扩散语言模型
【关键词】华为、扩散语言模型、数学推理
华为开源openPangu-R-7B-Diffusion扩散语言模型,基于openPangu-Embedded-7B用800B tokens续训练,成功将上下文长度扩展至32K。模型在MMLU-Pro超越16B参数的LLaDA 2.0-mini-preview 22%,数学推理MATH得分84.26,代码生成MBPP得分84.05,创7B参数量级新SOTA。
2.商汤科技发布并开源原生多模态模型架构NEO
【关键词】商汤科技、原生多模态架构、语言视觉模型
NEO 由商汤与南洋理工大学S-Lab联合研发,宣称是“行业首个可用的、实现深层次融合的原生多模态架构(Native VLM)”,旨在实现视觉与语言在底层的深层融合,区别于当前主流的“视觉编码器+投影器+语言模型”模块化方案。NEO通过原生图块嵌入、三维旋转位置编码等技术创新,在多项多模态基准测试中表现突出,且训练数据效率较高,仅需约3.9亿图像文本示例。

3.Mistral AI 推出 Mistral 3 系列模型:从 3B 到 675B,Apache 2.0 开源
【关键词】Mistral AI、小型密集模型、非推理模型模型
法国人工智能初创企业 Mistral AI 当地时间 2 日宣布推出其新一代 Mistral 3 系列模型,包括其采用稀疏架构的首款混合专家模型 Mistral Large 和三款小型密集模型。
Mistral Large 总参数量为 675B,活跃参数规模为 41B。这些模型及衍生版本均以 Apache 2.0 许可证开源。Mistral AI 表示,使用 3000 块英伟达 H200 GPU 从头训练的 Mistral Large 3 是全球顶尖的开放权重模型之一。在经过后训练后,该模型在通用提示方面与市场上最佳的指令微调开放权重模型达到了同等水平,同时在多语言对话方面展示了图像理解和行业顶尖性能。Mistral Large 3 在 LMArena 排行榜的 OSS 非推理模型类别中位列第二,OSS 总榜第六。

🔎「行业观察」
1.2025年海外手游市场:中国厂商表现突出
【关键词】海外手游市场、中国厂商、中国厂商
SensorTower数据显示,在截至11月15日的海外手游收入TOP100中,有超30家中国厂商上榜。点点互动凭借《Whiteout Survival》及新品《Kingshot》稳居出海厂商收入首位。多个厂商聚焦细分赛道持续发力,如柠檬微趣深耕Merge-2品类,FunPlus、三七互娱等持续探索SLG市场。部分厂商取得新突破,如库洛《鸣潮》在日本创收入新高,叠纸《恋与深空》在美国市场表现强劲。

更多推荐


所有评论(0)