【国产大模型】DeepSeek发布推理版本r1,性能超越openAI o1
DeepSeek-R1-Lite预览版在解决这些复杂数学问题时拥有极强的“拆解能力”,能够将复杂任务分解为更小的步骤并逐一执行,从而提高其准确性。当时,DeepSeek V2的API定价约等于谷歌的七分之一,GPT-4 Turbo的七十分之一。在前不久发布模型名为DeepSeek-R1-Lite,预览版在难度较高数学和代码任务上超越o1-preview,大幅领先GPT-4o等。随着思维长度的增加,
·
2023年4月在杭州成立的DeepSeek在今年一战成名。
被誉为大模型界的拼夕夕,以价格低廉闻名。当时,DeepSeek V2的API定价约等于谷歌的七分之一,GPT-4 Turbo的七十分之一。
在前不久发布模型名为DeepSeek-R1-Lite,预览版在难度较高数学和代码任务上超越o1-preview,大幅领先GPT-4o等。
AIME在美国数学竞赛(AMC)中难度等级最高,所以常被用来测试不同模型解决推理问题的性能。DeepSeek-R1-Lite预览版在解决这些复杂数学问题时拥有极强的“拆解能力”,能够将复杂任务分解为更小的步骤并逐一执行,从而提高其准确性。
随着思维长度的增加,DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高。推理时间更长,性能更佳。如下图所示
值得一提的是,官方表示,目前模型仍在开发阶段,经持续迭代,正式版DeepSeek-R1模型将完全开源,包括公开技术报告并提供API。

官方网址 http://chat.deepseek.com
快来体验一下吧!
更多推荐

所有评论(0)