DeepSeek-R1

DeepSeek-R1:革命性的专注推理语言模型

体验突破性的 AI 技术,在数学、编程和复杂问题解决方面具有卓越的推理能力

高级推理
2029 Codeforces Elo
AIME 79.8%

免费网站集成

拥有网站?使用简单的 iframe 代码免费嵌入我们专注推理的对话界面。无需注册。

<iframe src="https://www.deepseekr1.org/embed" width="100%" height="600px" frameborder="0"></iframe>

体验 DeepSeek-R1 的高级推理能力

你好!我是 DeepSeek-R1,一个专注于推理的高级 AI 助手。今天我能为你做些什么?

下载 DeepSeek-R1 移动应用

在您的移动设备上体验先进的 AI 推理

iOS App Store

适用于 iPhone 和 iPad 设备

下载

Google Play 商店

适用于安卓设备

下载

安卓 APK

直接下载 APK

下载

核心特性

探索 DeepSeek-R1 革命性的推理能力

高级推理

革命性的强化学习方法,实现包括自我验证和反思在内的复杂推理行为

  • 自然推理发展
  • 自我验证能力
  • 扩展思维链
  • 多步骤问题解决

数学卓越性

在数学任务中表现出色,在 AIME 2024 上达到 79.8% 的准确率,在 MATH-500 上达到 97.3%

  • 复杂数学推理
  • 竞赛级问题解决
  • 逐步解决方案
  • 证明生成

编程专长

专家级编程能力,在 Codeforces 上获得 2029 Elo 评分,超过 96.3% 的人类参与者

  • 多语言支持
  • 算法优化
  • 代码分析
  • 工程解决方案

多阶段训练

全面的训练策略,结合强化学习和监督微调

  • 冷启动阶段
  • 面向推理的强化学习
  • 数据过滤
  • 全场景优化

知识整合

在知识型测试中表现卓越,在 MMLU 上达到 90.8%,在 MMLU-Pro 上达到 84.0%

  • 全面的知识库
  • 跨领域理解
  • 事实准确性
  • 定期更新

模型蒸馏

成功将推理能力蒸馏到更小、更易访问的模型中

  • 多种模型规模
  • 保留核心能力
  • 高效部署
  • 资源优化

DeepSeek-R1 媒体报道

在 AI 推理能力领域树立新标准

数学卓越性

DeepSeek-R1 在 AIME 2024 数学竞赛问题上取得突破性的 79.8% 准确率,在 MATH-500 上达到 97.3%。

编程精通

在 Codeforces 上获得 2029 Elo 评分,DeepSeek-R1 展示了专家级的编程能力,超过 96.3% 的人类参与者。

创新训练

革命性的纯强化学习方法使复杂推理行为能够自然发展。

DeepSeek-R1 实战演示

观看 DeepSeek-R1 如何应对复杂的推理挑战

DeepSeek-R1:O(1) 性能,完全开源

观看 DeepSeek-R1 在数学、编程和复杂问题解决任务中的卓越表现。

DeepSeek-R1 性能指标

语言理解

MMLU (90.8%)90.8%
MMLU-Pro (84.0%)84.0%
AlpacaEval 2.0 (87.6%)87.6%

编程与工程

Codeforces (2029 Elo)2029 Elo
GPQA Diamond (71.5%)71.5%
ArenaHard (92.3%)92.3%

数学推理

AIME 2024 (79.8%)79.8%
MATH-500 (97.3%)97.3%

技术规格

探索 DeepSeek-R1 革命性的训练方法和能力

DeepSeek-R1 训练过程

用于自然推理发展的革命性强化学习方法

纯强化学习训练
多阶段优化
数据过滤和质量控制
全场景适应性

DeepSeek-R1 研究

在专注推理的语言模型领域开创先河

纯强化学习创新

革命性的方法,使用纯强化学习来发展自然推理行为,无需监督微调

多阶段训练

全面的训练策略,结合冷启动、面向推理的强化学习、数据过滤和全场景优化

技术论文

阅读我们全面的技术论文,详细介绍 DeepSeek-R1 的革命性训练方法和领先基准表现。

阅读论文

关于 DeepSeek

引领专注推理的 AI 的未来

公司背景

DeepSeek 通过革命性的强化学习方法和开放协作,引领 AI 推理能力的创新。

研究基础设施

我们先进的研究基础设施推动了 AI 推理能力和模型训练方法的突破性发展。

下载 DeepSeek-R1 模型

从我们的推理专注型模型系列中选择

DeepSeek-R1 基础模型

纯强化学习训练的基础模型

规模: 完整模型
  • 自然推理发展
  • 自我验证能力
  • 扩展思维链
  • 多步骤问题解决
下载基础模型

DeepSeek-R1 蒸馏模型

保留推理能力的高效模型

规模: 多种规模
  • 保留推理能力
  • 资源高效
  • 多种规模选项
  • 部署灵活性
下载蒸馏模型

安装说明

选择您偏好的模型版本:

# For Base Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-R1

# For Zero Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-R1-Zero

DeepSeek-R1 部署选项

DeepSeek-R1 模型蒸馏

获取保留推理能力的更小、更高效的模型

  • 多种模型规模
  • 保留推理能力
  • 高效资源利用

DeepSeek-R1 云端集成

在云平台上部署,实现性能优化

  • 可扩展基础设施
  • 企业级集成
  • 高可用性

DeepSeek-R1 本地部署

使用我们优化的推理框架在本地运行

  • 灵活部署
  • 资源优化
  • 自定义配置

如何使用 DeepSeek-R1

通过三个简单步骤开始探索高级推理能力

步骤 1

选择任务

选择您想要解决的问题类型 - 从数学到编程

步骤 2

描述问题

向 DeepSeek-R1 清晰地解释您的问题或疑问

步骤 3

查看解决方案

DeepSeek-R1 将提供详细的解决方案,包含逐步推理过程

常见问题

了解更多关于 DeepSeek-R1 的信息

是什么让 DeepSeek-R1 与众不同?

DeepSeek-R1 独特之处在于其纯强化学习方法,自然地发展出包括自我验证和扩展思维链在内的复杂推理行为。

DeepSeek-R1 在数学任务中表现如何?

DeepSeek-R1 在数学领域表现卓越,在 AIME 2024 上达到 79.8% 的准确率,在 MATH-500 上达到 97.3%,展示了先进的推理能力。

DeepSeek-R1 具有哪些编程能力?

DeepSeek-R1 展示了专家级的编程技能,在 Codeforces 上获得 2029 Elo 评分,超过 96.3% 的人类参与者。

是否有 DeepSeek-R1 的小型版本?

是的,通过成功的模型蒸馏,我们提供了更小的模型,在保持 DeepSeek-R1 核心推理能力的同时提高了资源效率。

DeepSeek-R1 是如何训练的?

DeepSeek-R1 采用多阶段训练方法,从纯强化学习(DeepSeek-R1-Zero)开始,然后进行全面的微调和优化阶段。

DeepSeek-R1 能解决哪些类型的问题?

DeepSeek-R1 在复杂推理任务中表现出色,包括数学证明、竞赛编程和知识型问题,在各种基准测试中获得高分。

DeepSeek-R1 与其他模型相比如何?

DeepSeek-R1 实现了与领先模型相当的性能,在数学推理(AIME、MATH-500)和编程任务(Codeforces)方面取得了优异成果。

DeepSeek-R1 的未来发展计划是什么?

我们正专注于增强函数调用、多轮对话和复杂角色扮演方面的能力,同时提高各种任务中的强化学习效率。

开始使用 DeepSeek-R1

试用 DeepSeek-R1 API

通过我们对开发者友好的 API 访问 DeepSeek-R1 的高级推理能力

开始构建

探索研究

了解我们革命性的强化学习方法和技术创新

查看研究

试用 DeepSeek-R1 对话

通过交互式对话体验我们的高级推理能力

开始对话