DeepSeek-R1

DeepSeek-R1：革命性的专注推理语言模型

体验突破性的 AI 技术，在数学、编程和复杂问题解决方面具有卓越的推理能力

高级推理

2029 Codeforces Elo

AIME 79.8%

试用 DeepSeek-R1 试用 Chat Mistral 试用 MiniMax-Text-01 访问 API

免费网站集成

拥有网站？使用简单的 iframe 代码免费嵌入我们专注推理的对话界面。无需注册。

体验 DeepSeek-R1 的高级推理能力

DeepSeek-R1 对话

你好！我是 DeepSeek-R1，一个专注于推理的高级 AI 助手。今天我能为你做些什么？

试用 Chat Mistral 试用 MiniMax-Text-01

下载 DeepSeek-R1 移动应用

在您的移动设备上体验先进的 AI 推理

iOS App Store

适用于 iPhone 和 iPad 设备

下载

Google Play 商店

适用于安卓设备

下载

安卓 APK

直接下载 APK

下载

核心特性

探索 DeepSeek-R1 革命性的推理能力

高级推理

革命性的强化学习方法，实现包括自我验证和反思在内的复杂推理行为

•自然推理发展
•自我验证能力
•扩展思维链
•多步骤问题解决

数学卓越性

在数学任务中表现出色，在 AIME 2024 上达到 79.8% 的准确率，在 MATH-500 上达到 97.3%

•复杂数学推理
•竞赛级问题解决
•逐步解决方案
•证明生成

编程专长

专家级编程能力，在 Codeforces 上获得 2029 Elo 评分，超过 96.3% 的人类参与者

•多语言支持
•算法优化
•代码分析
•工程解决方案

多阶段训练

全面的训练策略，结合强化学习和监督微调

•冷启动阶段
•面向推理的强化学习
•数据过滤
•全场景优化

知识整合

在知识型测试中表现卓越，在 MMLU 上达到 90.8%，在 MMLU-Pro 上达到 84.0%

•全面的知识库
•跨领域理解
•事实准确性
•定期更新

模型蒸馏

成功将推理能力蒸馏到更小、更易访问的模型中

•多种模型规模
•保留核心能力
•高效部署
•资源优化

DeepSeek-R1 媒体报道

在 AI 推理能力领域树立新标准

数学卓越性

DeepSeek-R1 在 AIME 2024 数学竞赛问题上取得突破性的 79.8% 准确率，在 MATH-500 上达到 97.3%。

编程精通

在 Codeforces 上获得 2029 Elo 评分，DeepSeek-R1 展示了专家级的编程能力，超过 96.3% 的人类参与者。

创新训练

革命性的纯强化学习方法使复杂推理行为能够自然发展。

DeepSeek-R1 实战演示

观看 DeepSeek-R1 如何应对复杂的推理挑战

DeepSeek-R1：O(1) 性能，完全开源

观看 DeepSeek-R1 在数学、编程和复杂问题解决任务中的卓越表现。

DeepSeek-R1 性能指标

语言理解

MMLU (90.8%)90.8%

MMLU-Pro (84.0%)84.0%

AlpacaEval 2.0 (87.6%)87.6%

编程与工程

Codeforces (2029 Elo)2029 Elo

GPQA Diamond (71.5%)71.5%

ArenaHard (92.3%)92.3%

数学推理

AIME 2024 (79.8%)79.8%

MATH-500 (97.3%)97.3%

技术规格

探索 DeepSeek-R1 革命性的训练方法和能力

DeepSeek-R1 训练过程

用于自然推理发展的革命性强化学习方法

•纯强化学习训练

•多阶段优化

•数据过滤和质量控制

•全场景适应性

DeepSeek-R1 研究

在专注推理的语言模型领域开创先河

纯强化学习创新

革命性的方法，使用纯强化学习来发展自然推理行为，无需监督微调

多阶段训练

全面的训练策略，结合冷启动、面向推理的强化学习、数据过滤和全场景优化

技术论文

阅读我们全面的技术论文，详细介绍 DeepSeek-R1 的革命性训练方法和领先基准表现。

阅读论文

关于 DeepSeek

引领专注推理的 AI 的未来

公司背景

DeepSeek 通过革命性的强化学习方法和开放协作，引领 AI 推理能力的创新。

研究基础设施

我们先进的研究基础设施推动了 AI 推理能力和模型训练方法的突破性发展。

下载 DeepSeek-R1 模型

从我们的推理专注型模型系列中选择

DeepSeek-R1 基础模型

纯强化学习训练的基础模型

规模: 完整模型

•自然推理发展
•自我验证能力
•扩展思维链
•多步骤问题解决

下载基础模型

DeepSeek-R1 蒸馏模型

保留推理能力的高效模型

规模: 多种规模

•保留推理能力
•资源高效
•多种规模选项
•部署灵活性

下载蒸馏模型

安装说明

选择您偏好的模型版本：

# For Base Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-R1

# For Zero Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-R1-Zero

查看基础模型查看蒸馏模型

DeepSeek-R1 部署选项

DeepSeek-R1 模型蒸馏

获取保留推理能力的更小、更高效的模型

多种模型规模
保留推理能力
高效资源利用

DeepSeek-R1 云端集成

在云平台上部署，实现性能优化

可扩展基础设施
企业级集成
高可用性

DeepSeek-R1 本地部署

使用我们优化的推理框架在本地运行

灵活部署
资源优化
自定义配置

如何使用 DeepSeek-R1

通过三个简单步骤开始探索高级推理能力

步骤 1

选择任务

选择您想要解决的问题类型 - 从数学到编程

步骤 2

描述问题

向 DeepSeek-R1 清晰地解释您的问题或疑问

步骤 3

查看解决方案

DeepSeek-R1 将提供详细的解决方案，包含逐步推理过程

开始使用 DeepSeek-R1

常见问题

了解更多关于 DeepSeek-R1 的信息

是什么让 DeepSeek-R1 与众不同？

DeepSeek-R1 独特之处在于其纯强化学习方法，自然地发展出包括自我验证和扩展思维链在内的复杂推理行为。

DeepSeek-R1 在数学任务中表现如何？

DeepSeek-R1 在数学领域表现卓越，在 AIME 2024 上达到 79.8% 的准确率，在 MATH-500 上达到 97.3%，展示了先进的推理能力。

DeepSeek-R1 具有哪些编程能力？

DeepSeek-R1 展示了专家级的编程技能，在 Codeforces 上获得 2029 Elo 评分，超过 96.3% 的人类参与者。

是否有 DeepSeek-R1 的小型版本？

是的，通过成功的模型蒸馏，我们提供了更小的模型，在保持 DeepSeek-R1 核心推理能力的同时提高了资源效率。

DeepSeek-R1 是如何训练的？

DeepSeek-R1 采用多阶段训练方法，从纯强化学习（DeepSeek-R1-Zero）开始，然后进行全面的微调和优化阶段。

DeepSeek-R1 能解决哪些类型的问题？

DeepSeek-R1 在复杂推理任务中表现出色，包括数学证明、竞赛编程和知识型问题，在各种基准测试中获得高分。

DeepSeek-R1 与其他模型相比如何？

DeepSeek-R1 实现了与领先模型相当的性能，在数学推理（AIME、MATH-500）和编程任务（Codeforces）方面取得了优异成果。

DeepSeek-R1 的未来发展计划是什么？

我们正专注于增强函数调用、多轮对话和复杂角色扮演方面的能力，同时提高各种任务中的强化学习效率。

开始使用 DeepSeek-R1

试用 DeepSeek-R1 API

通过我们对开发者友好的 API 访问 DeepSeek-R1 的高级推理能力

开始构建

探索研究

了解我们革命性的强化学习方法和技术创新

查看研究

试用 DeepSeek-R1 对话

通过交互式对话体验我们的高级推理能力

开始对话