DeepSeek-R1

DeepSeek-R1:革新的な推論に特化した言語モデル

数学、プログラミング、複雑な問題解決で優れた推論能力を持つ革新的なAI技術を体験

高度な推論
Codeforces 2029 Elo
AIME 79.8%

無料のウェブサイト統合

ウェブサイトをお持ちですか?簡単なiframeコードで推論に特化したチャットインターフェースを無料で埋め込めます。登録不要です。

<iframe src="https://www.deepseekr1.org/embed" width="100%" height="600px" frameborder="0"></iframe>

Try DeepSeek-R1's Advanced Reasoning Capabilities

こんにちは!私はDeepSeek-R1、推論に特化した高度なAIアシスタントです。本日はどのようなお手伝いができますか?

DeepSeek-R1 モバイルアプリのダウンロード

モバイルデバイスで高度なAI推論を体験

iOS App Store

iPhoneとiPadデバイス用

ダウンロード

Google Play ストア

Androidデバイス用

ダウンロード

Android APK

APK直接ダウンロード

ダウンロード

主要機能

DeepSeek-R1の革新的な推論能力をご紹介

高度な推論

自己検証と振り返りを含む高度な推論行動を可能にする革新的な強化学習アプローチ

  • 自然な推論能力の発達
  • 自己検証機能
  • 拡張された思考連鎖
  • 多段階問題解決

数学における卓越性

AIME 2024で79.8%、MATH-500で97.3%という優れた数学タスクの性能

  • 複雑な数学的推論
  • 競技レベルの問題解決
  • 段階的な解法提示
  • 証明の生成

プログラミングの専門性

Codeforcesで2029 Eloレーティングを獲得し、人間参加者の96.3%を上回る専門家レベルのプログラミング能力

  • 複数言語対応
  • アルゴリズムの最適化
  • コード分析
  • エンジニアリングソリューション

多段階トレーニング

強化学習と教師あり微調整を組み合わせた包括的なトレーニング戦略

  • コールドスタートフェーズ
  • 推論指向の強化学習
  • データフィルタリング
  • 全シナリオ最適化

知識統合

MMLUで90.8%、MMLU-Proで84.0%という知識ベーステストでの優れた性能

  • 包括的な知識ベース
  • 分野横断的な理解
  • 事実の正確性
  • 定期的なアップデート

モデル蒸留

推論能力を維持しながら、より小規模で利用しやすいモデルへの蒸留に成功

  • 複数のモデルサイズ
  • 能力の維持
  • 効率的なデプロイメント
  • リソースの最適化

メディアが注目するDeepSeek-R1

AI推論能力の新基準を確立

数学における卓越性

DeepSeek-R1はAIME 2024数学コンペティションで79.8%、MATH-500で97.3%という画期的な正確性を達成。

プログラミングの熟達

Codeforcesで2029 Eloレーティングを獲得し、人間参加者の96.3%を上回る専門家レベルのプログラミング能力を実証。

革新的なトレーニング

純粋な強化学習アプローチにより、高度な推論行動の自然な発達を実現。

DeepSeek-R1の実践デモ

DeepSeek-R1が複雑な推論課題に取り組む様子をご覧ください

DeepSeek R1 - O(1)の性能、完全オープンソース

数学、プログラミング、複雑な問題解決タスクにおけるDeepSeek-R1の優れた性能をご覧ください。

DeepSeek-R1の性能指標

言語理解

MMLU (90.8%)90.8%
MMLU-Pro (84.0%)84.0%
AlpacaEval 2.0 (87.6%)87.6%

プログラミング・エンジニアリング

Codeforces (2029 Elo)2029 Elo
GPQA Diamond (71.5%)71.5%
ArenaHard (92.3%)92.3%

数学的推論

AIME 2024 (79.8%)79.8%
MATH-500 (97.3%)97.3%

技術仕様

DeepSeek-R1の革新的なトレーニングアプローチと機能を詳しく解説

DeepSeek-R1のトレーニングプロセス

自然な推論能力の開発のための革新的な強化学習アプローチ

DeepSeek-R1-Zeroによる純粋な強化学習
多段階トレーニング戦略
高品質な例によるコールドスタート
推論指向の強化学習
データフィルタリングと教師あり微調整
全シナリオ強化学習
包括的な評価パイプライン
継続的な最適化プロセス

DeepSeek-R1の研究

推論に特化した言語モデルにおける先駆的な進歩

純粋な強化学習による革新

教師あり微調整を必要とせず、純粋な強化学習を用いて自然な推論行動を開発する革新的なアプローチ

多段階トレーニング

コールドスタート、推論指向の強化学習、データフィルタリング、全シナリオ最適化を組み合わせた包括的なトレーニング戦略

技術論文

DeepSeek-R1の革新的なトレーニングアプローチとベンチマークをリードする性能について詳述した包括的な技術論文をご覧ください。

論文を読む

DeepSeekについて

推論に特化したAIの未来を切り拓く

企業背景

DeepSeekは、革新的な強化学習アプローチとオープンな協力を通じて、AI推論能力のイノベーションを牽引しています。

研究インフラ

当社の先進的な研究インフラは、AI推論能力とモデルトレーニング手法におけるブレークスルーを可能にしています。

DeepSeek-R1モデルのダウンロード

推論に特化した各種モデルからお選びください

DeepSeek-R1 ベースモデル

純粋な強化学習で訓練された基盤モデル

サイズ: フルモデル
  • 自然な推論能力の発達
  • 自己検証機能
  • 拡張された思考連鎖
  • 多段階問題解決
ベースモデルをダウンロード

DeepSeek-R1 蒸留モデル

推論能力を維持した効率的なモデル

サイズ: 様々なサイズ
  • 推論能力の維持
  • リソース効率
  • 複数のサイズオプション
  • デプロイメントの柔軟性
蒸留モデルをダウンロード

インストール手順

お好みのモデルバージョンを選択してください:

# For Base Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-R1

# For Zero Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-R1-Zero

DeepSeek-R1 デプロイメントオプション

DeepSeek-R1 モデル蒸留

推論能力を維持しながら、より小規模で効率的なモデルにアクセス

  • 複数のモデルサイズ
  • 推論能力の維持
  • 効率的なリソース使用

DeepSeek-R1 クラウド統合

最適化されたパフォーマンスでクラウドプラットフォームにデプロイ

  • スケーラブルなインフラ
  • エンタープライズ統合
  • 高可用性

DeepSeek-R1 ローカルデプロイメント

最適化された推論フレームワークでローカルに実行

  • 柔軟なデプロイメント
  • リソース最適化
  • カスタム設定

DeepSeek-R1の使い方

3つの簡単なステップで高度な推論機能を体験

ステップ 1

タスクを選択

数学からプログラミングまで、解決したい問題の種類を選択してください

ステップ 2

問題を説明

DeepSeek-R1に問題や質問を明確に説明してください

ステップ 3

解決策を確認

DeepSeek-R1が段階的な推論過程を含む詳細な解決策を提供します

よくある質問

DeepSeek-R1についてもっと詳しく

DeepSeek-R1の特徴は何ですか?

DeepSeek-R1は、純粋な強化学習アプローチを採用し、自己検証や拡張された思考連鎖など、高度な推論行動を自然に発達させた点が特徴です。

DeepSeek-R1は数学的タスクでどのような性能を発揮しますか?

DeepSeek-R1はAIME 2024で79.8%、MATH-500で97.3%という優れた精度を達成し、高度な推論能力を実証しています。

DeepSeek-R1のプログラミング能力はどの程度ですか?

DeepSeek-R1はCodeforcesで2029 Eloレーティングを獲得し、人間参加者の96.3%を上回る専門家レベルのプログラミングスキルを示しています。

DeepSeek-R1の小規模バージョンは利用可能ですか?

はい、モデル蒸留を通じて、DeepSeek-R1の核となる推論能力を維持しながら、よりリソース効率の良い小規模モデルを提供しています。

DeepSeek-R1はどのように訓練されましたか?

DeepSeek-R1は、純粋な強化学習(DeepSeek-R1-Zero)から始まり、包括的な微調整と最適化段階を経る多段階トレーニングアプローチを採用しています。

DeepSeek-R1はどのような問題を解決できますか?

DeepSeek-R1は、数学的証明、競技プログラミング、知識ベースの問題など、複雑な推論タスクで優れた性能を発揮し、様々なベンチマークで高いスコアを達成しています。

DeepSeek-R1は他のモデルと比べてどうですか?

DeepSeek-R1は主要モデルに匹敵する性能を達成し、特に数学的推論(AIME、MATH-500)とプログラミングタスク(Codeforces)で優れた結果を示しています。

DeepSeek-R1の今後の開発計画は何ですか?

関数呼び出し、マルチターン対話、複雑なロールプレイングの機能強化に焦点を当て、様々なタスクにおける強化学習の効率を改善していきます。

DeepSeek-R1を始めましょう

DeepSeek-R1 APIを試す

開発者フレンドリーなAPIを通じてDeepSeek-R1の高度な推論機能にアクセス

開発を始める

研究を探索

革新的な強化学習アプローチと技術革新について学ぶ

研究を見る

DeepSeek-R1チャットを試す

インタラクティブなチャットを通じて高度な推論機能を体験

チャットを始める