「AIの進化は早すぎて、どのモデルが自分に合っているのか分からない…」
そんな悩みを持つ方も多いのではないでしょうか。
近年、AI技術の発展により、多種多様な大規模言語モデル(LLM)が登場しています。その中でも注目を集めているのが、中国企業DeepSeekが開発した「DeepSeek-R1」です。
DeepSeek-R1は、推論能力に特化したオープンソースのLLMであり、ChatGPT o1と同等以上の性能を持ちながら、無料で利用できる点が特徴です。
本記事では、DeepSeek-R1の5つの特徴と具体的な使い方について解説します。
DeepSeek-R1とは
DeepSeek-R1は、中国企業DeepSeekが開発した、オープンソースの推論能力に特化した大規模言語モデル(LLM)です。
前モデルのDeepSeek-V3をベースに作られており、ChatGPTのo1と同等かそれ以上の性能を持つことがベンチマークで示されています。
また、開発コストがChatGPTの1/10であること、高価なグラフィックボードを必要としないことから、注目を集めています。
DeepSeek-R1の特徴5つ
推論能力の高さ
DeepSeek-R1の推論能力の高さは、複数のベンチマークテストの結果や、その開発アプローチによって証明されています。
たとえば推論AIME 2024では79.8%を達成し、これはOpenAIのo1-1217の79.2%と同等の性能です。
数学MATH-500でも97.3%を記録し、OpenAIのo1-1217の96.4%と同等の性能です。

コードLiveCodeBenchでは65.9%を記録し、OpenAIのo1-1217の63.4%を上回る性能を示しています。

強化学習の直接適用
DeepSeek-R1では、基本モデルに大規模な強化学習を直接適用し、モデル自身が推論過程を自己学習します。
この学習には、Group Relative Policy Optimization (GRPO)と呼ばれるアルゴリズムが採用されています。
GRPOは、メモリ使用量を抑制できるため、大規模な環境やデータセットでも効果的に適用できます。また、常に異なる状態でのポリシー更新を行うため、効率的に学習が進み、複雑なタスクでも無駄なリソース消費を抑えて学習できます。
独自の開発パイプライン
DeepSeek-R1の開発では、まず強化学習のみで学習させたDeepSeek-R1-Zeroモデルが開発されました。
このモデルは高度な推論能力を示しましたが、同時に無限ループなどの課題も抱えていました。
そこで、DeepSeek-R1では、強化学習の効率化と安定化を図るため、少量のコールドスタートデータ(新規ユーザーや新規アイテムに関するデータが不足している状況で初期の手がかりや方向性を与えるためのデータ)を組み込み、これらの課題を解決しています。
オープンソース戦略
DeepSeek-R1はMITライセンスで公開されており、商用利用、改変、二次的著作物の作成が自由に行えます。※ただし、オープンソースではあるものの、学習に使用されたデータセットやコードは非公開です。
一方、DeepSeek-R1-Distillモデルについては、ベースとなるモデル(Apache 2.0、Llama 3.1、Llama 3.3)のライセンス条件に従う必要があります。
両モデルはローカル環境での実行が可能です。特にDeepSeek-R1-Distillモデルは、Hugging Faceのプラットフォームからも入手できます。
またDeepSeek-R1をより深く理解し、開発したいという方に向けて、透明性を提供することを目指して作られた「Open-R1」というプロジェクトが用意されています。
参考記事:Open-R1: a fully open reproduction of DeepSeek-R1
このプロジェクトでは、DeepSeek-R1の学習プロセスや評価方法に関する詳細なコードと手順が公開されており、誰でも独自にモデルを再現することができます。
低コスト
DeepSeek-R1は、APIを通じて利用する場合、OpenAIのo1シリーズと比較して優れたコストパフォーマンスを発揮します。
【料金詳細】
トークン種別 | 料金(100万トークンあたり) |
入力トークン(キャッシュヒット時) | 0.14ドル |
入力トークン(キャッシュミス時) | 0.55ドル |
出力トークン(CoTを含む) | 2.19ドル |
【OpenAI o1シリーズとの比較】
DeepSeek-R1 | OpenAI o1 | |
入力トークン料金 | 0.14ドル〜0.55ドル | 7.50ドル |
出力トークン料金 | 2.19ドル | 約20倍高い |
コストパフォーマンス | 優れている | 高コスト |
OpenAI o1シリーズと比較すると、DeepSeek-R1はコスト面での優位性があるため、以下のような人や用途に向いています。
✔ コストを抑えてCoT(Chain of Thought)推論を活用したい人なら DeepSeek-R1
✔ 最高の精度や長いコンテキスト(128K)が必要なら OpenAI o1シリーズ
※DeepSeek-R1のコンテキストウィンドウは64K
用途や予算に応じて、どちらを選ぶか判断すると良いでしょう。
DeepSeek-R1の利用方法
DeepSeek-R1は、Webサイト、API、ローカル環境、スマホアプリ、Azure など、さまざまな方法で利用できます。
1. Webサイトでの利用
DeepSeekの公式Webサイトで、チャット形式で対話できます。
利用手順
- chat.deepseek.com にアクセス
- アカウントを作成またはログイン
- 「DeepThink」ボタンをオンにするとDeepSeek-R1を利用可能
- Web検索機能との併用も可能
2. APIの利用
開発者向けにAPIの利用が可能です。
DeepSeek API は OpenAI API と同じ形式を採用しているため、設定を変更すればOpenAI SDK(OpenAIの公式開発キット)や、OpenAI API に対応したライブラリ・アプリなどをそのまま使って、DeepSeek API にアクセスできます。これは、すでに OpenAI API を利用している開発者にとって、新たな学習コストを抑えつつ DeepSeek API を導入しやすい というメリットがあります。
利用手順
- platform.deepseek.com にアクセス
- アカウント作成後、APIキーを取得
- OpenAI互換のAPIリクエストを送信
3. ローカル環境での実行
DeepSeek-R1およびDeepSeek-R1-Distillモデルは、ローカル環境で実行可能です。
利用手順
- https://github.com/deepseek-ai にアクセス
- モデルをダウンロード
- 必要なライブラリをインストール
- 実行環境を構築
4. スマホアプリでの利用
iOSおよびAndroid向けの公式アプリを提供しています。
利用手順
- ストアからアプリをダウンロード
- メールアドレス・電話番号でユーザー登録
- チャット欄でメッセージを送信
- DeepSeekが回答を生成
5. Azureでの利用
Azure AI Foundryを通じて、DeepSeek-R1をデプロイできます。
利用手順
- https://azure.microsoft.com/ja-jp/products/ai-foundry にアクセス
- サインアップする
- 「DeepSeek R1」モデルを選択し、「Check out model」 をクリック
- 「デプロイ」をクリックし、APIキーを取得
- プレイグラウンドでテスト可能
DeepSeek-R1利用時の注意点
DeepSeekのサービスを利用する際は、利用規約を必ず確認し、内容を十分に理解しておく必要があります。
特に、DeepSeekのサービスは中国の法律に準拠し、中国の裁判所が管轄となる点に注意が必要です。日本の法律や裁判所は適用されません。また、ユーザーデータは中国国内のサーバーに保管され、中国の法律にもとづいて取り扱われます。
加えて、DeepSeek-R1は中国製のモデルであるため、特定の話題がブロックされる可能性があり、他のモデルと同等の機能を持っていても、一部のクエリに答えられない場合があります。
DeepSeek-R1の利用にあたっては、これらの点に十分留意してください。
まとめ
本記事では、DeepSeek-R1の5つの特徴と具体的な使い方について解説しました。
AI選びに迷う方も、DeepSeek-R1なら高性能かつ低コストで活用できます。特に、推論能力の高さやオープンソースの柔軟性が魅力です。
まずはWebチャットやスマホアプリを試して、自分の用途に合うか確認してみましょう。
コメント