【話題】DeepSeek-R1とは？5つの特徴と使い方を徹底解説！

「AIの進化は早すぎて、どのモデルが自分に合っているのか分からない…」

そんな悩みを持つ方も多いのではないでしょうか。

近年、AI技術の発展により、多種多様な大規模言語モデル（LLM）が登場しています。その中でも注目を集めているのが、中国企業DeepSeekが開発した「DeepSeek-R1」です。

DeepSeek-R1は、推論能力に特化したオープンソースのLLMであり、ChatGPT o1と同等以上の性能を持ちながら、無料で利用できる点が特徴です。

本記事では、DeepSeek-R1の5つの特徴と具体的な使い方について解説します。

DeepSeek-R1とは
DeepSeek-R1の特徴5つ
DeepSeek-R1の利用方法
DeepSeek-R1利用時の注意点
まとめ

DeepSeek-R1とは

DeepSeek-R1は、中国企業DeepSeekが開発した、オープンソースの推論能力に特化した大規模言語モデル（LLM）です。

前モデルのDeepSeek-V3をベースに作られており、ChatGPTのo1と同等かそれ以上の性能を持つことがベンチマークで示されています。

また、開発コストがChatGPTの1/10であること、高価なグラフィックボードを必要としないことから、注目を集めています。

DeepSeek-R1の特徴5つ

推論能力の高さ

DeepSeek-R1の推論能力の高さは、複数のベンチマークテストの結果や、その開発アプローチによって証明されています。

たとえば推論AIME 2024では79.8%を達成し、これはOpenAIのo1-1217の79.2％と同等の性能です。

数学MATH-500でも97.3%を記録し、OpenAIのo1-1217の96.4％と同等の性能です。

コードLiveCodeBenchでは65.9%を記録し、OpenAIのo1-1217の63.4％を上回る性能を示しています。

強化学習の直接適用

DeepSeek-R1では、基本モデルに大規模な強化学習を直接適用し、モデル自身が推論過程を自己学習します。

この学習には、Group Relative Policy Optimization (GRPO)と呼ばれるアルゴリズムが採用されています。

GRPOは、メモリ使用量を抑制できるため、大規模な環境やデータセットでも効果的に適用できます。また、常に異なる状態でのポリシー更新を行うため、効率的に学習が進み、複雑なタスクでも無駄なリソース消費を抑えて学習できます。

独自の開発パイプライン

DeepSeek-R1の開発では、まず強化学習のみで学習させたDeepSeek-R1-Zeroモデルが開発されました。

このモデルは高度な推論能力を示しましたが、同時に無限ループなどの課題も抱えていました。

そこで、DeepSeek-R1では、強化学習の効率化と安定化を図るため、少量のコールドスタートデータ（新規ユーザーや新規アイテムに関するデータが不足している状況で初期の手がかりや方向性を与えるためのデータ）を組み込み、これらの課題を解決しています。

オープンソース戦略

DeepSeek-R1はMITライセンスで公開されており、商用利用、改変、二次的著作物の作成が自由に行えます。※ただし、オープンソースではあるものの、学習に使用されたデータセットやコードは非公開です。

一方、DeepSeek-R1-Distillモデルについては、ベースとなるモデル（Apache 2.0、Llama 3.1、Llama 3.3）のライセンス条件に従う必要があります。

両モデルはローカル環境での実行が可能です。特にDeepSeek-R1-Distillモデルは、Hugging Faceのプラットフォームからも入手できます。

またDeepSeek-R1をより深く理解し、開発したいという方に向けて、透明性を提供することを目指して作られた「Open-R1」というプロジェクトが用意されています。

参考記事：Open-R1: a fully open reproduction of DeepSeek-R1

このプロジェクトでは、DeepSeek-R1の学習プロセスや評価方法に関する詳細なコードと手順が公開されており、誰でも独自にモデルを再現することができます。

低コスト

DeepSeek-R1は、APIを通じて利用する場合、OpenAIのo1シリーズと比較して優れたコストパフォーマンスを発揮します。

【料金詳細】

トークン種別	料金（100万トークンあたり）
入力トークン（キャッシュヒット時）	0.14ドル
入力トークン（キャッシュミス時）	0.55ドル
出力トークン（CoTを含む）	2.19ドル

【OpenAI o1シリーズとの比較】

	DeepSeek-R1	OpenAI o1
入力トークン料金	0.14ドル〜0.55ドル	7.50ドル
出力トークン料金	2.19ドル	約20倍高い
コストパフォーマンス	優れている	高コスト

OpenAI o1シリーズと比較すると、DeepSeek-R1はコスト面での優位性があるため、以下のような人や用途に向いています。

✔ コストを抑えてCoT（Chain of Thought）推論を活用したい人なら DeepSeek-R1
✔ 最高の精度や長いコンテキスト（128K）が必要なら OpenAI o1シリーズ

※DeepSeek-R1のコンテキストウィンドウは64K

用途や予算に応じて、どちらを選ぶか判断すると良いでしょう。

DeepSeek-R1の利用方法

DeepSeek-R1は、Webサイト、API、ローカル環境、スマホアプリ、Azure など、さまざまな方法で利用できます。

1. Webサイトでの利用

DeepSeekの公式Webサイトで、チャット形式で対話できます。

利用手順

chat.deepseek.com にアクセス
アカウントを作成またはログイン
「DeepThink」ボタンをオンにするとDeepSeek-R1を利用可能
Web検索機能との併用も可能

2. APIの利用

開発者向けにAPIの利用が可能です。

DeepSeek API は OpenAI API と同じ形式を採用しているため、設定を変更すればOpenAI SDK（OpenAIの公式開発キット）や、OpenAI API に対応したライブラリ・アプリなどをそのまま使って、DeepSeek API にアクセスできます。これは、すでに OpenAI API を利用している開発者にとって、新たな学習コストを抑えつつ DeepSeek API を導入しやすい というメリットがあります。

利用手順

platform.deepseek.com にアクセス
アカウント作成後、APIキーを取得
OpenAI互換のAPIリクエストを送信

3. ローカル環境での実行

DeepSeek-R1およびDeepSeek-R1-Distillモデルは、ローカル環境で実行可能です。

利用手順

https://github.com/deepseek-ai にアクセス
モデルをダウンロード
必要なライブラリをインストール
実行環境を構築

4. スマホアプリでの利用

iOSおよびAndroid向けの公式アプリを提供しています。

利用手順

ストアからアプリをダウンロード
- iOS版：https://apps.apple.com/jp/app/deepseek/id6476099458
- Android版：https://play.google.com/store/apps/details?id=com.deepseek.app
メールアドレス・電話番号でユーザー登録
チャット欄でメッセージを送信
DeepSeekが回答を生成