AI News

DeepSeek-V4 Preview公開:100万トークンの長大なコンテキストを実現する1.6兆パラメータの次世代モデル

#AIニュース

📝 概要

DeepSeek社は、次世代の大規模言語モデル「DeepSeek-V4 Preview」を公式にリリースし、その重みをオープンソースとして公開しました。本モデルの最大の重要性は、100万(1M)トークンという長大なコンテキスト長を、極めて高いコストパフォーマンスで実現した点にあります。世界最高峰のクローズドソースモデルに匹敵する性能を持つ「Pro」と、速度と経済性を重視した「Flash」の2モデルを展開することで、開発者は用途に応じた最適な選択が可能となりました。オープンソースAIの新たな基準を提示する、極めて野心的なアップデートといえます。

📋 詳細レポート

DeepSeek-V4 Previewは、効率的な計算リソースの活用と圧倒的なコンテキスト処理能力を両立させたモデルです。技術レポートおよびモデルウェイトがHugging Face上で公開されており、透明性の高い開発姿勢が維持されています。

スケールと効率性を両立した2つのモデル展開

本リリースでは、計算リソースの最適化を図るため、総パラメータ数とアクティブパラメータ数を分けた構成が採用されています。

  • DeepSeek-V4-Pro: 総パラメータ数1.6兆(1.6T)、アクティブパラメータ数490億(49B)を誇ります。世界トップクラスのクローズドソースモデルに匹敵するパフォーマンスを実現しており、高度な推論や複雑なタスクに適しています。
  • DeepSeek-V4-Flash: 総パラメータ数2840億(284B)、アクティブパラメータ数130億(13B)の構成です。高速かつ効率的、そして経済的な選択肢として、リアルタイム性が求められるアプリケーションでの活用が期待されます。

100万トークンのコンテキスト長とコスト効率

DeepSeek-V4の最大の特徴は、100万トークンに及ぶ広大なコンテキストウィンドウをサポートしている点です。これにより、膨大なドキュメント群の解析や、長大なコードベースの理解、文脈を維持した長時間の対話が可能になります。特筆すべきは、これだけの処理能力を「コスト効率(Cost-effective)」を重視して設計している点であり、大規模なデータ処理における経済的な障壁を大きく下げています。

利用環境とアクセシビリティ

ユーザーは即座にDeepSeek-V4の能力を体験できる環境が整えられています。

  • Webプラットフォーム: 公式サイト(chat.deepseek.com)にて、「Expert Mode」および「Instant Mode」を通じて試用可能です。
  • APIの更新: 開発者向けのAPIも本日付けでアップデートされており、既存のワークフローへの統合が容易になっています。
  • オープンソース資産: Hugging Faceにてモデルウェイト(Open Weights)と技術レポートが公開されており、ローカル環境での展開や技術的詳細の確認が可能です。

今後の展望

DeepSeek-V4の登場は、オープンソースモデルがクローズドソースモデルの独占領域であった「超巨大コンテキスト」と「1兆パラメータ級の推論性能」を同時にカバーし始めたことを意味します。特に1Mコンテキストの低コスト化は、AIエージェントや大規模ナレッジベースの構築において、新たなアプリケーションの創出を加速させる重要なマイルストーンとなるでしょう。