AI News
SpaceXAIの「Colossus 2」にて7種のAIモデルが同時並行でトレーニング開始。最大10兆パラメータ規模へ
📝 概要
イーロン・マスク氏は、AI開発基盤「Colossus 2」において、現在7つの新しいAIモデルが同時にトレーニング段階にあることを明らかにしました。これには画像生成モデルの次世代版に加え、最大で10兆(10T)パラメータ規模に達する超大規模言語モデルが含まれています。現時点では競合他社を追随する立場であるという認識を示しつつも、圧倒的な計算リソースを背景に、モデルの巨大化と多様化を急速に進める戦略が鮮明となっています。
📋 詳細レポート
超大規模コンピューティング基盤「Colossus 2」の現状
SpaceXAIが運用する計算インフラストラクチャ「Colossus 2」は、次世代のAIモデル群を育成するための心臓部として機能しています。今回の発表では、単一のモデルではなく、特性や規模の異なる7つのモデルを並行してトレーニングしている点が特徴です。これは、特定のタスクに特化したモデルから、汎用性を極限まで高めた超大規模モデルまでを網羅的に開発する、同社の多角的なアプローチを裏付けています。
トレーニング中の主要モデルと規模
現在トレーニングが行われているモデルの内訳は以下の通りです。ここで「T」は一般的にパラメータ数(Trillion:兆)を指すと解釈されます。
- Imagine V2: 画像生成AIの次世代バージョン。
- 1Tモデル(2バリアント): 1兆パラメータ規模のモデル。異なる構成で2種類を並行開発。
- 1.5Tモデル(2バリアント): 1.5兆パラメータ規模のモデル。こちらも2種類を検証中。
- 6Tモデル: 6兆パラメータ規模の大型モデル。
- 10Tモデル: 10兆パラメータに達する超大規模モデル。
開発の背景と競争環境
マスク氏は、これらのモデル開発について「追い付くべき差がある(Some catching up to do)」と言及しています。これは、先行する他のAI企業が構築したエコシステムやモデル精度に対し、自社の開発ペースを加速させる必要があるという現状認識を示しています。特に10兆パラメータという規模は、現在の主要なフロンティアモデルを大幅に上回る可能性を示唆しており、計算資源の物量によって技術的キャッチアップを図る狙いが見て取れます。
今後の展望
今後は、トレーニングが完了したこれらのモデルが順次、推論や実サービスへと投入されることが予想されます。特に「Imagine V2」による生成能力の向上や、10Tクラスのモデルがもたらす高度な推論能力の実現が注視されます。膨大な計算リソースを要するこれらのモデル群が、どのようなタイムスケールで一般公開、あるいは特定のプラットフォームへ統合されるかが、今後のAI市場における勢力図を左右する重要な要素となるでしょう。