iPhoneでGoogleの最新AI「Gemma 4」をローカル実行。Google AI Edge Galleryが示すエッジAIの未来 | 気になる AI ニュース

📝 概要

Googleが発表した最新のオープンソースAIモデル「Gemma 4」が、公式アプリ「Google AI Edge Gallery」を通じてiPhone上でのローカル動作に対応しました。これまでクラウド上での処理が主流だった大規模言語モデル（LLM）をデバイス内で完結させることで、プライバシーの確保とインターネット接続不要の高速なレスポンスを両立しています。特に、自律的なタスク遂行を可能にする「Agent Skills」の搭載は、スマートフォンにおけるAIの役割を「チャット」から「実務実行」へと進化させる重要な転換点といえるでしょう。

📋 詳細レポート

Googleは2026年4月2日にオープンソースモデル「Gemma 4」を公開し、翌4月3日にはiOS版の「Google AI Edge Gallery」において、iPhone上でのローカル実行を可能にしました。本レポートでは、iPhone 15 Proを用いた検証結果に基づき、その技術的特徴と実用性を解説します。

モバイル最適化された「Effective」モデルの採用

Gemma 4は、モバイル機器やIoTデバイスでの動作を想定した「Effectiveモデル」を提供しています。今回、iPhoneで利用可能となったのは以下の2種類です。

E2Bモデル: モデルサイズ約2.54GB。パラメーター数が小さく、機敏な動作に特化。
E4Bモデル: モデルサイズ約3.61GB。E2Bより大規模で、より精度の高い回答が可能。

これらのモデルは、従来の31B Denseモデルや26B MoEモデルと比較して軽量化されており、デバイスのストレージやメモリを過度に圧迫することなく、実用的なパフォーマンスを発揮するよう設計されています。

主要機能とカスタマイズ性

Google AI Edge Galleryでは、単にAIと対話するだけでなく、動作パラメーターを詳細に調整することが可能です。

演算リソースの選択: 推論に使用するリソースをCPUまたはGPUから選択できます。
Enable thinking（推論モード）: デフォルトではオフですが、オンにすることで回答前の推論プロセスを有効化できます。
パラメーター調整: 最大トークン数、TopK、TopP、Temperature（温度感）といった、生成結果を左右する設定をユーザー側で変更可能です。

Agent Skills：自律的なタスク実行

Gemma 4の大きな特徴は、デバイス上でマルチステップの自律的ワークフローを実行する「Agent Skills」が実装された点です。

スキルの実行: プロンプトを通じて特定の機能を呼び出せます。例えば「東京タワーの場所を検索して表示して」と指示すると、数秒から十数秒でGoogleマップの埋め込み表示を行うといったアクションが可能です。
拡張性: デフォルトでは8種類のスキルが有効化されていますが、これらは中身を確認できるだけでなく、ユーザー自身で新しいスキルを追加することも可能な構造になっています。

日本語対応とパフォーマンス

日本語での対話においても、iPhone 15 Pro上で数秒以内に回答が返されるなど、ローカル動作としては極めて機敏なレスポンスを実現しています。モデルサイズの影響で、複雑な文脈や高度なクオリティを求める場合には限界があるものの、日常的な問いかけや特定のタスク実行においては実用的なレベルに達しています。

今後の展望

これまで「AIエージェント」の概念はクラウド側の処理に依存する部分が多かったですが、Gemma 4とGoogle AI Edge Galleryの登場により、ローカル環境でのエージェントワークフローが身近なものとなりました。今後は、個人のプライバシーデータをデバイス外に出すことなく、AIがスケジュールの管理や情報の整理、外部APIとの連携を自律的に行う「オンデバイス・エージェント」の普及が加速すると予想されます。