Sakana AI、日本仕様に最適化された試作モデル「Namazu」および「Sakana Chat」を公開 | 気になる AI ニュース

📝 概要

日本を拠点とするAI企業・Sakana AIは、海外製の高性能な大規模言語モデル（LLM）を日本国内の文脈や安全要件に適応させた試作モデルシリーズ「Namazu（α版）」、および同モデルを搭載したウェブサービス「Sakana Chat」を公開しました。膨大なコストを要する事前学習ではなく、既存のオープンな基盤モデルに独自の事後学習を施すことで、高い推論能力を維持したまま日本固有のバイアス是正と正確性の向上を実現しています。これは、急速に進化するグローバルなAI開発に追随しつつ、日本のユーザーの期待に応えるための重要な戦略的アプローチといえます。

📋 詳細レポート

Sakana AIが発表した「Namazu」シリーズは、アメリカや中国の企業が主導する大規模言語モデルの事前学習モデルに対し、日本のユーザーのニーズに合わせた調整を行う「事後学習技術」に焦点を当てたプロジェクトです。

海外製モデルのローカライズと事後学習の重要性

現在、最先端のLLM開発は膨大な計算リソースを背景とした一部の企業に限られていますが、同時に高性能なモデルのオープンソース化も進んでいます。Sakana AIは、これらのオープンなモデルをベースに、日本の政治、歴史、外交といった特定のテーマにおける中立性や正確性を高める事後学習を施すことで、日本市場に最適化されたモデル構築が可能であると主張しています。これにより、海外製モデルに内在する文化的なバイアスを是正し、国内利用における安全性を確保しています。

Namazuシリーズの構成と性能

「Namazu」シリーズは、複数の著名なLLMをベースとした以下の3モデルで構成されています。

Namazu-DeepSeek-V3.1-Terminus: DeepSeek-V3をベースとした、シリーズ最高性能を誇るモデル。
Llama-3.1-Namazu-405B: MetaのLlama 3.1 405Bをベースに開発。
Namazu-gpt-oss-120B: OpenAI由来のモデルをベースに構築。

ベンチマーク評価の結果、Namazuシリーズはベースモデルが持つ高い推論能力やコーディング性能を維持しつつ、日本関連の知識や回答の中立性において、ベースモデルを大幅に上回るスコアを記録しています。

「Sakana Chat」の主な機能と特徴

Namazuを搭載したチャットサービス「Sakana Chat」には、実用性を高めるための以下の機能が実装されています。

リアルタイム検索機能: ウェブ検索を統合し、最新の情報を収集・統合して回答を生成します。回答にはソースとなるリンクが付与され、透明性が確保されています。
多角的な情報提示: 海外の一次ソースを含めた検索を行い、客観的な視点から情報を整理して出力します。
応答スタイルの切り替え: ユーザーは「標準」「丁寧」に加え、「大阪（大阪弁）」の3種類から回答の口調を選択可能です。

運用体制と今後の展望

「Sakana Chat」は現在、日本国内からのみ利用可能となっており、データプライバシーにも配慮されています。会話履歴やアカウント情報は日本国内のGoogle Cloudインフラストラクチャ上に保管されます。一方で、入力されたデータはモデルの学習や改善に活用される場合があるとしています。Sakana AIは今後も、最先端の基盤モデルを日本仕様へ適応させる技術を磨き、国内のAI活用環境をリードしていくものと見られます。