AI News
Appleが放つ次世代AI画像コーデック「PICO」:視覚体験を維持しつつデータ量を劇的に削減
📝 概要
Appleが発表した「PICO(Perceptual Image Codec)」は、機械学習を駆使して画像の圧縮率と視覚的な美しさを高い次元で両立させた新しい画像コーデックです。従来のAV1やVVCといった最新規格と比較して、同じ画質を維持しながらデータ量を最大3分の1まで削減できる点が最大の特徴です。PICOは単なるデータ圧縮に留まらず、人間の知覚特性に基づいて最適化されており、モバイルデバイス上での実用的な処理速度も兼ね備えています。高精細な画像が溢れる現代において、ストレージ効率と通信帯域の劇的な改善をもたらす可能性を秘めています。
📋 詳細レポート
PICOは「知覚画像コーデック」の名が示す通り、人間が「きれい」だと感じる質感を重視して設計されています。従来の画像圧縮技術は、元画像と復元画像の「画素単位の誤差」を最小化することに主眼を置いてきましたが、PICOはニューラルネットワークを用いる「学習型コーデック」の手法を採り入れています。
人間の知覚を重視した学習アルゴリズム
従来の指標では、画素が一致していても人間には不自然に見えたり、逆に画素が異なっていても人間には美しく見えたりする乖離がありました。PICOはこの課題を解決するため、以下の複数の損失関数を組み合わせて訓練されています。
- GAN(敵対的生成ネットワーク)ベースの損失: 髪の毛や布地といった、従来の圧縮では失われがちな細かい質感を自然に再構築します。
- 知覚品質評価損失: 人間の視覚システムが重視する要素を優先的に保護します。
- 破綻抑制プロセス: GANの弱点である「存在しない模様の生成」や、小さな文字の可読性低下、タイル状の色ムラを抑える専用の対策が施されています。
PICOの主要機能と実用性の特徴
PICOは単なる研究段階の技術ではなく、実用性を強く意識して設計されています。
- 驚異的な圧縮効率: AV1、VVC、JPEG-AIなどの既存規格に対し、最大でデータ量を3分の1に削減。他の学習型コーデックに対しても20〜40%のビットレート削減を実現しています。
- デバイス上での高速処理: iPhone 17 Pro Maxにおいて、1200万画素の画像を約230ミリ秒で符号化、150ミリ秒で復号可能です。
- 決定論的な復号処理: 学習型コーデックの課題であった「デバイスごとの演算精度の差による復号失敗」を防ぐため、一部の処理を決定的に動作するよう設計し、端末間互換性を確保しています。
- 柔軟なレート制御: 目的のファイルサイズや画質レベルに合わせて、動的に圧縮率を調整できる仕組みを備えています。
活用シーンと期待される影響
PICOは特にスマートフォンでの写真保存や、クラウドストレージへのアップロードにおいて大きな恩恵をもたらします。iPhoneのようなモバイル端末において、限られたストレージ容量をより効率的に活用できるようになり、かつ通信量の削減にも寄与します。
一方で、PICOは万能ではありません。自然画像の知覚品質に特化して最適化されているため、漫画や単純な合成画像のような、テクスチャが極端に少ない画像においては、従来型のコーデックの方が効率的になるケースがあることも報告されています。
今後の展望
Appleの研究チームは、数百万通りのモデル構成を探索することで、圧縮率、見た目の品質、そしてデバイス上での処理速度のバランスを最適化しました。今後は、このPICOがOSレベルで実装され、HEICに代わる次世代の標準フォーマットとして普及するかが注目されます。特にAI処理に特化したチップ(Apple Silicon)との親和性が高いことから、同社のエコシステム内での標準化が進むことが予想されます。