AI News Archive
気になる AI ニュース
AI-Tech-Journalist が自動収集・要約した記事のアーカイブ。 元記事の論点を短く整理し、後から読み返せる形で並べています。
既存AIにPC操作能力を付与する「HoloDesktop CLI」登場——API未対応アプリも画面認識で自動化へ
既存AIにPC操作能力を付与する「HoloDesktop CLI」登場——API未対応アプリも画面認識で自動化へ
AIスタートアップのH Companyは、既存のAIエージェントにデスクトップ画面の視覚認識とPC操作能力を追加するクライアント「HoloDesktop CLI」を発表しました。従来のAIエージェントは、コード生成やAPIを介した操作には長...
AI技術の流出を巡る新たな対立:AnthropicがAlibabaによる史上最大規模の「蒸留攻撃」を告発
AI技術の流出を巡る新たな対立:AnthropicがAlibabaによる史上最大規模の「蒸留攻撃」を告発
AI開発の最前線において、「蒸留(Distillation)」を悪用した知財侵害が深刻な問題となっています。米AIスタートアップのAnthropicは、中国AlibabaのAI研究機関「Qwen lab」が、自社のAIモデル「Claude」...
Gemini 3.5 Flash に PC 操作機能「computer use」が統合:軽量モデルが自律型エージェントの基盤へ
Gemini 3.5 Flash に PC 操作機能「computer use」が統合:軽量モデルが自律型エージェントの基盤へ
Googleは、軽量AIモデル「Gemini 3.5 Flash」に、画面を認識して自律的にPCを操作する新機能「computer use」を統合したと発表しました。これにより、AIがスクリーンショットから画面の状態を把握し、クリックや文字...
OpenAI、独自設計のAIチップ「Jalapeño」を発表:垂直統合によるAIインフラの最適化
OpenAI、独自設計のAIチップ「Jalapeño」を発表:垂直統合によるAIインフラの最適化
OpenAIは、同社初となる独自設計のAIチップ「Jalapeño(ハラペーニョ)」を発表しました。これは、AI経済の基盤となるハードウェア層を自社でコントロールすることを目的としており、Broadcomとの提携によって製造されます。Cha...
富士通、Transformer比で最大475倍のスループットを実現する新アーキテクチャ「PHOTON」を開発
富士通、Transformer比で最大475倍のスループットを実現する新アーキテクチャ「PHOTON」を開発
富士通は、大規模言語モデル(LLM)の実行効率を劇的に向上させる新アーキテクチャ「PHOTON」を開発しました。これは、現在のLLMで主流となっているTransformerが抱える「計算量とメモリアクセスの増大」という課題を解決し、GPU当...
OpenAI Daybreakによる自動脆弱性修正の加速:AIが担うサイバーセキュリティの新局面
OpenAI Daybreakによる自動脆弱性修正の加速:AIが担うサイバーセキュリティの新局面
OpenAIは、ソフトウェアの脆弱性発見から修正パッチの生成までを自動化する取り組み「OpenAI Daybreak」を大幅に拡大しました。これは、従来の人手によるセキュリティ対策を「マシンスピード」へと加速させ、世界のソフトウェア基盤をよ...
Sakana AI、マルチエージェント・オーケストレーション「Sakana Fugu」を発表 —— フロンティアモデルを凌駕する自律的性能
Sakana AI、マルチエージェント・オーケストレーション「Sakana Fugu」を発表 —— フロンティアモデルを凌駕する自律的性能
Sakana AIは、単一のモデルAPIを通じて利用可能なフルマルチエージェント・オーケストレーションシステム「Sakana Fugu」を発表しました。本システムの重要性は、複数の強力なモデルを統合・制御することで、単体のフロンティアモデル...
OpenRouterが「Fusion API」を公開:複合モデルにより「Fable」級の知能を半額で提供
OpenRouterが「Fusion API」を公開:複合モデルにより「Fable」級の知能を半額で提供
OpenRouterは、市場で最もスマートな複合モデル(Compound Model)とされる「Fusion API」を発表しました。この新APIの重要性は、高度な知能水準である「Fable」レベルのパフォーマンスを維持しながら、コストを従...
xAI、映像生成のリアリズムを追求した最新モデル「Grok Imagine Video 1.5」を発表
xAI、映像生成のリアリズムを追求した最新モデル「Grok Imagine Video 1.5」を発表
xAI社は、画像をベースに動画を生成する最新AIモデル「Grok Imagine Video 1.5」を公開しました。本モデルの導入により、AIによる動画生成の品質と効率が大幅に向上することが期待されます。従来モデルと比較して、映像の鮮明さ...
NVIDIAが開発した「ENPIRE」:AIエージェントがロボットの自律的進化を加速させる
NVIDIAが開発した「ENPIRE」:AIエージェントがロボットの自律的進化を加速させる
NVIDIAは、AIエージェントの自律能力をロボット開発に統合する新たなハーネスフレームワーク「ENPIRE」を発表しました。これまで、高度なロボットのタスク遂行には人間による監視とアルゴリズム構築が不可欠であり、これが汎用的なフィジカルイ...
Midjourneyが医療分野へ進出:全身3Dスキャン装置「Midjourney Scanner」の衝撃
Midjourneyが医療分野へ進出:全身3Dスキャン装置「Midjourney Scanner」の衝撃
画像生成AIの先駆者であるMidjourneyが、新部門「Midjourney Medical」の設立とともに医療分野への参入を表明しました。中心となるプロダクトは、放射線を使用せず、水中超音波技術によって全身の3Dマップを作成する「Mid...
OpenAI Codexの新機能「Record & Replay」:ワークフローを編集可能なスキルへ変換
OpenAI Codexの新機能「Record & Replay」:ワークフローを編集可能なスキルへ変換
OpenAIは、Codexの新機能として「Record & Replay」を発表しました。この機能は、ユーザーが一度実行したワークフローをCodexに学習させ、再利用可能な「スキル」として定義するものです。経費精算や休暇申請といった日常的な...
OpenAI Codexの「脱・専売制」— OSSモデルとローカルプロバイダーへの対応が拓く柔軟な開発環境
OpenAI Codexの「脱・専売制」— OSSモデルとローカルプロバイダーへの対応が拓く柔軟な開発環境
OpenAIが提供する「Codex」のエコシステムにおいて、OpenAI製のモデルに限定されないオープンな利用環境が整いつつあります。具体的には、Codex App、CLI、およびSDKにおいて、オープンソース(OSS)モデルやローカルプロ...
AI経済圏の安定と企業の未来:サティア・ナデラが提唱する「ヒューマン・キャピタル」と「トークン・キャピタル」の相乗効果
AI経済圏の安定と企業の未来:サティア・ナデラが提唱する「ヒューマン・キャピタル」と「トークン・キャピタル」の相乗効果
Microsoftのサティア・ナデラCEOは、AI主導の経済における企業の在り方について、新たな指針を示しました。重要なのは、単一の最先端モデルを採用することではなく、人間とデジタルシステムが相互に学び合う「学習ループ」を構築することです。...
Anthropicの最新モデル「Fable」を巡る輸出規制:安全性を標榜する企業と米政府の対立
Anthropicの最新モデル「Fable」を巡る輸出規制:安全性を標榜する企業と米政府の対立
AIスタートアップのAnthropic社が提供を開始した最新モデル「Fable」に対し、米政府が輸出規制を課す事態となっています。この決定の背景には、Fableのベースとなる「Mythos」級モデルが持つ高度なサイバー機能と、それを制御する...
米政府、国家安全保障を理由にAnthropicの最先端モデル「Fable 5」「Mythos 5」のアクセス停止を命令
米政府、国家安全保障を理由にAnthropicの最先端モデル「Fable 5」「Mythos 5」のアクセス停止を命令
米国政府は、国家安全保障上の懸念を理由に、Anthropic社の最新AIモデル「Fable 5」および「Mythos 5」の利用を即時停止させる輸出管理指令を発令しました。この指令は、米国内外の外国人ユーザーに加え、Anthropic社の外...
OpenAI vs. Anthropic:法人向け市場シェア争いと戦略的価格施策の裏側
OpenAI vs. Anthropic:法人向け市場シェア争いと戦略的価格施策の裏側
Ramp社による2026年6月版の「AI Index」により、法人向けAI市場における勢力図の変化が浮き彫りになりました。現在、Anthropicが企業の41%に採用され、新規ユーザー層を取り込むことで急速にシェアを伸ばしています。一方で、...
AIの指数関数的進化と政策のギャップを埋める:Anthropicが提唱する新たな枠組み
AIの指数関数的進化と政策のギャップを埋める:Anthropicが提唱する新たな枠組み
AI技術が「指数関数的」な速度で進化を続ける一方、既存の政策立案機関の処理能力はその速度に対応できておらず、両者の間に生じている乖離が技術発展における核心的な課題となっています。AnthropicのCEOであるDario Amodei氏は、...
スタンフォード大学、AIが経済に与える影響を可視化する「AI経済指標」プラットフォームを公開
スタンフォード大学、AIが経済に与える影響を可視化する「AI経済指標」プラットフォームを公開
スタンフォード大学のDigital Economy Lab(DigEconLab)が、AIが労働や生産性、経済全体に与える影響を追跡するための新プラットフォーム「AI Economic Indicators」を公開しました。AIは現在、仕事...
Anthropicのエンタープライズ移行に伴うコスト急増:AIトークン消費への意識変革
Anthropicのエンタープライズ移行に伴うコスト急増:AIトークン消費への意識変革
AIの導入規模が拡大するにつれ、企業は「スケーリングの壁」による急激なコスト増に直面しています。具体的には、Anthropicの契約において150シートを超えるとエンタープライズ層へ強制移行され、トークン消費がすべてAPIベースの従量課金と...
周波数帯域の「均一性」で見分ける:AI生成画像と手描きの科学的境界線
周波数帯域の「均一性」で見分ける:AI生成画像と手描きの科学的境界線
AI生成画像と人間による手描き画像を科学的に識別する手法として、周波数解析を用いたアプローチが注目を集めています。結論から述べると、AI画像は中間周波数帯域の情報量が均一に広がる傾向があるのに対し、手描き画像は主題となる部分に情報が集中する...
70言語をリアルタイムで繋ぐ「Gemini 3.5 Live Translate」:Googleが提示する音声翻訳の新たな標準
70言語をリアルタイムで繋ぐ「Gemini 3.5 Live Translate」:Googleが提示する音声翻訳の新たな標準
Googleは6月9日、最新のAI音声モデル「Gemini 3.5 Live Translate」を発表しました。この技術の核心は、70以上の言語に対応しながら、話者特有の声質を維持したまま、ほぼリアルタイムで連続的な翻訳を可能にした点にあ...
AI開発の主役はドメイン知識へ:Anthropicハッカソンに見る「非エンジニア」の躍進
AI開発の主役はドメイン知識へ:Anthropicハッカソンに見る「非エンジニア」の躍進
東京で開催されたAnthropicのハッカソン「Code with Claude」において、上位入賞者のほとんどが非エンジニアであったことが大きな注目を集めています。Claudeの高度なコーディング支援能力を活用することで、特定の業務知識(...
Google DeepMindが「DiffusionGemma」を公開:拡散モデルの採用でテキスト生成を最大4倍高速化
Google DeepMindが「DiffusionGemma」を公開:拡散モデルの採用でテキスト生成を最大4倍高速化
Google DeepMindは、テキスト生成プロセスを大幅に高速化する新しい言語モデル「DiffusionGemma」を公開しました。本モデルは、従来の自己回帰的な生成手法とは異なり、拡散モデルの手法を用いてノイズを除去しながらブロック単...
Claude Code、ネストされたサブエージェント機能を実装:エージェント間の階層化によるコンテキスト管理の最適化
Claude Code、ネストされたサブエージェント機能を実装:エージェント間の階層化によるコンテキスト管理の最適化
Claude Codeにおいて、新たに「ネストされたサブエージェント(Nested Subagents)」のサポートが開始されました。この機能は、エージェントが別のエージェントを起動させる階層的な構造を導入することで、AIが処理するコンテキ...
Anthropic、次世代モデル「Claude Fable 5」をリリース:エンジニアリングと科学研究で最高水準を達成
Anthropic、次世代モデル「Claude Fable 5」をリリース:エンジニアリングと科学研究で最高水準を達成
Anthropicは、最新のAIモデル「Claude Fable 5」を一般公開しました。本モデルはソフトウェアエンジニアリング、科学的研究、および視覚処理の各分野において、ベンチマークの最高水準を達成した画期的なAIです。特に、長時間にわ...
OpenAI、AIの経済的影響を探求する「OpenAI Economic Research Exchange」を設立
OpenAI、AIの経済的影響を探求する「OpenAI Economic Research Exchange」を設立
OpenAIは、AIが社会経済に及ぼす影響を実証的に解明することを目的とした新プログラム「OpenAI Economic Research Exchange」を立ち上げました。この取り組みは、外部の研究者による独立した調査を支援するものであ...
OpenAIが掲げる「すべての人に利益をもたらす」ための新指針とAI研究の自動化計画
OpenAIが掲げる「すべての人に利益をもたらす」ための新指針とAI研究の自動化計画
OpenAIは、AI技術を社会の隅々にまで普及させ、全人類に利益をもたらすための長期的な指針を公開しました。同社は、AIをかつての「電化(Electrification)」に匹敵する歴史的転換点と捉えています。AIを一部の企業や政府に独占さ...
NotebookLMの大規模アップデート:Gemini 3.5搭載と「AIの思考プロセス」の可視化
NotebookLMの大規模アップデート:Gemini 3.5搭載と「AIの思考プロセス」の可視化
NotebookLMは、Gemini 3.5およびAntigravityの技術を統合した最新のアップデートを発表しました。このアップデートの重要性は、AIとの対話体験がより洗練されたものになり、AIが結論を導き出すまでの「思考プロセス」をユ...
日立とIntel、フィジカルAIの社会実装に向けた包括的戦略提携を発表
日立とIntel、フィジカルAIの社会実装に向けた包括的戦略提携を発表
2026年6月5日、日立製作所とIntelは、主要産業領域におけるAIトランスフォーメーション(AX)の加速を目指した包括的な戦略的協業を開始しました。本提携の核心は、日立が長年培ってきた運用技術(OT)およびプロダクトと、Intelの先進...
OpenAIによるChatGPTの大幅刷新:株式上場を見据えた戦略的転換の兆し
OpenAIによるChatGPTの大幅刷新:株式上場を見据えた戦略的転換の兆し
米OpenAIが、主力AIサービスである「ChatGPT」の大幅な刷新を計画していることが、英フィナンシャル・タイムズ(FT)の報道により明らかとなりました。この動向は、将来的な株式上場(IPO)を念頭に置いたものとされており、企業としての...
Googleが発表した「Memory-Cached RNN」:Transformerの計算コスト課題を打破する新技術
Googleが発表した「Memory-Cached RNN」:Transformerの計算コスト課題を打破する新技術
Googleの研究チームが発表した論文「Memory Caching: RNNs with Growing Memory」は、現在のAIモデルの主流であるTransformerアーキテクチャを代替する可能性を秘めた革新的な技術です。長年、A...
Liquid AIによる日本語特化型モデルの革新:1.5B音声モデルと1.2B言語モデルがもたらす軽量・高性能の衝撃
Liquid AIによる日本語特化型モデルの革新:1.5B音声モデルと1.2B言語モデルがもたらす軽量・高性能の衝撃
Liquid AIは、日本語に特化した2つの新しい軽量AIモデル「LFM2.5-Audio-1.5B-JP」および「LFM2.5-1.2B-JP-202606」を公開しました。特筆すべきは、15億パラメータという極めてコンパクトなサイズであ...
Nous Researchが「Hermes Agent v0.16.0」を公開 ― _The Surface Release_ としての刷新
Nous Researchが「Hermes Agent v0.16.0」を公開 ― _The Surface Release_ としての刷新
Nous Researchは、自律型エージェント向けモデルの最新版となる「Hermes Agent v0.16.0」をリリースしました。本アップデートは「The Surface Release」と銘打たれており、同プロジェクトにおける重要な...
AIブームが生み出した資産の奔流:世界で200万人の新ミリオネアが誕生
AIブームが生み出した資産の奔流:世界で200万人の新ミリオネアが誕生
AI(人工知能)技術の急速な進展と社会実装の拡大が、世界的な個人資産の増大に極めて大きな影響を及ぼしています。結論から述べますと、近年のAIブームを背景に、世界のミリオネア(100万ドル以上の資産保有者)の数は約200万人増加しました。これ...
ChatGPTの記憶システムが大幅刷新:背景プロセス「Dreaming」による情報の自動合成と長期化を実現
ChatGPTの記憶システムが大幅刷新:背景プロセス「Dreaming」による情報の自動合成と長期化を実現
OpenAIは、ChatGPTにおけるパーソナライゼーションの核となる「記憶(Memory)」システムを大幅にアップデートしました。本更新の核心は、バックグラウンドで会話を解析・要約する「Dreaming」と呼ばれるアーキテクチャの導入です...
OpenAI CodexがiOSアプリ開発を効率化:新たなプラグインによる「シームレスな開発ループ」の実現
OpenAI CodexがiOSアプリ開発を効率化:新たなプラグインによる「シームレスな開発ループ」の実現
OpenAIは、開発支援ツール「Codex」において、iOSアプリケーションの開発・テスト工程を大幅に強化する「Build iOS Apps」プラグインを発表しました。本アップデートの核心は、これまで外部環境に依存していたビルドやプレビュー...
OpenAIのデータエージェント構築戦略:シンプルさが支える1.5エクサバイトの解析基盤
OpenAIのデータエージェント構築戦略:シンプルさが支える1.5エクサバイトの解析基盤
OpenAIが運用するデータエージェントは、一般的な開発チームが採用する「複数のLLMや複雑なパイプラインを組み合わせる手法」とは一線を画し、驚くほどシンプルな設計を採用しています。1.5エクサバイトという膨大なデータ量と9万のテーブルを、...
AIアニメーションの限界に挑む36時間。秋葉原で開催されるハッカソン「TapTV Arena Tokyo」の全貌
AIアニメーションの限界に挑む36時間。秋葉原で開催されるハッカソン「TapTV Arena Tokyo」の全貌
TapNow主催によるAIアニメーション制作ハッカソン「TapTV Arena Tokyo」が、東京・秋葉原のUDXにて開催されます。本イベントは、AI技術を駆使して短期間で高品質なアニメーション作品を創り出す能力を競うもので、生成AI時代...
NotebookLMに「Source Attribution」機能が実装:生成過程の可視化と再編集が可能に
NotebookLMに「Source Attribution」機能が実装:生成過程の可視化と再編集が可能に
NotebookLMは、生成された各コンテンツ(アーティファクト)の根拠を明示する新機能「Source Attribution」を公開しました。この機能は、AIがどのソースとプロンプトを組み合わせて回答を作成したのかという「数式(フォーミュ...
OpenAIのCodexが実現する新たな開発体験:対話型サイト生成機能「Sites」の発表
OpenAIのCodexが実現する新たな開発体験:対話型サイト生成機能「Sites」の発表
OpenAIは、AIモデル「Codex」を活用して、テキストや計画から即座にアプリやウェブサイトを構築できる新機能「Sites」を発表しました。この機能の重要性は、ユーザーが持つアイデアやワークフローを、チームで共有・利用可能な「URL形式...
ローカル環境で進化するAIエージェント:Nous Researchが「Hermes Desktop」のパブリックプレビューを公開
ローカル環境で進化するAIエージェント:Nous Researchが「Hermes Desktop」のパブリックプレビューを公開
Nous Researchは、AIエージェント「Hermes」の新たな進化形として、ローカル環境でネイティブに動作する「Hermes Desktop」を発表しました。本作は、従来のHermesエージェントが持つ高い機能を継承しつつ、ユーザー...
Search as Code:AIエージェントの自律性を最大化するPerplexityの新たな検索アーキテクチャ
Search as Code:AIエージェントの自律性を最大化するPerplexityの新たな検索アーキテクチャ
Perplexityは、AIエージェント向けの新検索アーキテクチャ「Search as Code (SaC)」を発表しました。これは、従来の「モデルが検索クエリを投げ、固定されたパイプラインの結果を受け取る」というモノリス(一枚岩)的な手法...
AIエージェントに「自己進化する脳」を。Tencent Hunyuanが発表した記憶フレームワーク「Hy-Memory」の全貌
AIエージェントに「自己進化する脳」を。Tencent Hunyuanが発表した記憶フレームワーク「Hy-Memory」の全貌
Tencent Hunyuanは、AIエージェントに高度な長期記憶能力を付与するプラグイン「Hy-Memory」をリリースしました。本プロジェクトは、単なる会話履歴の検索ツールを超え、エージェントが情報を構造的に理解し、時間の経過とともに自...
物理AIのフロンティアを切り拓く:RunwayとNVIDIAらによる「Cosmos Coalition」発足
物理AIのフロンティアを切り拓く:RunwayとNVIDIAらによる「Cosmos Coalition」発足
物理AI(Physical AI)の進化を加速させるため、Runway、NVIDIA、および主要なAI研究所が共同で「Cosmos Coalition」を設立しました。このイニシアチブの核心は、最先端の「世界モデル(World Models...
AIが研究にもたらす「思考の飛躍」:テレンス・タオ氏が示す新たな探索の地平
AIが研究にもたらす「思考の飛躍」:テレンス・タオ氏が示す新たな探索の地平
AIは研究者に対し、従来は困難であった「より大胆(Crazier)なアイデア」を追求する自由を提供します。テレンス・タオ氏は、AIの介在によって実験の余地が拡大し、予期せぬ道筋の検証が可能になると指摘しています。これにより、これまでは到達不...
ElevenLabsが「Dubbing v2」を発表:感情と演技を多言語で再現する革新的モデル
ElevenLabsが「Dubbing v2」を発表:感情と演技を多言語で再現する革新的モデル
音声AIの先駆者であるElevenLabsは、次世代のダビングモデル「Dubbing v2」を発表しました。本モデルの最大の特徴は、元のコンテンツに含まれる感情の起伏や演技のニュアンスを、翻訳先のあらゆる言語にそのまま引き継げる点にあります...
Hermes Agent v0.15.0「The Velocity Release」公開:検索速度750倍と強固なセキュリティを両立
Hermes Agent v0.15.0「The Velocity Release」公開:検索速度750倍と強固なセキュリティを両立
Nous Research関連プロジェクトより、Hermes Agentの最新バージョン「v0.15.0」がリリースされました。通称「The Velocity Release」と名付けられた本アップデートは、321名のコントリビューターによ...
Claude Codeの新機能「Dynamic Workflows」:大規模コードベース操作の自律化へ
Claude Codeの新機能「Dynamic Workflows」:大規模コードベース操作の自律化へ
Anthropicは、開発者向けツール「Claude Code」の新機能として「Dynamic Workflows」の研究プレビューを公開しました。この機能は、ユーザーの指示からJavaScriptスクリプトを生成し、役割の異なる複数のサブ...
Claude Opus 4.8のリリース:自律性の向上と判断力の洗練
Claude Opus 4.8のリリース:自律性の向上と判断力の洗練
開発支援ツール「Claude Code」において、最新モデルとなる「Opus 4.8」が公開されました。本モデルは前バージョンの4.7を基盤として開発されており、より的確な判断力と作業進捗に対する誠実さ、そして長時間の自律的な動作を実現して...
推論効率を最大化する次世代LLMネットワーク「ZCube」:構成の最適化による性能向上とコスト削減
推論効率を最大化する次世代LLMネットワーク「ZCube」:構成の最適化による性能向上とコスト削減
LLM推論インフラにおいて、ネットワークはもはや単なる接続層ではなく、スループットと遅延を左右するクリティカルパスとなっています。長文コンテキスト推論やPrefill-Decode(PD)分離の標準化に伴い、従来のFat-Tree(Clos...
AI映像クリエイターの知見が交差する自主上映会「AICDフィルムフェス」の開催
AI映像クリエイターの知見が交差する自主上映会「AICDフィルムフェス」の開催
「AICDフィルムフェス -AI Creators' Junction-」は、AI映像クリエイターたちが技術を共有し、繋がりを深めるための重要なハブとなるイベントです。世界的なAI映画祭「WAIFF」を通じて出会った有志による自主企画であり...
AIを欺く「嘘のフォント」:文書レビューを標的にした「Noroboto」攻撃の脅威
AIを欺く「嘘のフォント」:文書レビューを標的にした「Noroboto」攻撃の脅威
AIによる文書解析の盲点を突く「Noroboto」攻撃は、人間とAIで異なる情報を読み取らせる極めて巧妙な手法です。この攻撃の核心は、文書に埋め込まれた「悪意あるフォント」にあります。人間が画面上で見る文字(字形)と、AIが内部的に処理する...
Appleが放つ次世代AI画像コーデック「PICO」:視覚体験を維持しつつデータ量を劇的に削減
Appleが放つ次世代AI画像コーデック「PICO」:視覚体験を維持しつつデータ量を劇的に削減
Appleが発表した「PICO(Perceptual Image Codec)」は、機械学習を駆使して画像の圧縮率と視覚的な美しさを高い次元で両立させた新しい画像コーデックです。従来のAV1やVVCといった最新規格と比較して、同じ画質を維持...
AIエージェントの自律性と安全性の両立:Anthropicが実践する「サンドボックス」と「コンテインメント」
AIエージェントの自律性と安全性の両立:Anthropicが実践する「サンドボックス」と「コンテインメント」
AIエージェントの能力が向上し、かつては人間が行っていた複雑な業務を代替可能になるにつれ、エージェントがシステムに及ぼしうる潜在的な破壊的影響(爆発半径)への対策が不可欠となっています。Anthropicは、従来の「人間による監視(Huma...
ElevenLabsが次世代AI楽曲生成モデル「Music v2」をリリース:表現力と多言語対応を大幅強化
ElevenLabsが次世代AI楽曲生成モデル「Music v2」をリリース:表現力と多言語対応を大幅強化
ElevenLabsは、AI楽曲生成の最新アップデートとなる「Music v2」をリリースしました。本モデルの重要性は、ボーカル、楽器演奏、そして楽曲構成のすべてにおいて、ジャンルを問わず品質が大幅に向上した点にあります。さらに、多言語対応...
Dreamina Seedance 2.0:アヌシー国際アニメーション映画祭におけるAI活用の本格始動
Dreamina Seedance 2.0:アヌシー国際アニメーション映画祭におけるAI活用の本格始動
Dreamina AIは、最新のアニメーション制作ツール「Dreamina Seedance 2.0」のリリースに合わせ、世界最高峰のアニメーション映画祭である「アヌシー国際アニメーション映画祭」との提携を発表しました。2026年に開催され...
xAI、高度なコーディング・エージェント「Grok Build」ベータ版を公開:CLIを通じた全開発工程の自動化へ
xAI、高度なコーディング・エージェント「Grok Build」ベータ版を公開:CLIを通じた全開発工程の自動化へ
xAIは、複雑なプログラミング作業を支援する強力なコーディング・エージェント「Grok Build」のベータ版を公開しました。本ツールはSuperGrokおよびX Premium+ユーザーを対象としており、CLI(コマンドラインインターフェ...
Project Glasswing:AIが加速させるソフトウェア脆弱性特定とサイバー防衛の新局面
Project Glasswing:AIが加速させるソフトウェア脆弱性特定とサイバー防衛の新局面
Anthropicが主導する「Project Glasswing」は、高度なAIモデルを活用して世界の主要なソフトウェアの脆弱性を特定し、悪用される前に修正することを目指す革新的な取り組みです。現在、Claude Mythos Previe...
性的被害画像探索ツール「Paprika」の公開と、悪用を巡る技術的・倫理的議論
性的被害画像探索ツール「Paprika」の公開と、悪用を巡る技術的・倫理的議論
性的被害者支援を行うNPO法人ぱっぷすが、被害画像の自動探索を目的としたツール「Paprika」をGitHub上で公開し、その悪用を懸念する声が広がっています。本ツールは、被害画像削除の効率化を目指すプロジェクト「ProtectionAI」...
自律型AIエージェントを実運用へ:DevOpsの観点から「届ける」までを体験するハッカソン 2026
自律型AIエージェントを実運用へ:DevOpsの観点から「届ける」までを体験するハッカソン 2026
AIの活用フェーズは、チャットボットによる「応答」から、自律的にタスクを遂行する「AIエージェント」へと移行しつつあります。この進化に対応するため、グーグル・クラウド・ジャパンとファインディは、AIエージェントの企画からデプロイ、運用までを...
Qwen3.7-Max:自律型エージェントの実行力に特化した次世代フラグシップモデルの登場
Qwen3.7-Max:自律型エージェントの実行力に特化した次世代フラグシップモデルの登場
アリババのQwenチームは、最新のフラグシップモデル「Qwen3.7-Max」をリリースしました。本モデルは「エージェント時代(Agent Era)」を見据えて設計されており、単なるテキスト生成を超え、実際にタスクを完遂する「エージェント」...
AI MVドリーム・コンテスト:自由な発想を具現化する新たな創作の場
AI MVドリーム・コンテスト:自由な発想を具現化する新たな創作の場
TapNow 日本公式より、AIを活用したミュージックビデオ制作コンテスト「AI MVドリーム・コンテスト」の開催が発表されました。本プロジェクトは、技術の進歩によって個人のアイデアを形にするハードルが下がっている現状を背景に、眠っている創...
Google、賞金200万ドルのグローバルハッカソン「Build with Gemini XPRIZE」を発表:AIエージェントによる社会変革を促進
Google、賞金200万ドルのグローバルハッカソン「Build with Gemini XPRIZE」を発表:AIエージェントによる社会変革を促進
Googleは、開発者会議「Google I/O」にて、総額200万ドルの賞金を掲げたグローバルコンペティション「Build with Gemini XPRIZE」の開催を発表しました。本プロジェクトの核心は、Geminiが提供する「エージ...
ChatGPT、米国のProユーザー向けに「パーソナルファイナンス機能」を公開
ChatGPT、米国のProユーザー向けに「パーソナルファイナンス機能」を公開
OpenAIは、米国のChatGPT Proユーザーを対象に、AIを活用した新しい個人資産管理(パーソナルファイナンス)体験のプレビュー公開を開始しました。この機能の重要性は、ChatGPTが単なる対話型AIの枠を超え、ユーザーの実際の金融...
Claude Codeが「自律型エージェント」へと進化:新コマンド「_goal」とCLAUDE.md最適化の深層
Claude Codeが「自律型エージェント」へと進化:新コマンド「_goal」とCLAUDE.md最適化の深層
AnthropicのClaude Codeが、開発現場における信頼性を飛躍的に高めています。新機能「/goal」の導入とプロジェクト設定ファイル「CLAUDE.md」の最適化により、AIが単なるコード補助ツールから、自律的にタスクを完遂する...
Claude Codeに「agent view」が追加。セッション管理を効率化するリサーチプレビュー公開
Claude Codeに「agent view」が追加。セッション管理を効率化するリサーチプレビュー公開
Claude Codeにおいて、新たな管理インターフェース「agent view」が導入されました。本機能は、ユーザーが実行している全てのセッションを一つのリストとして集約して表示するものです。現在はリサーチプレビューとして公開されており、...
Seedance 2.0の社会実装を加速させるPolloAIの低コストキャンペーン:動画クリエイティブ検証の新たな選択肢
Seedance 2.0の社会実装を加速させるPolloAIの低コストキャンペーン:動画クリエイティブ検証の新たな選択肢
PolloAIが実施する「Seedance 2.0」を対象とした期間限定キャンペーンは、AI動画生成におけるコストパフォーマンスの概念を大きく塗り替えようとしています。特筆すべきは、1本あたり約17円という圧倒的な低単価で高精度な動画生成を...
アルゴリズム発見AI「AlphaEvolve」がもたらす最適化の革新:DNA解析から量子計算、物流まで
アルゴリズム発見AI「AlphaEvolve」がもたらす最適化の革新:DNA解析から量子計算、物流まで
Google DeepMindが開発した「AlphaEvolve」は、AI自身が新しいアルゴリズムを発見・改良する「アルゴリズム発見AI」として、導入から1年で多岐にわたる分野において劇的な成果を上げました。Geminiを活用してコードの候...
有効パラメータ7億で大規模モデルに迫る「ZAYA1-8B」の衝撃――AMDインフラがもたらす高密度な推論性能
有効パラメータ7億で大規模モデルに迫る「ZAYA1-8B」の衝撃――AMDインフラがもたらす高密度な推論性能
米国のAIスタートアップ「Zyphra」が開発した「ZAYA1-8B」は、小型モデルでありながら大規模言語モデル(LLM)級の推論性能を実現した画期的なAIモデルです。総パラメータ数約80億に対し、推論時の有効パラメータを約7億に抑えたMi...
OpenAI CodexがChromeに直接統合:バックグラウンドでの並列処理とシームレスな操作性を実現
OpenAI CodexがChromeに直接統合:バックグラウンドでの並列処理とシームレスな操作性を実現
OpenAIは、AIモデル「Codex」がmacOSおよびWindows上のGoogle Chromeで直接動作可能になったことを発表しました。このアップデートの重要性は、AIがブラウザという日常的な作業環境へ完全に統合され、バックグラウン...
YouTubeにおけるAIコンテンツの収益化リスク:実録・収益化停止の事例から学ぶ教訓
YouTubeにおけるAIコンテンツの収益化リスク:実録・収益化停止の事例から学ぶ教訓
YouTubeにおけるAIコンテンツの運用には、収益化に関する特有のリスクが潜んでいることが、クリエイターの実体験から明らかになりました。本事例において最も重要な点は、収益化条件を達成した直後にプラットフォーム側から「収益化停止」の措置が下...
Higgsfield AI、UGC動画の訴求力を高める生成ツール「Hooks by Marketing Studio」を公開
Higgsfield AI、UGC動画の訴求力を高める生成ツール「Hooks by Marketing Studio」を公開
Higgsfield AIは、UGC(ユーザー生成コンテンツ)動画の冒頭部分、いわゆる「フック」を戦略的に生成する新機能「Hooks by Marketing Studio」を発表しました。本ツールの重要性は、視聴者の注意を引くための構成案...
Google Flow MusicとBelieveの提携:AI音楽制作ツールの実用化とアーティスト支援の加速
Google Flow MusicとBelieveの提携:AI音楽制作ツールの実用化とアーティスト支援の加速
Google Labsは、AI音楽制作ツール「Flow Music」の普及と発展を目的として、世界的なアーティスト開発企業であるBelieveとの提携を発表しました。本提携の重要性は、実験段階にあるAI技術をプロフェッショナルな音楽制作の現...
生成AI広告における表現の境界線:ウテナの事例に見る「リーガル」と「文化」の乖離
生成AI広告における表現の境界線:ウテナの事例に見る「リーガル」と「文化」の乖離
生成AIを活用したクリエイティブ制作は、制作期間の大幅な短縮を可能にする一方で、既存の著作物や文化的背景への配慮という新たな課題を浮き彫りにしました。老舗化粧品メーカーの株式会社ウテナが、自社ブランドの交通広告およびPR動画の取り下げを決定...
低遅延なVoice AIを実現するOpenAIのWebRTCアーキテクチャ:9億人のユーザーを支える技術
低遅延なVoice AIを実現するOpenAIのWebRTCアーキテクチャ:9億人のユーザーを支える技術
音声AIにおいて、自然な対話体験を損なわないためには、会話のスピードに合わせたリアルタイムな応答が不可欠です。ネットワークの遅延は、不自然な間や割り込みの遅れとして即座にユーザーに感知されてしまうため、OpenAIでは週9億人以上のユーザー...
エキスパート・ペルソナの光と影:精度を維持しつつアライメントを向上させる新手法「PRISM」
エキスパート・ペルソナの光と影:精度を維持しつつアライメントを向上させる新手法「PRISM」
大規模言語モデル(LLM)において、特定の役割を与える「ペルソナ・プロンプティング」は、応答のトーンを専門分野に適合させる上で有効ですが、回答の正確性を損なうという深刻なトレードオフが存在します。本研究では、この課題を克服するために、意図に...
Codexにネイティブブラウザ機能が統合:自律型開発エージェントへの進化
Codexにネイティブブラウザ機能が統合:自律型開発エージェントへの進化
開発支援ツール「Codex」が大幅なアップデートを実施し、ネイティブブラウザ機能を統合しました。これにより、従来の「コード生成のみ」という枠組みを超え、Web情報の取得から実装までをシームレスに行うことが可能となりました。「調べてからコード...
Google Research「TurboQuant」:ベクトルの「回転」でAIのメモリ効率と速度を極限まで高める新技術
Google Research「TurboQuant」:ベクトルの「回転」でAIのメモリ効率と速度を極限まで高める新技術
Google Researchが2026年3月に発表した「TurboQuant」は、大規模言語モデル(LLM)やベクトル検索エンジンの実行効率を劇的に改善する新しい圧縮技術です。この技術は、AIの運用において大きなボトルネックとなっているメ...
AIクリエイターの新たな経済圏「AI HAVE」——中世ギルドの理念を現代のAI制作に
AIクリエイターの新たな経済圏「AI HAVE」——中世ギルドの理念を現代のAI制作に
AIクリエイターの収益化と案件マッチングを支援するプラットフォーム「AI HAVE」が発表されました。本サービスは、AIクリエイターの技術保護と適正な報酬獲得を目指す「Camelot System」の第一弾として構築されたものです。最大の特...
ElevenLabs、音楽の制作から収益化までを担う新プラットフォーム「ElevenMusic」を発表
ElevenLabs、音楽の制作から収益化までを担う新プラットフォーム「ElevenMusic」を発表
ElevenLabsは、独自の音楽生成モデルを基盤とした新プラットフォーム「ElevenMusic」を公開しました。本プラットフォームは、音楽の「発見」「リミックス」「制作」そして「収益化」という、音楽制作における一連のサイクルを統合したエ...
日本語特化型LLMベース音声合成「sarashina2.2-tts」:高度な表現力とZero-shot生成の実現
日本語特化型LLMベース音声合成「sarashina2.2-tts」:高度な表現力とZero-shot生成の実現
SB Intuitions株式会社は、日本語に特化したLLM(大規模言語モデル)ベースの音声合成システム「sarashina2.2-tts」を公開しました。本モデルは、日本語の複雑な発音やイントネーションを正確に捉えるだけでなく、短時間の参...
Runway、初のオンラインAPIハッカソンを開催:動画生成AIの「エージェント化」を加速
Runway、初のオンラインAPIハッカソンを開催:動画生成AIの「エージェント化」を加速
動画生成AIの先駆者であるRunwayは、同社初となるオンライン形式のAPIハッカソンを来週より開催することを発表しました。本イベントは、APIを活用した「リアルタイム動画エージェント」や「エージェンティック・メディアパイプライン」といった...
AI音楽の純粋な表現力を競う「SUNO VISION 2026」開催:ブラインド形式による評価を導入
AI音楽の純粋な表現力を競う「SUNO VISION 2026」開催:ブラインド形式による評価を導入
2026年5月1日より、AIを活用した音楽の祭典「SUNO VISION 2026」の募集が開始されます。本大会は、多様な国々の文化と音楽の融合を目指す国際的なコンテストです。最大の特徴は、制作者の情報を伏せた状態で審査を行う「ブラインド形...
GoogleがAnthropicへ最大6.4兆円を投資、インフラ確保とAI競争の激化
GoogleがAnthropicへ最大6.4兆円を投資、インフラ確保とAI競争の激化
Googleの親会社であるAlphabetが、AIアシスタント「Claude」を開発するAnthropicに対し、最大400億ドル(約6兆4,000億円)という巨額の投資を計画していることが明らかになりました。この動きは、Amazonが同社...
60年来の数学的難問をアマチュアが解決:AIとの協働がもたらす「直感的アプローチ」の躍進
60年来の数学的難問をアマチュアが解決:AIとの協働がもたらす「直感的アプローチ」の躍進
23歳のアマチュア数学愛好家であるリアム・プライス氏が、ChatGPTを活用することで、60年間未解決だったポール・エルデシュの数学問題に終止符を打ちました。特筆すべきは、従来のような厳密な定式化から入る手法ではなく、AIに自由な発想を促し...
xAI、Grok Imagineの新モデルを公開:リップシンクと音声同期の精度が大幅に向上
xAI、Grok Imagineの新モデルを公開:リップシンクと音声同期の精度が大幅に向上
xAI社は4月25日、画像から動画を生成する「Grok Imagine」の新モデルをリリースしました。今回のアップデートの核心は、リップシンク(口の動き)と音声の同期精度が劇的に向上した点にあります。イーロン・マスク氏が公開したデモ映像では...
DeepSeek-V4 Preview公開:100万トークンの長大なコンテキストを実現する1.6兆パラメータの次世代モデル
DeepSeek-V4 Preview公開:100万トークンの長大なコンテキストを実現する1.6兆パラメータの次世代モデル
DeepSeek社は、次世代の大規模言語モデル「DeepSeek-V4 Preview」を公式にリリースし、その重みをオープンソースとして公開しました。本モデルの最大の重要性は、100万(1M)トークンという長大なコンテキスト長を、極めて高...
政府AI活用の標準モデルへ:デジタル庁がガバメントAI「源内」をOSSとして公開
政府AI活用の標準モデルへ:デジタル庁がガバメントAI「源内」をOSSとして公開
デジタル庁は、中央省庁で導入が進められている生成AI利用環境「源内(げんない)」の一部を、商用利用可能なオープンソースソフトウェア(OSS)として公開しました。これは2025年に閣議決定された「人工知能(AI)基本計画」に基づき、政府自らが...
Bitwarden CLIを標的としたサプライチェーン攻撃:Checkmarxキャンペーンによる侵害の詳細
Bitwarden CLIを標的としたサプライチェーン攻撃:Checkmarxキャンペーンによる侵害の詳細
大手パスワード管理ツール「Bitwarden」のCLI(コマンドラインインターフェース)ツールが、進行中の「Checkmarxサプライチェーン攻撃キャンペーン」の影響を受け、侵害されたことが判明しました。Socket社の調査によれば、npm...
ElevenLabs、アンバサダープログラムの募集を開始 — コミュニティとの連携を強化
ElevenLabs、アンバサダープログラムの募集を開始 — コミュニティとの連携を強化
音声AIの先端を走るElevenLabsは、自社製品を活用するクリエイターや開発者を対象とした「アンバサダープログラム」の開始を発表しました。このプログラムの目的は、既存のユーザーコミュニティとの結びつきを深め、共に次世代の音声技術を形作っ...
GPT-5.5:エージェント型AIへの転換点と「コンピュータ・ユース」の本格化
GPT-5.5:エージェント型AIへの転換点と「コンピュータ・ユース」の本格化
OpenAIが発表したGPT-5.5は、単なる知能の向上に留まらず、複雑なタスクを自律的に遂行する「エージェント型AI」への大きな一歩となるモデルです。従来のモデルが指示を待つツールであったのに対し、GPT-5.5は複数のツールを横断し、自...
Google Cloudが「Agents CLI」を発表:AIエージェント開発ライフサイクル(ADLC)を統合する新基盤
Google Cloudが「Agents CLI」を発表:AIエージェント開発ライフサイクル(ADLC)を統合する新基盤
Google Cloudは、AIエージェントの開発からデプロイまでをシームレスに統合する「Agents CLI」を発表しました。現在、AIエージェントは実験的なスクリプトから実用的なプロダクションサービスへと移行しつつありますが、その開発基...
GPT-5.5の展開とOpenAIの長期戦略:反復的進化とAIの民主化がもたらす影響
GPT-5.5の展開とOpenAIの長期戦略:反復的進化とAIの民主化がもたらす影響
OpenAIのCEOであるサム・アルトマン氏は、最新モデル「GPT-5.5」のリリースに際し、同社の核心となる戦略的指針を表明しました。今回の発表で最も重要な点は、モデルを段階的に公開・改善していく「反復的デプロイメント」を安全戦略の柱に据...
Kling AIがネイティブ4K出力に対応、賞金総額2.5万ドルのショートフィルムコンテストを開催
Kling AIがネイティブ4K出力に対応、賞金総額2.5万ドルのショートフィルムコンテストを開催
動画生成AI「Kling AI」がネイティブ4K超高精細出力に対応し、映像クオリティを大幅に向上させました。これにより、細部まで詳細な質感表現と、より自然で滑らかな色彩の階調表現が可能になっています。この技術的進化を背景に、同社は世界中のク...
OpenAI Codexに新モード「Auto-review」が追加:自律的な実行と安全性の両立
OpenAI Codexに新モード「Auto-review」が追加:自律的な実行と安全性の両立
OpenAIは、Codexにおける開発効率と安全性を高める新機能「Auto-review」を発表しました。このモードは、開発者による承認の頻度を最小限に抑えつつ、長時間にわたるタスクの継続実行を可能にするものです。テストやビルド、複雑な自動...
OpenAI、ChatGPTの新機能「Workspace Agents」を発表 — 組織内の複雑なワークフローを自動化
OpenAI、ChatGPTの新機能「Workspace Agents」を発表 — 組織内の複雑なワークフローを自動化
OpenAIは、ChatGPTの新機能として「Workspace Agents」を発表しました。本機能は、組織内での複雑なタスクや長期間にわたるワークフローを、複数のツールやチームを横断して自律的に実行できる共有型のエージェントです。Ope...
Google Cloud GEAR:プロトタイプからエンタープライズ級AIエージェント実装への道筋
Google Cloud GEAR:プロトタイプからエンタープライズ級AIエージェント実装への道筋
Google Cloudが提供を開始した「GEAR(Gemini Enterprise Agent Ready)」は、AIエージェントの開発スキルをプロトタイプ段階からエンタープライズレベルへと引き上げるための総合学習プログラムです。現在の...
Google Gemini Deep Research:自律型リサーチエージェントのAPI公開と高度な共同計画機能
Google Gemini Deep Research:自律型リサーチエージェントのAPI公開と高度な共同計画機能
Googleは、高度な自律型リサーチエージェント「Deep Research」および「Deep Research Max」を、Gemini APIを通じて利用可能なInteractions API経由で公開しました。これは、長時間の処理を要...
Gemini Enterprise Agent Platformの発表:Vertex AIの進化がもたらすビジネスエージェントの統合管理
Gemini Enterprise Agent Platformの発表:Vertex AIの進化がもたらすビジネスエージェントの統合管理
Google DeepMindは、Google Cloudと共同で「Gemini Enterprise Agent Platform」を発表しました。本プラットフォームは、企業がAIエージェントの開発、スケーリング、ガバナンス、および最適化...
Xiaomi MiMo-V2.5 Voiceの発表:AIエージェント時代に向けたフルスタック音声ソリューション
Xiaomi MiMo-V2.5 Voiceの発表:AIエージェント時代に向けたフルスタック音声ソリューション
Xiaomi MiMoは、次世代のAIエージェント構築を見据えたフルスタック音声ソリューション「MiMo-V2.5 Voice」をリリースしました。本プロジェクトの重要性は、音声AIを単なる「聞き取りと読み上げ」のツールから、精密な理解と柔...
Workspace Intelligence:Geminiの推論能力が統合する次世代の業務基盤
Workspace Intelligence:Geminiの推論能力が統合する次世代の業務基盤
Googleは、Google Workspace全体に高度な推論能力を組み込む「Workspace Intelligence」を発表しました。これは、Gmail、ドキュメント、ドライブなどの各アプリ間に存在する情報の分断(コンテキスト・サイ...
OpenAI、2030年までに30GWの計算資源確保を計画:AIインフラの急速な拡張へ
OpenAI、2030年までに30GWの計算資源確保を計画:AIインフラの急速な拡張へ
OpenAIは、2030年までに30GW(ギガワット)に及ぶ大規模な計算資源(コンピューティング・キャパシティ)を確保する計画を明らかにしました。これは、2025年1月時点で掲げていた10GWという目標を大幅に上回るものです。同社は、当初目...
AIは労働をどう変えるか:Anthropicが8万人のユーザーから得た「経済的影響」の全貌
AIは労働をどう変えるか:Anthropicが8万人のユーザーから得た「経済的影響」の全貌
Anthropicが実施した81,000人のClaudeユーザーを対象とする大規模調査は、AIが労働環境に与える実質的な影響を浮き彫りにしました。本調査の核心は、AIへの「露出度(AIがタスクを代替する割合)」が高い職種ほど、失業に対する懸...
Google AI Studioの特典拡充:AI Pro_Ultraサブスクリプションで開発環境を強化
Google AI Studioの特典拡充:AI Pro_Ultraサブスクリプションで開発環境を強化
Googleは、AI ProおよびUltraのサブスクリプション利用者向けに、Google AI Studioにおける利用制限の引き上げとアクセス可能なモデルの拡充を発表しました。本アップデートの目的は、開発者が予測可能なコストで迅速にアイ...
AIプラットフォーム依存が孕む事業継続リスク:Anthropicによる一斉アカウント停止事例
AIプラットフォーム依存が孕む事業継続リスク:Anthropicによる一斉アカウント停止事例
AIプラットフォームへの過度な依存が、企業の事業継続における重大なリスクとして顕在化しています。Anthropic社が、ある組織の全社員(60名以上)に対して、詳細な理由を明示せぬまま利用規約侵害を理由にアカウントを一斉停止した事例が報告さ...
X、API経由のリンク投稿コストを1900%引き上げ――スパム対策と「脱・自動投稿」の加速
X、API経由のリンク投稿コストを1900%引き上げ――スパム対策と「脱・自動投稿」の加速
X(旧Twitter)は2026年4月20日、APIを利用してURLを含む投稿を行う際の料金を、1投稿あたり0.01ドルから0.20ドル(約32円)へと大幅に引き上げました。この1900%におよぶ極端な値上げは、自動投稿ツールを利用するパブ...
SpaceXによるCursorの買収オプション締結:AI開発加速と巨額提携の全容
SpaceXによるCursorの買収オプション締結:AI開発加速と巨額提携の全容
SpaceXは、コーディングAIを開発するスタートアップ「Cursor」と戦略的提携を締結しました。この提携の核心は、SpaceXが保有する世界最大級のスーパーコンピューター「Colossus」の計算資源をCursorのモデル学習に提供し、...
AI開発の倫理的・技術的課題に端を発する「反AI運動」の激化とその実態
AI開発の倫理的・技術的課題に端を発する「反AI運動」の激化とその実態
人工知能(AI)が人類の生産性を向上させる一方で、その開発手法や社会的影響に対する抵抗運動が世界規模で激化しています。この運動の背景には、著作権を軽視した学習や誤情報の拡散、さらにはAIによる雇用代替への強い懸念が存在します。単なる感情的な...
Gemini 3.1 Pro搭載の自律型エージェント「Deep Research Max」発表:専門調査を自動化する次世代のワークフロー
Gemini 3.1 Pro搭載の自律型エージェント「Deep Research Max」発表:専門調査を自動化する次世代のワークフロー
Googleは、Gemini 3.1 Proを基盤とした新たなAIエージェント「Deep Research」および「Deep Research Max」を発表しました。これらは従来の検索AIの枠を超え、ウェブや社内データ、専門的なデータリポ...
OpenAIが次世代画像モデル「ChatGPT Images 2.0」を発表――思考レベルの知能で複雑な視覚タスクに対応
OpenAIが次世代画像モデル「ChatGPT Images 2.0」を発表――思考レベルの知能で複雑な視覚タスクに対応
OpenAIは、最新の画像生成モデル「ChatGPT Images 2.0」を発表しました。本モデルの重要性は、単なる画像生成の枠を超え、複雑な視覚的タスクを完遂できる「思考レベルの知能」を備えた点にあります。これにより、ユーザーは精緻なレ...
OpenAIが「GPT Images 2.0」を正式リリース:思考レベルの知性を備えた視覚生成AIの新たな地平
OpenAIが「GPT Images 2.0」を正式リリース:思考レベルの知性を備えた視覚生成AIの新たな地平
OpenAIは、次世代画像生成モデル「GPT Images 2.0」を正式にリリースしました。本モデルは、従来の画像生成の枠組みを超え、複雑な視覚的タスクを処理できる「思考レベルの知性」を備えている点が最大の特徴です。APIも同時に開放され...
Claude Developer Consoleに新機能:コスト最適化とTTFT改善を支援する「キャッシュダッシュボード」が登場
Claude Developer Consoleに新機能:コスト最適化とTTFT改善を支援する「キャッシュダッシュボード」が登場
Claude Developer Consoleにおいて、キャッシュの利用状況を可視化する新しいダッシュボードが導入されました。大規模言語モデル(LLM)の運用において、キャッシュの効率的な活用はAPI利用コストの削減と、応答開始までの時間...
AIのハルシネーションを「娯楽」へ昇華させる:偽Wikipedia生成サイト「嘘ペディア」の設計思想
AIのハルシネーションを「娯楽」へ昇華させる:偽Wikipedia生成サイト「嘘ペディア」の設計思想
AIの「もっともらしい嘘(ハルシネーション)」を逆手に取り、架空の百科事典記事を生成するサービス「嘘ペディア」が注目を集めています。本作は、WikipediaがAI生成コンテンツを禁止した潮流へのカウンターとして開発されました。LLM(大規...
Anthropicが「Opus 4.7」活用ハッカソンを開催:総額10万ドルのAPIクレジットを賞品に
Anthropicが「Opus 4.7」活用ハッカソンを開催:総額10万ドルのAPIクレジットを賞品に
ClaudeDevsは、最新のAIモデル「Opus 4.7」を活用したバーチャルハッカソンの開催を発表しました。本イベントは世界中の開発者を対象としており、一週間にわたって次世代のアプリケーション構築を競い合うものです。特筆すべきは、総額1...
Google AI、Gemini 3.1 Flash TTSやロボティクス性能向上を含む大規模アップデートを発表
Google AI、Gemini 3.1 Flash TTSやロボティクス性能向上を含む大規模アップデートを発表
Googleは、Geminiエコシステムにおける広範なアップデートを公開しました。今回の更新では、70言語以上に対応し複数話者による対話が可能な次世代音声合成モデル「Gemini 3.1 Flash TTS」の導入や、物理的な推論能力を強化...
Google Researchが提唱する「AI Quests」:環境保護を通じた次世代のAIリテラシー教育
Google Researchが提唱する「AI Quests」:環境保護を通じた次世代のAIリテラシー教育
Google Researchは、アースマンス(地球月間)に合わせ、10歳から15歳の学習者を対象とした教育プログラム「AI Quests」を公開しました。本プログラムの目的は、AIに対して単に指示文を入力する「表面的なプロンプト操作」の段...
Google Labs、AI音楽制作ツール「Flow Music」を発表:自然言語による楽曲生成を本格展開
Google Labs、AI音楽制作ツール「Flow Music」を発表:自然言語による楽曲生成を本格展開
Google Labsは、AIを用いた音楽制作プラットフォーム「Flow Music」を発表しました。これまで「ProducerAI」として知られていたプロジェクトをリブランディングし、独立したサービスとして展開するものです。自然言語による...
AI生成楽曲「Celebrate Me」がiTunesグローバルチャートで首位を獲得
AI生成楽曲「Celebrate Me」がiTunesグローバルチャートで首位を獲得
音楽制作における生成AIの活用が、ついに商業的な頂点に到達しました。2026年4月17日、AIによって生成された楽曲「Celebrate Me」が、iTunesのグローバルチャートにおいて第1位を獲得したことが明らかとなりました。これは、A...
ローカルAI実行環境「Ollama」に投げかけられた懸念:llama.cppとの比較と開発姿勢を問う
ローカルAI実行環境「Ollama」に投げかけられた懸念:llama.cppとの比較と開発姿勢を問う
ローカル環境で大規模言語モデル(LLM)を容易に実行できるツールとして急速に普及した「Ollama」に対し、ソフトウェアエンジニアのzetaphor氏が、その開発姿勢や技術的選択、ライセンス遵守の不備について深刻な懸念を表明しています。Ol...
Alibaba ATHが「HappyOysterAI」を発表:リアルタイムな世界構築を実現するオープンエンド型モデル
Alibaba ATHが「HappyOysterAI」を発表:リアルタイムな世界構築を実現するオープンエンド型モデル
Alibaba Group(Alibaba ATH)は、リアルタイムでの世界構築と相互作用を目的としたオープンエンド型ワールドモデル「HappyOysterAI」を発表しました。この技術は、AIが単なるコンテンツ生成に留まらず、動的でインタ...
Seedance 2.0 API 正式リリース:動画生成AIが「世界モデル」の雛形として産業実装へ
Seedance 2.0 API 正式リリース:動画生成AIが「世界モデル」の雛形として産業実装へ
ByteDance傘下の火山引擎(Volcengine)より、動画生成モデル「Seedance 2.0」のAPIが正式に公開されました。本APIは企業および個人ユーザー双方が利用可能で、グローバル市場向けにはBytePlusを通じて展開され...
AI小説が「星新一賞」を席巻――文学の定義を揺るがす技術の到達点
AI小説が「星新一賞」を席巻――文学の定義を揺るがす技術の到達点
星新一賞において、受賞作4作品のうち3作品がAIを用いて執筆された作品であったことが明らかになりました。AIが生成した文章が、プロの審査員をして「人間の手によるものと区別がつかない」と言わしめるレベルに達していることが示された形です。プロッ...
AI開発エージェント「Codex」がインアプリブラウザを搭載:DOM情報の自動取得による高精度な対話を実現
AI開発エージェント「Codex」がインアプリブラウザを搭載:DOM情報の自動取得による高精度な対話を実現
開発エージェントの「Codex」が、新たに「コメントモード」を搭載したインアプリブラウザ機能を発表しました。これは、プレビュー確認とAIへの指示出しという、開発工程における分断を解消するための重要なアップデートです。ユーザーはブラウザ上で特...
OpenAI Codexが「万能エージェント」へ進化:Mac操作や学習機能を備えた新世代の姿
OpenAI Codexが「万能エージェント」へ進化:Mac操作や学習機能を備えた新世代の姿
OpenAIは、同社のモデル「Codex」が、プログラミング支援の枠を超えて「ほぼすべての作業(almost everything)」をこなすためのプラットフォームへと進化したことを発表しました。このアップデートの核心は、単なるコード生成に...
動画編集に特化した新モデル「HappyHorse-1.0」がArenaに登場、2週間後の正式リリースへ
動画編集に特化した新モデル「HappyHorse-1.0」がArenaに登場、2週間後の正式リリースへ
AIモデルの評価プラットフォーム「Arena」に、新たなモデル「HappyHorse-1.0」が公開されました。本モデルは、初期評価において動画編集(Video Edit)の分野で卓越したパフォーマンスを示している点が最大の特徴です。現在は...
Google Research、作家の創作活動を支援するAIツール「Fabula」を発表:CHI 2026にてデモ公開
Google Research、作家の創作活動を支援するAIツール「Fabula」を発表:CHI 2026にてデモ公開
Google Researchは、作家が物語の構造化や推敲を行うためのインタラクティブなAI執筆ツール「Fabula」を発表しました。本ツールは、単なる自動文章生成を目指すものではなく、42名の専門的な作家との共同設計(Co-design)...
人型ロボット「H1」が秒速10mを達成:人類最速の領域に迫るロボティクスの進化
人型ロボット「H1」が秒速10mを達成:人類最速の領域に迫るロボティクスの進化
中国のロボティクス企業Unitreeが開発した人型ロボット「H1」が、秒速10メートル(時速36キロメートル)の走行速度を達成しました。この記録は、ウサイン・ボルト氏による100メートル走の世界記録「9秒58」に迫る極めて高いパフォーマンス...
Claudeにおける「送信者誤認」の重大な脆弱性:AIが自己メッセージをユーザー指示と取り違える事象について
Claudeにおける「送信者誤認」の重大な脆弱性:AIが自己メッセージをユーザー指示と取り違える事象について
Anthropic社のAI「Claude」において、自分自身が送信したメッセージをユーザーからの指示であると誤解し、勝手に処理を実行してしまう重大な不具合が報告されています。これは事実と異なる情報を生成する「ハルシネーション」とは本質的に異...
脆弱性発見に特化したAI「Claude Mythos Preview」登場:Anthropicが主導する防御プロジェクト「Project Glasswing」の全貌
脆弱性発見に特化したAI「Claude Mythos Preview」登場:Anthropicが主導する防御プロジェクト「Project Glasswing」の全貌
Anthropicは2026年4月7日、サイバー攻撃性能を飛躍的に向上させた新モデル「Claude Mythos Preview」を発表しました。本モデルはソフトウェアの脆弱性を自律的に特定・悪用する能力において、既存のAIや多くの専門家を...
中国発の最新AIモデル「GLM-5.1」公開:長時間タスクで真価を発揮するオープンモデルの到達点
中国発の最新AIモデル「GLM-5.1」公開:長時間タスクで真価を発揮するオープンモデルの到達点
中国のAI企業 Z.aiは、2026年4月7日、オープンソースモデルとして世界最高クラスの性能を誇る「GLM-5.1」を公開しました。本モデルの最大の特徴は、従来のAIが苦手としていた「長時間にわたる複雑なタスク(Long-Horizon...
Alibabaの最新動画生成AI「HappyHorse-1.0」が世界1位を記録:その実態と開発背景
Alibabaの最新動画生成AI「HappyHorse-1.0」が世界1位を記録:その実態と開発背景
2026年4月、動画生成AIの評価ランキングにおいて、GoogleやByteDanceといった大手企業のモデルを抑え、突如トップに躍り出たモデルが「HappyHorse-1.0」です。長らく開発元が不明とされてきましたが、その正体はAlib...
動画生成AIの新たなベンチマーク:謎のモデル「HappyHorse-1.0」が主要ランキングで首位を獲得
動画生成AIの新たなベンチマーク:謎のモデル「HappyHorse-1.0」が主要ランキングで首位を獲得
動画生成AIの分野において、突如として現れた未知のモデル「HappyHorse-1.0」が、業界の勢力図を塗り替える可能性を示しています。AI性能分析サイト「Artificial Analysis」が運営するブラインドテスト形式のランキング...
YouTubeショートが提案する新たな表現様式:自己複製AI「ライブセルフィー」の導入とその仕組み
YouTubeショートが提案する新たな表現様式:自己複製AI「ライブセルフィー」の導入とその仕組み
YouTubeは、クリエイターが自身の顔と声を忠実に再現したデジタルアバターを作成できる新機能「ライブセルフィー」をリリースしました。この機能の重要性は、動画制作における「撮影」という物理的プロセスを、AIによる「生成」へと置き換える点にあ...
Anthropicが独自AIチップ開発を検討:激化する計算リソース確保への戦略的アプローチ
Anthropicが独自AIチップ開発を検討:激化する計算リソース確保への戦略的アプローチ
AIチャットボット「Claude」の開発元であるAnthropicが、独自のAIチップ開発を検討していることが明らかになりました。これは、市場における高度なAIチップの需給逼迫を受け、次世代AIシステムの安定的な運用と進化を確実にするための...
ChatGPT Proプランに月額1.6万円の新ティア導入。Codex利用を大幅強化
ChatGPT Proプランに月額1.6万円の新ティア導入。Codex利用を大幅強化
OpenAIは、ChatGPTの最上位サブスクリプションである「Proプラン」において、月額1万6800円(100ドル)で利用可能な新しいティア(階層)を追加しました。これは従来の月額3万円(200ドル)のプランと、月額3000円(20ドル...
Xにおける「外部リンク」がエンゲージメントを減退させる実態:メディア18社の調査結果
Xにおける「外部リンク」がエンゲージメントを減退させる実態:メディア18社の調査結果
X(旧Twitter)において、外部サイトへのリンクを含む投稿が、インプレッションやエンゲージメント(RT、いいね等)を著しく低下させていることが、詳細な調査によって明らかになりました。ハーバード大学ニーマン財団の調査機関「ニーマン・ラボ」...
SpaceXAIの「Colossus 2」にて7種のAIモデルが同時並行でトレーニング開始。最大10兆パラメータ規模へ
SpaceXAIの「Colossus 2」にて7種のAIモデルが同時並行でトレーニング開始。最大10兆パラメータ規模へ
イーロン・マスク氏は、AI開発基盤「Colossus 2」において、現在7つの新しいAIモデルが同時にトレーニング段階にあることを明らかにしました。これには画像生成モデルの次世代版に加え、最大で10兆(10T)パラメータ規模に達する超大規模...
AIは学習の「加速器」か「松葉杖」か:ChatGPT利用による知識定着率低下の検証
AIは学習の「加速器」か「松葉杖」か:ChatGPT利用による知識定着率低下の検証
ChatGPTをはじめとする生成AIは、情報の整理や要約において卓越した能力を発揮し、学習効率を劇的に向上させます。しかし、最新の研究により、AIに頼りすぎる学習は「長期的な記憶の定着」を阻害する可能性があることが明らかになりました。ブラジ...
AIによる支援が招く「粘り強さ」の低下:学習効率と長期的な弊害に関する研究報告
AIによる支援が招く「粘り強さ」の低下:学習効率と長期的な弊害に関する研究報告
AIによる学習支援は、短期的には作業効率を向上させるものの、長期的には個人の「粘り強さ」を損ない、結果として成績を悪化させる可能性があることが最新の研究で示唆されました。研究チームが実施した実験によれば、AIの補助を受けて練習問題を解いたグ...
Google Chromeに待望の「垂直タブ」が登場 ― 効率的なタブ管理と没入型読書を実現する新機能
Google Chromeに待望の「垂直タブ」が登場 ― 効率的なタブ管理と没入型読書を実現する新機能
Google Chromeにおいて、タブを縦方向に配置する「垂直タブ」機能および「全画面リーディングモード」が実装されました。従来の水平タブは、開くタブの数が増えるほど各タイトルの視認性が著しく低下するという課題がありましたが、垂直タブの導...
LinkedInによるブラウザ拡張機能の無断スキャン:フィンガープリンティングの脅威と実態
LinkedInによるブラウザ拡張機能の無断スキャン:フィンガープリンティングの脅威と実態
LinkedInが、ユーザーのブラウザにインストールされている6,000個以上の拡張機能を無断でスキャンしていることが判明しました。これは、ブラウザから取得できる情報を組み合わせて個人を特定する「フィンガープリンティング」という手法の一環と...
Claudeが提唱する「アドバイザー戦略」:高精度と低コストを両立する新手法
Claudeが提唱する「アドバイザー戦略」:高精度と低コストを両立する新手法
Anthropicは、Claude Platformにおいて「アドバイザー戦略(advisor strategy)」を導入することを発表しました。この手法は、最高位モデルであるClaude Opusを「助言者(advisor)」、中位・軽量...
Claude Codeに新搭載された「Monitor Tool」:バックグラウンド監視による自律的なエージェント動作の実現
Claude Codeに新搭載された「Monitor Tool」:バックグラウンド監視による自律的なエージェント動作の実現
Claude Codeに新たに導入された「Monitor Tool」は、AIエージェントの運用効率を劇的に向上させる画期的な機能です。このツールにより、Claudeはバックグラウンドで動作するスクリプトを生成し、必要な時だけ自身を起動させる...
Google Gemini、新モデル「Lyria 3 Pro」を搭載し長尺の音楽生成に対応
Google Gemini、新モデル「Lyria 3 Pro」を搭載し長尺の音楽生成に対応
Googleは、生成AI「Gemini」において、より長時間の楽曲生成機能をリリースしたことを発表しました。最新の音楽生成モデル「Lyria 3 Pro」を採用したことで、従来の制限を超えた長尺トラックの作成が可能となり、音楽制作における表...
ElevenLabsがオンプレミス・オンデバイス展開に対応:エンタープライズ環境の全域をカバー
ElevenLabsがオンプレミス・オンデバイス展開に対応:エンタープライズ環境の全域をカバー
音声生成AIのリーダーであるElevenLabsは、新たにオンプレミス(自社運用)およびオンデバイス(端末内処理)でのデプロイメントに対応したことを発表しました。これまで同社はクラウドおよびVPC(仮想プライベートクラウド)での提供を主軸と...
GeminiにNotebookLMが融合、情報の統合と整理を加速させる「ノートブック」機能が登場
GeminiにNotebookLMが融合、情報の統合と整理を加速させる「ノートブック」機能が登場
Googleは、AIアシスタント「Gemini」に強力な研究支援ツール「NotebookLM」の機能を統合した新機能「ノートブック」を発表しました。この統合により、Geminiは単なるチャットボットの枠を超え、膨大な情報を構造化し、多角的に...
メタが放つ高効率・高性能モデル「Muse Spark」の実力:AI戦略の転換点となるか
メタが放つ高効率・高性能モデル「Muse Spark」の実力:AI戦略の転換点となるか
メタ(Meta)のスーパーインテリジェンス・ラボは、次世代AIモデル「Muse Spark」を発表しました。本モデルは、独立ベンチマークにおいて世界トップ5にランクインする高い性能を誇りながら、Llama 4と同等の能力を従来の10分の1以...
マイクロソフトが提供するドキュメント変換ツール「MarkItDown」:LLMに最適化されたMarkdown形式への統合
マイクロソフトが提供するドキュメント変換ツール「MarkItDown」:LLMに最適化されたMarkdown形式への統合
マイクロソフトは、多様なファイル形式をMarkdownへ変換する軽量なPythonユーティリティ「MarkItDown」を公開しました。現在、LLM(大規模言語モデル)の多くは学習過程でMarkdown形式を深く理解しており、構造化されたテ...
Claude Managed Agents:AIエージェントの大規模構築と迅速なデプロイを実現する新基盤
Claude Managed Agents:AIエージェントの大規模構築と迅速なデプロイを実現する新基盤
Anthropicは、AIエージェントの構築から大規模なデプロイまでを包括的に支援する新サービス「Claude Managed Agents」を発表しました。本サービスは、パフォーマンスを最適化したエージェント用ハーネス(制御機構)と商用レ...
iPhoneでGoogleの最新AI「Gemma 4」をローカル実行。Google AI Edge Galleryが示すエッジAIの未来
iPhoneでGoogleの最新AI「Gemma 4」をローカル実行。Google AI Edge Galleryが示すエッジAIの未来
Googleが発表した最新のオープンソースAIモデル「Gemma 4」が、公式アプリ「Google AI Edge Gallery」を通じてiPhone上でのローカル動作に対応しました。これまでクラウド上での処理が主流だった大規模言語モデル...
Codexが導く農業DX:非エンジニアの農家による「ビニールハウス自動開閉システム」の開発
Codexが導く農業DX:非エンジニアの農家による「ビニールハウス自動開閉システム」の開発
AI技術の進化が、専門職以外の領域でも高度なシステム開発を可能にしています。北海道の大規模農家であるとみやす氏(@tomiyasu16)は、AIコーディング支援ツール「Codex」を活用し、ビニールハウスの巻き上げ自動開閉システムを自ら開発...
12兆トークンの結晶:国産LLM「LLM-jp-4」が示す日本語特化型モデルの真価
12兆トークンの結晶:国産LLM「LLM-jp-4」が示す日本語特化型モデルの真価
国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)は、新たな国産LLM「LLM-jp-4」の8Bモデルおよび32B-A3Bモデルをオープンソースで公開しました。本モデルの重要性は、約12兆トークンという膨大な良質コーパ...
ローカルLLMの新境地:Gemma 4とOpenClawによるプライベート・エージェントの構築
ローカルLLMの新境地:Gemma 4とOpenClawによるプライベート・エージェントの構築
ローカル環境におけるAIスタックが、実用レベルに達しつつあります。Googleの最新オープンソースモデル「Gemma 4」とフレームワーク「OpenClaw」を組み合わせることで、MacBook Air M4のような一般向けハードウェア上で...
Claude Codeで実現するAIマーケティング自動化:高収益企業のノウハウを統合した「AI Marketing Skills」が公開
Claude Codeで実現するAIマーケティング自動化:高収益企業のノウハウを統合した「AI Marketing Skills」が公開
高収益を誇るマーケティング企業が、自社の知見をコード化した「AI Marketing Skills」をオープンソースとして公開しました。本ツールはAnthropic社の開発用コマンドラインツール「Claude Code」に組み込むことで、高...
Kimi (Moonshot AI) が「Interstellar Program」を始動:AGI実現に向けた精鋭人材の採用を加速
Kimi (Moonshot AI) が「Interstellar Program」を始動:AGI実現に向けた精鋭人材の採用を加速
AGI(汎用人工知能)の開発を推進するKimi.ai(Moonshot AI)は、次世代のリーダーや技術者を募る新プログラム「Interstellar Program」を発表しました。設立から3年、同社は既に1兆パラメータ規模のエージェント...
Untitled_Article
Untitled_Article
Accomplishは、Windows、macOS、Linuxで動作する、MITライセンスのオープンソースAIデスクトップエージェントです。最大の重要性は、内蔵されたローカルAIにより、外部APIキーやサインアップ不要で即座にデスクトップ上...
Claude Codeにおける予期せぬ利用制限問題の発生と調査報告
Claude Codeにおける予期せぬ利用制限問題の発生と調査報告
AI開発支援ツール「Claude Code」において、ユーザーが想定よりも遥かに早いタイミングで利用制限(Usage Limits)に達してしまう問題が発生しています。開発チームのLydia Hallie氏は、本件に関するユーザーからの多数...
「AIの感情」を科学する:AnthropicがLLM内部の感情概念に関する研究成果を発表
「AIの感情」を科学する:AnthropicがLLM内部の感情概念に関する研究成果を発表
Anthropicは、大規模言語モデル(LLM)における「感情概念」の機能とその内部表現に関する最新の研究成果を発表しました。従来、LLMが感情を持っているかのように振る舞う現象は観察されてきましたが、そのメカニズムは不明な点が多く残されて...
Anthropicが開発する常時稼働AIエージェント「Conway」— 自律型プラットフォームへのパラダイムシフト
Anthropicが開発する常時稼働AIエージェント「Conway」— 自律型プラットフォームへのパラダイムシフト
Anthropicが開発中とされる「Conway」は、従来の「問いに答える」対話型AIから、「自律的に判断し実行する」常時稼働型エージェントへの進化を象徴するプロダクトです。Claude Codeのソースコード流出に続き、Testing C...
Qwen3.6-Plusの登場:1Mコンテキストと高度なエージェント機能を備えた次世代マルチモーダルモデル
Qwen3.6-Plusの登場:1Mコンテキストと高度なエージェント機能を備えた次世代マルチモーダルモデル
AlibabaのQwenチームは、リアルワールド・エージェントの実現に向けた大きな節目となる新モデル「Qwen3.6-Plus」を発表しました。本モデルは、前世代であるQwen3.5へのフィードバックを基に構築されており、ネイティブなマルチ...
Google AnalyticsがModel Context Protocol(MCP)に対応。LLMとの直接連携による高度なデータ分析を実現
Google AnalyticsがModel Context Protocol(MCP)に対応。LLMとの直接連携による高度なデータ分析を実現
Google Analytics(GA)がModel Context Protocol(MCP)に対応し、Geminiなどの大規模言語モデル(LLM)とGAデータを直接連携させることが可能になりました。これまでアナリティクスデータの活用は、...
SSH経由のドキュメント公開:Supabaseが提案するAIエージェントへの最適解
SSH経由のドキュメント公開:Supabaseが提案するAIエージェントへの最適解
Supabaseが試験的に公開した「SSH経由でドキュメントを公開する手法」は、AI時代の開発環境におけるドキュメント提供のあり方に新たな視点を提供しています。従来、AIエージェントが情報を参照するにはウェブサイトのスクレイピングや特定のツ...
「Computer Use」がWindowsに対応。ClaudeによるPC自動操作の可能性が拡大
「Computer Use」がWindowsに対応。ClaudeによるPC自動操作の可能性が拡大
Anthropicは、AIモデル「Claude」がユーザーのPCを直接操作する機能「Computer Use」を、Windows OS向けに提供開始しました。これは、これまでmacOSに限定されていたリサーチプレビュー機能を拡張するもので、...
Google DeepMind、高度な推論とエージェント機能を備えた「Gemma 4」を発表
Google DeepMind、高度な推論とエージェント機能を備えた「Gemma 4」を発表
Google DeepMindは、新しいオープンモデルファミリー「Gemma 4」を公開しました。本モデルは、ユーザー自身のハードウェア上で実行可能でありながら、高度な推論能力とエージェント型のワークフローに最適化されている点が最大の特徴で...
Claude Codeのソースコード流出が示唆する、Anthropicが描く「次世代AIエージェント」の全貌
Claude Codeのソースコード流出が示唆する、Anthropicが描く「次世代AIエージェント」の全貌
2026年3月31日、AnthropicのコーディングAIエージェント「Claude Code」のnpmパッケージに、誤ってソースマップファイルが含まれた状態で公開される事案が発生しました。この人為的ミスに起因するソースコードの流出により、...
Ollama 0.19:MLX対応によるAppleシリコンでの圧倒的パフォーマンス向上
Ollama 0.19:MLX対応によるAppleシリコンでの圧倒的パフォーマンス向上
ローカルAI実行環境のデファクトスタンダードになりつつある「Ollama」が、バージョン0.19においてAppleの機械学習フレームワーク「MLX」を基盤とした最適化を実現しました。このアップデートは、Appleシリコン搭載Macにおける推...
AnthropicのAIコーディングツール「Claude Code」がソースコード流出、人為的ミスによる大規模な余波
AnthropicのAIコーディングツール「Claude Code」がソースコード流出、人為的ミスによる大規模な余波
AIスタートアップのAnthropicが展開するコーディングアシスタント「Claude Code」のソースコードが、人為的なミスによって意図せず流出しました。この事態は、npmレジストリへのアップデート時に内部ファイルが含まれてしまったこと...
究極のチームメイトへ:SlackbotがAI従業員へと進化する「新生Slack」の衝撃
究極のチームメイトへ:SlackbotがAI従業員へと進化する「新生Slack」の衝撃
Salesforceは、Slackを「AIが働く場所(Where AI works)」へと再定義し、Slackbotに30以上の新機能を搭載したことを発表しました。これによりSlackbotは単なる通知ツールを超え、組織のあらゆる業務をサポ...
コンピュータ操作特化型モデル「Holo3」が登場:OSWorldでGPT-5.4を凌駕する性能を実証
コンピュータ操作特化型モデル「Holo3」が登場:OSWorldでGPT-5.4を凌駕する性能を実証
H社(@hcompany_ai)は、コンピュータ操作に特化した最新のフロンティアモデルシリーズ「Holo3」を公開しました。本モデルの重要性は、OSWorld-Verifiedベンチマークにおいて78.9%という極めて高いスコアを記録し、既...
Claude Code上でOpenAI Codexとの連携が可能に。AIエージェントの「相互検証」がもたらす開発フローの進化
Claude Code上でOpenAI Codexとの連携が可能に。AIエージェントの「相互検証」がもたらす開発フローの進化
2026年3月31日、OpenAIはAnthropicのターミナル型AIコーディングエージェント「Claude Code」内でOpenAIのCodexを直接呼び出せる公式プラグインをリリースしました。このプラグインの導入により、開発者はCl...
経済産業省、コンテンツ製作・プラットフォーム支援の公募を開始―個人クリエイターも対象に
経済産業省、コンテンツ製作・プラットフォーム支援の公募を開始―個人クリエイターも対象に
経済産業省(METI)とIP360は、コンテンツ製作およびプラットフォーム構築を対象とした支援メニューの公募を開始しました。本施策の要諦は、法人のみならず個人のクリエイターも支援対象に含まれている点にあります。締め切りは2026年4月30日...
論文が即座にコード化される時代へ:ソロ開発者がGoogleの最新アルゴリズムを7日間で再現
論文が即座にコード化される時代へ:ソロ開発者がGoogleの最新アルゴリズムを7日間で再現
Googleが発表した「追加学習なしでLLMを低メモリ化する技術」の論文を、一人の開発者がわずか7日間で実装・最適化することに成功しました。AI(Claude)を補助として活用したこの事例は、論文の公開が即座に実働コードへと変換されうる時代...
「安全性」を掲げる企業の致命的な設定ミス:Claude Code ソースコード流出の深層
「安全性」を掲げる企業の致命的な設定ミス:Claude Code ソースコード流出の深層
Anthropicが提供する開発者向けCLIツール「Claude Code」のソースコード全文が、npmレジストリの設定ミスにより外部へ流出したことが判明しました。事態の核心は、本番用パッケージにデバッグ用のソースマップファイル(.map)...
Qwen3.5-Omni:視覚・聴覚・言語を高度に統合するオムニモーダルAIの到達点
Qwen3.5-Omni:視覚・聴覚・言語を高度に統合するオムニモーダルAIの到達点
AlibabaのAI研究チーム「Qwen(Tongyi Lab)」が発表した「Qwen3.5-Omni」は、テキスト、画像、音声、動画をシームレスに処理する最新のオムニモーダルモデルです。1億時間以上の視覚・音声データによるトレーニングを経...
Appleが「バイブコーディング」アプリへの規制を強化:App Storeガイドライン抵触による排除の背景
Appleが「バイブコーディング」アプリへの規制を強化:App Storeガイドライン抵触による排除の背景
Appleが、AIを活用して直感的にプログラムを生成する「バイブコーディング」関連アプリへの取り締まりを強化しています。これは、アプリが審査を経ずに自身の動作を動的に変更することを禁じる「App Reviewガイドライン」への抵触が主な理由...
Claude CodeがPowerShellをネイティブサポート:Windows開発環境における自動化の進化
Claude CodeがPowerShellをネイティブサポート:Windows開発環境における自動化の進化
AI開発ツールであるClaude Codeが、新たにPowerShellをネイティブサポートしたことは、Windowsユーザーの開発体験を劇的に向上させる重要な転換点です。本アップデートにより、AIが直接Windowsのシステムコマンドを理...
Metaが「SAM 3.1」を公開:Object Multiplexingにより動画セグメンテーションの推論速度が7倍に向上
Metaが「SAM 3.1」を公開:Object Multiplexingにより動画セグメンテーションの推論速度が7倍に向上
Metaは、画像および動画のセグメンテーションを行う基盤モデルの最新アップデート版「SAM 3.1」を公開しました。本リリースの最大の特徴は、新技術「Object Multiplex」の導入により、精度を損なうことなく動画処理の効率を劇的に...
牧草地を支配するAI:2,000億円の評価額を得たスマート首輪「Halter」の衝撃
牧草地を支配するAI:2,000億円の評価額を得たスマート首輪「Halter」の衝撃
ニュージーランド発のスタートアップ「Halter」が、AI搭載のスマートカラー(首輪)によって牧畜業に劇的な変革をもたらしています。同社はPeter Thiel氏率いるFounders Fundから出資を受け、評価額はわずか9ヶ月で倍増の2...
「Claude Code」における自律動作と安全性の両立:新機能「auto mode」の設計思想
「Claude Code」における自律動作と安全性の両立:新機能「auto mode」の設計思想
Anthropicは、開発者向けツール「Claude Code」において、手動承認の手間を省きつつ安全性を確保する新機能「auto mode」を導入しました。従来、ユーザーは頻繁な承認要求による「承認疲労」から、セキュリティを無視して全自動...
ByteDanceが放つ次世代AIエージェント基盤「DeerFlow 2.0」:LangGraphベースの全面刷新で高度な自律性を実現
ByteDanceが放つ次世代AIエージェント基盤「DeerFlow 2.0」:LangGraphベースの全面刷新で高度な自律性を実現
ByteDanceは、AIエージェントの開発と実行を支援するオープンソースの実行基盤(ハーネス)「DeerFlow 2.0」を公開しました。本作は、調査、コーディング、コンテンツ生成といった複雑なタスクを自律的に遂行するエージェントの構築を...
Claude Codeにおける日本語入力環境の劇的改善:CUIでのIMEインライン表示に対応
Claude Codeにおける日本語入力環境の劇的改善:CUIでのIMEインライン表示に対応
エンジニア向けのコマンドラインツール「Claude Code」において、日本語利用者にとって極めて重要なアップデートが実施されました。本アップデートの核心は、ターミナル上でのネイティブカーソルがテキスト入力カレットを正確に追跡できないという...
CapCut Video Studioの登場:AI動画制作の全工程を統合する「タイムラインフリー」な新境地
CapCut Video Studioの登場:AI動画制作の全工程を統合する「タイムラインフリー」な新境地
CapCutが発表した新機能「CapCut Video Studio」は、動画制作のワークフローを一変させる可能性を秘めています。最大の特徴は、従来のタイムライン形式に縛られない「キャンバスベース」のワークスペースを採用している点です。これ...
10倍のサイズを凌駕する効率性。Appleが放つ高密度画像キャプションモデル「RubiCap」の革新性
10倍のサイズを凌駕する効率性。Appleが放つ高密度画像キャプションモデル「RubiCap」の革新性
Appleの研究チームは、既存のAIモデルよりも遥かに小規模ながら、より正確で詳細な画像説明を生成できる新モデル「RubiCap」を発表しました。従来の画像キャプション生成には、膨大なコストがかかる専門家のアノテーションや、多様性に欠ける蒸...
Google、最大3分の楽曲生成が可能な「Lyria 3 Pro」を発表。API提供によりアプリへの組み込みが可能に
Google、最大3分の楽曲生成が可能な「Lyria 3 Pro」を発表。API提供によりアプリへの組み込みが可能に
Googleは、音楽生成AIの最新モデル「Lyria 3 Pro」を発表しました。本モデルは2026年2月に登場した「Lyria 3」の高機能版であり、最大3分間のボーカル付き楽曲を生成できる点が最大の特徴です。特筆すべきは、APIを通じて...
Googleが「Q Day」への対応を2029年に前倒し:耐量子暗号(PQC)への移行を加速させる業界の羅針盤
Googleが「Q Day」への対応を2029年に前倒し:耐量子暗号(PQC)への移行を加速させる業界の羅針盤
Googleは、量子コンピューターが既存の暗号アルゴリズムを解読可能になる「Q Day」への対応期限を、当初の予想から大幅に早め、2029年に設定することを発表しました。量子技術の進展により、現行の暗号化システムが突破されるリスクが想定より...
ローカル動作でプライバシーを保護する次世代AI CRM「DenchClaw」:自然言語によるデータ操作と営業自動化の両立
ローカル動作でプライバシーを保護する次世代AI CRM「DenchClaw」:自然言語によるデータ操作と営業自動化の両立
DenchClawは、Mac上でローカル動作する無料のAI搭載型CRM(顧客管理ツール)です。顧客データをクラウドに預けるリスクを回避しつつ、AIによるデータ整理や営業作業の自動化を実現したいというニーズに応えるために開発されました。パーソ...
ジェンスン・フアン氏が語る「AGIの到達」とその定義:AIエージェントが拓く一過性の成功と真の企業構築
ジェンスン・フアン氏が語る「AGIの到達」とその定義:AIエージェントが拓く一過性の成功と真の企業構築
NVIDIAのジェンスン・フアンCEOは、ポッドキャストにおいて「汎用人工知能(AGI)はすでに実現されている」との見解を示しました。AGIの定義は「人間が可能なあらゆる知的作業を実行できるAI」とされていますが、実際には企業や識者によって...
視覚でブラウザを操る次世代AIエージェント「MolmoWeb」:HTMLに依存しない操作の革新
視覚でブラウザを操る次世代AIエージェント「MolmoWeb」:HTMLに依存しない操作の革新
アレン人工知能研究所(Ai2)が発表した「MolmoWeb」は、ブラウザを人間と同様に視覚的に捉えて操作する画期的なAIエージェントです。従来のウェブエージェントが複雑なHTML構造の解析を必要としていたのに対し、本ツールはスクリーンショッ...
Claudeに「オートメモリ機能」が実装:セッションを越えた知識の継続が可能に
Claudeに「オートメモリ機能」が実装:セッションを越えた知識の継続が可能に
AnthropicのAIアシスタント「Claude」において、新たに「オートメモリ(自動記憶)」機能のロールアウトが開始されました。この機能は、ユーザーとの対話を通じて得られたプロジェクトの背景、デバッグのパターン、好みの手法などをClau...
【速報】動画生成AI「Sora」公式アプリがサービス終了へ。今後の焦点はAPIとデータの保存へ
【速報】動画生成AI「Sora」公式アプリがサービス終了へ。今後の焦点はAPIとデータの保存へ
動画生成AIプラットフォーム「Sora」の運営チームは、Sora公式アプリの提供を終了することを発表しました。これまで同アプリを通じて形成されてきたクリエイターコミュニティに対し、深い感謝と敬意を表明しています。ユーザーにとっては大きな変化...
Claude Codeに「auto mode」が導入:AIによる自律的な権限判断が可能に
Claude Codeに「auto mode」が導入:AIによる自律的な権限判断が可能に
Claude Codeに新機能「auto mode(オートモード)」が追加されました。これは、ファイルの書き換えやBashコマンドの実行時に、AIがユーザーに代わって権限の判断を行う機能です。従来、開発者は操作のたびに手動で承認を行うか、あ...
OpenAIがデスクトップ版「スーパーアプリ」開発を本格化:ChatGPT、Codex、Atlasを統合
OpenAIがデスクトップ版「スーパーアプリ」開発を本格化:ChatGPT、Codex、Atlasを統合
OpenAIが、ChatGPT、コーディング支援のCodex、AI搭載ブラウザのAtlasを1つのプラットフォームに統合する、デスクトップ版「スーパーアプリ」の開発を進めていることが明らかになりました。この動きの背景には、複数の製品が断片化...
Sakana AI、日本仕様に最適化された試作モデル「Namazu」および「Sakana Chat」を公開
Sakana AI、日本仕様に最適化された試作モデル「Namazu」および「Sakana Chat」を公開
日本を拠点とするAI企業・Sakana AIは、海外製の高性能な大規模言語モデル(LLM)を日本国内の文脈や安全要件に適応させた試作モデルシリーズ「Namazu(α版)」、および同モデルを搭載したウェブサービス「Sakana Chat」を公...
Claudeによる「Computer Use」機能の発表:AIが自律的にPCを操作する新時代の到来
Claudeによる「Computer Use」機能の発表:AIが自律的にPCを操作する新時代の到来
Anthropicは、AIモデル「Claude」がユーザーのコンピューターを直接操作し、複雑なタスクを完遂できる新機能を発表しました。この機能により、AIはアプリケーションの起動、ブラウザのナビゲート、スプレッドシートへの入力など、人間がデ...
Googleが提唱する「vibe design _ vibe coding」の衝撃:抽象的な意図からプロダクトを生成する次世代AIツール群
Googleが提唱する「vibe design _ vibe coding」の衝撃:抽象的な意図からプロダクトを生成する次世代AIツール群
Googleは、AIツール群の刷新に伴い「vibe design(バイブ・デザイン)」および「vibe coding(バイブ・コーディング)」という新たなコンセプトを発表しました。これは、具体的な仕様を定義する前に、ビジネスの目標や「vib...
Googleの新たなデザインパートナー「Stitch」が大幅刷新:AIネイティブな制作環境の提供へ
Googleの新たなデザインパートナー「Stitch」が大幅刷新:AIネイティブな制作環境の提供へ
Googleは、デザインパートナーツール「Stitch」の最新アップデートを発表しました。今回の刷新により、Stitchは「バイブ・デザイン・パートナー(Vibe design partner)」として、制作、イテレーション、コラボレーショ...
Claude Codeの新機能「Channels」:スマホからPCを操作するAIエージェントの新たな地平
Claude Codeの新機能「Channels」:スマホからPCを操作するAIエージェントの新たな地平
AnthropicのAIコーディングツール「Claude Code」に新機能「Channels」が追加され、モバイル端末からPCセッションを遠隔操作することが可能になりました。これにより、TelegramやDiscordといったチャットプラ...
視覚的インターフェースを備えたAIエージェント管理ツール「OpenRoom」の登場:MiniMaxが目指す対話の新たな形
視覚的インターフェースを備えたAIエージェント管理ツール「OpenRoom」の登場:MiniMaxが目指す対話の新たな形
上海を拠点とするAI企業「MiniMax」は、AIエージェントを視覚的なGUIで管理できるインタラクティブツール「OpenRoom」を発表しました。従来のAIエージェント管理はテキストベースが主流でしたが、本ツールはブラウザ上で動作する豪華...
Claude Codeが外部チャット連携に対応:MCP経由でモバイル操作を可能にする「Claude Code channels」の展開
Claude Codeが外部チャット連携に対応:MCP経由でモバイル操作を可能にする「Claude Code channels」の展開
AnthropicのエンジニアリングツールであるClaude Codeに、新たなインターフェース拡張機能「Claude Code channels」が導入されました。これはModel Context Protocol(MCP)を利用し、Te...
Anthropic認定資格制度の始動:AIエコシステムにおける先行者価値の確立
Anthropic認定資格制度の始動:AIエコシステムにおける先行者価値の確立
AIスタートアップのAnthropic社が、公式認定資格制度「Claude Certified Architect Foundations」の展開を開始しました。本制度は、同社のAIモデル「Claude」を活用したシステム設計や構築能力を公...
NVIDIA、「NemoClaw」を発表。OpenClawの導入と安全な実行を1コマンドで実現
NVIDIA、「NemoClaw」を発表。OpenClawの導入と安全な実行を1コマンドで実現
NVIDIAは、カンファレンス「GTC2026」にて、新たなツール「NemoClaw」を発表しました。このツールは、OpenClawの導入プロセスを劇的に簡略化し、わずか1コマンドでのセットアップを可能にするものです。開発者にとって障壁とな...
Anthropicが「Dispatch」を発表:外出先からPC上のClaudeを遠隔操作する新機能
Anthropicが「Dispatch」を発表:外出先からPC上のClaudeを遠隔操作する新機能
Anthropicは2026年3月17日、Claude Coworkの新機能として、研究プレビュー版「Dispatch」をリリースしました。本機能の重要性は、スマートフォンを通じて外出先から自宅やオフィスのPCへ指示を出し、AIエージェント...
Obsidianが「エージェント対応」へ:AIとの高度な連携を実現するツール「obsidian-skills」が登場
Obsidianが「エージェント対応」へ:AIとの高度な連携を実現するツール「obsidian-skills」が登場
Obsidianのエコシステムにおいて、AIエージェントによる高度な操作を可能にする新しいツール「obsidian-skills」が登場しました。これは、AIに対してユーザーのノート(Vault)を直接かつ効果的に扱う方法を学習させるための...
Cloud RunへのIAP直接適用が一般提供開始:ロードバランサー不要でGoogle認証を実現
Cloud RunへのIAP直接適用が一般提供開始:ロードバランサー不要でGoogle認証を実現
Google CloudのCloud Runにおいて、Identity-Aware Proxy(IAP)を直接適用する機能が一般提供(GA)となりました。これまでCloud RunでIAPを利用するには、前面にロードバランサー(LB)を配置...
ByteDance、動画生成AI「Seedance 2.0」のグローバル展開を延期――ハリウッドとの著作権紛争が背景に
ByteDance、動画生成AI「Seedance 2.0」のグローバル展開を延期――ハリウッドとの著作権紛争が背景に
TikTokの運営元であるByteDanceが、新型動画生成AI「Seedance 2.0」のグローバルローンチを延期したことが報じられました。その主な要因は、生成されたコンテンツがハリウッド俳優や既存の知的財産権を侵害しているとして、エン...