Windows 10のサポート終了を話題にしたので、Windows 11を調べてみた。MicrosoftはWindows 11のAI化によりOSのメディア化を目指しているのだそうだ。その中心に据えられたのは「Copilot」だという。
1980年代にマウスとGUIが登場して以来、PCとの対話は視覚と手が中心だった。だが、Windows 11では「Hey, Copilot」と呼びかけるだけで、音声対話による操作が可能になったらしい。私のデスクトップにはマイクが付いていないので知らなかった。
この「Copilot Voice」は単なる音声コマンド機能ではないという。AIによる文脈理解が加わることで、ユーザーの指示を会話的に処理し、アプリ間を横断するような動作も柔軟に実行するらしい。
Microsoftの調査では、音声を利用したユーザーはテキスト入力よりも2倍の頻度でCopilotを使用しているとされ、PC利用のインターフェースが変わっていくのかもしれない。個人的にも、Macを使って書く、この原稿は音声入力だ。
ユーザーは「Hey, Copilot」と声をかけるだけで、システム全体を音声で操作できる。AIは画面の内容をリアルタイムに解析し、文書の要約、ゲーム中のヒント、動画のシーン解釈などを行う。つまり、これまで静的な道具だったPCが、ユーザーの履歴や好みに基づいて作業をリードするような存在へ進化させるのが、Microsoftのビジョンのようだ。
「Copilot Vision」というものもあるようだ。AIが画面上の映像やドキュメントを視覚的に認識し、コメントや提案を返してくれるらしい。これは単に効率化のための機能ではなく、AIがリアルタイムで、作業を認識して、解釈を行い、提案するというUXが実現するのかもしれない。これについては、どこまで実用的か使ってみないと分からない。
ユーザーの作業中の行動を逐次解析し、AIが最適なコンテンツ表示や提案を行うことが、当たり前になるなら素晴らしい。
Copilotがユーザーの操作履歴を「Recall」機能で記憶し、過去の作業文脈を呼び出せるようになると、Microsoftは言っている。こうなると、PCは単なる道具ではなく、ユーザーを理解して導く存在なるのかもしれない。
このAI統合型OSは、コンテンツにも影響を及ぼす。たとえばゲームや動画再生中にCopilotが映像内要素を解析し、登場したブランドやアイテムを即座に識別・提示するかもしれない。これはインタラクティブ広告やショッパブル・コンテンツを新たな水準に引き上げる。
コンテンツが即座に購買行動と接続される構造は、コンテンツやストリーミングサービスにとっても大きな転換点になる可能性を秘めている。
このようなことが、Windows 11のAI化で実現するなら、単なる機能追加ではなく、OSそのものをメディアとして再定義する試みだ。うまく行けばだが。
それでも、GUIの大幅変更は必要ないはずだが、Windows 11のGUIの使いにくさは、理解できない。音声に任せるなら、GUIは同じでも良かったはずだ。