学校の試験で

見ているものが何かを教えてくれるカメラ内蔵AIイヤホン「VueBuds」

Munenori Taniguchi

Image:University of Washington

AI搭載のスマートグラス、たとえば「Ray-Ban Meta」は、フレーム部分に内蔵するカメラ映像をAIが認識し、たとえば目の前にある食べ物の栄養を調べ、食べた分のカロリーを推定したりすることが可能だ。またAI機能の操作は音声を通じて行うことができる。

しかしスマートグラスは内蔵カメラを悪用した盗撮被害がいくつも報告されており、最近は少し印象がよろしくない。また、単純に目が悪くもないのにメガネを掛けることに抵抗がある人もいるだろう。

そんな状況に対し、ワシントン大学の研究者らは、別の角度からAIウェアラブルを研究している。彼らが開発する「VueBuds」は、外見的には完全ワイヤレスイヤホンだが、左右両方のユニットにカメラを内蔵し、ユーザーが見ている物に関するあらゆる質問に答えるAIイヤホンだ。

たとえば、VueBudsを装着して道を歩いていて(最近のスマートグラスもそれほど目立たないが)、外国語で書かれた店の名前の看板を見かけたときに、その名前の意味を尋ねたりできる。

プロトタイプのVueBudsはソニーWF-1000XM3イヤホンをベースとしており、その内部に押し込んだ小型カメラと、内蔵の視覚言語モデル(VLM)を用いてユーザーからの音声による質問に回答できる。

目立たない上にカメラを内蔵していれば、結局は盗撮に使われるのではないかと思う人もいるかもしれないが、VueBudsの内蔵カメラは、完全ワイヤレスイヤホンの低容量なバッテリーで駆動させるため、米粒ほどの極小サイズでモノクロ、最小限の解像度・画質しか備えていない。また、使われていないときはやはりバッテリー消費を抑えるため、自動的に電源が切れるようになっている。

それでも、研究者らによれば90人のユーザーを対象とした17種類の視覚的な質疑応答テストにおいて、VueBudsは「Ray-Ban Metaと同等の応答品質」を達成したと主張している。

VueBudsの紹介動画では、ユーザーが目の前に見えるものについての説明をAIに求めている。質問から約1秒ほどたつと、AI音声で「窓からたくさんの光が差し込むキッチンエリアが見えます。カウンターの上にはボトルと本が置いてあります。窓にはブラインドがあり、左側にシンクがあります」との回答が返されている。

さらに、テーブルにあるLP盤のアナログレコードのジャケットを見ると「ビートルズの『アビー・ロード』のようです」と返している。研究者によると、16人のボランティアによるテストでは、VueBudsは物体の識別と翻訳で約83%、本のタイトルと著者の識別で93%の正答率を示したという。この機能がさらに進化すれば、手に持った外国語のマンガや雑誌、書籍をAIで翻訳して読み上げてもらうことも可能になるとのことだ。

ただ、そのような進化には内蔵カメラの高画質・高解像度が必要になり、そうなると前述の盗撮の問題が首をもたげてくる。VueBudsの現行バージョンも、公共の安全に対する潜在的な脅威ではないという確証をほとんど提供していない。

AIウェアラブルには大きな可能性があるが、同時にこのようなプライバシーに対する脅威になり得るというリスクを回避するため、何らかの対策が必要になるだろう。それがクリアになり、規制当局からのお墨付きが得られるようになれば、人々の生活はいまより少し便利になるかもしれない。

関連キーワード: