現在はスマートフォン上で音を処理しています

聞きたくない音だけ消せるAIノイキャン技術「セマンティックヒアリング」が開発中

Image:University of Washington

街の騒音やカフェの話し声を遮断して音楽に集中できるノイズキャンセリング技術は、今やそれほど珍しい機能ではなくなった。だが、その騒音の中で効きたい特定の音がある場合はどうすれば良いのだろうか。

ワシントン大学の研究者らはこうしたニーズを満たすべく、ディープラーニングアルゴリズムにより、リスナーが聞き逃したくない特定の音だけを耳に入れる「セマンティック・ヒアリングシステム」を開発している。

このシステムは、ワイヤレスで接続されたノイズキャンセリングヘッドホンの環境音用マイクが拾った音声から特定の音だけを通す、またはその逆で特定の酒類の音だけを遮断し、ほかはすべて通すことができる。現在のところ、このシステムは20種類の音を選択的に透過または遮断できるという。

まだ開発途上であるため、選択的に音を通すこの機能の処理はスマートフォン上で行われている。これは将来的にはヘッドホン側で行われるようになるが、現在のヘッドホンやイヤホン、またはクラウドサーバーを利用するにしても、十分や処理能力や応答速度が得られないためだ。

この研究論文の上級著者であるShyam Gollakota教授は「鳥の鳴き声のような音を理解し、環境音から抽出するには、今日のノイズキャンセリングヘッドホンではまだ不可能なリアルタイムの情報処理能力が必要です。特に課題となるのはヘッドホンの使用者が聞く音が、彼らの目に見えているものと同期している必要があることです。たとえば、誰かが話したように見えた2秒後に、その声が聞こえるようではいけません。これは、AIアルゴリズムが1/100秒未満で音を処理する必要があるということです」と述べた。

実験では22人のボランティアの協力を得て、公園や街の通り、オフィスなどでこのセマンティックヒアリングシステムを試した。そして、それぞれの場所でたとえば鳥のさえずり声、信号の警報音、サイレンと言った特定の音を目論見どおりに透過させることができた。ただし、人の話し声と周囲に流れる音楽など、似通った成分を持つ音を意図したとおりに区別するのは難しいようだ。

関連キーワード: