超臨場感テレワークを実現する技術:任意エリア収音技術

印刷用表示 |テキストサイズ 小 |中 |大 |

任意エリア収音技術

オフィスでは,通常様々な場所で同時に音が発生しています.そのため,あるエリアの音を収音する場合,マイクロホンをエリアの中心や近くに配置するだけでは,エリア以外の音も収音してしまいます.
任意エリア収音技術は,広いオフィスの中で,あるエリアの音だけを収音できるようにする技術です.この収音技術により,例えば,利用イメージにあるような「手元にあるコミュニケーション端末を操作すると,だんだんと上司の姿が大きくなり,話し声も明瞭に聞こえるようになってくる.」ということが実現できます.またこの技術を応用すると,エリア毎に収音した音を前後左右方向の音として再構成し,スピーカーから再生することで,遠隔地と同じ場所にいるかのような感覚を実現することができます.

エリア収音における課題

ある特定方向の音を収音する手段として,マイクロホンアレイがあります.マイクロホンアレイは,複数の全指向性のマイクロホンから構成され,ビームフォーマにより指向性を形成します.ビームフォーマとは,各マイクロホンに到達する音の時間差を利用し,指向性を形成する手法です[1][2].ビームフォーマにより形成される指向性は,マイクロホンの配置により上下方向や左右方向に自由に指向性を向けることができます.そのため,収音したいエリア(目的エリア)を任意に変更することができます.
しかし,図1に示すように,目的エリアの周囲に雑音源が存在する場合,マイクロホンアレイを用いても,目的エリア方向の雑音は抑圧できないという問題が残ります.

指向性を目的エリアに向けたときのイメージ
図1 指向性を目的エリアに向けたときのイメージ

任意エリア収音方式

この問題に対し,複数のマイクロホンアレイを使用することで,目的エリア音のみを強調できる収音方式(Multiple Beam-forming Area Sound Enhancement; MUBASE)を開発しました.
MUBASEでは,まず複数のマイクロホンアレイをオフィス内の任意の場所に設置し,それぞれビームフォーマにより目的エリア方向へ指向性を形成します.この状態では,各マイクロホンアレイのビームフォーマの指向性に目的エリア音だけでなく,目的エリア音方向の雑音も含まれてしまいます(図2左図).しかし音声には,周波数領域に成分がまばらにしか存在しないという性質があります.そのため複数の音声が同時に存在しても,周波数領域で音声成分が重なる確率は低くなります.従って,各マイクロホンアレイのビームフォーマ出力を周波数領域で比較すると,目的エリア音成分はどちらの出力にも含まれますが,雑音成分はマイクロホンアレイ毎に異なることになります(図2右図).この特性を利用し,各マイクロホンアレイのビームフォーマ出力に共通に含まれている成分を目的エリア音成分,それ以外を雑音成分と推定し,雑音成分を抑圧することで,目的エリア音を強調します.
MUBASEは,目的エリアとマイクロホンアレイの距離に依存しないため,マイクロホンアレイをオフィス内に自由に設置できることも特徴の1つです.

各マイクロホンアレイのビームフォーマ後の振幅スペクトル
図2 各マイクロホンアレイのビームフォーマ後の振幅スペクトル

以下の音声ファイルは,実際に実験室で収音したデータをビームフォーマとMUBASEで処理したものです.女性の声が目的エリア音,2人の男性の声が雑音となります.音声1では,3人すべての音声が聞こえます.音声2では,ビームフォーマの指向性に含まれていない男性の声は消えていますが,指向性に含まれる男性の声はまだ残っています.音声3では,残っていた男性の声も消え,女性の声のみ聞こえます.
このようにMUBASEを用いると,目的エリアの周囲に雑音が存在していても,目的エリアの音のみ収音することができます.
音声1
マイクロホンで収音した音声(無処理)
音声2
ビームフォーマによるエリア収音
音声3
MUBASEによるエリア収音

参考文献
[1] 浅野,“音のアレイ信号処理”,コロナ社,2011
[2] 矢頭,森戸,山田,小川,“正方形マイクロホンアレイによる音源分離技術”,情報処理51(11),2011

メール配信タイミング制御技術
オフィスワークへの集中を邪魔しないタイミングでメールの着信を通知します.

擬音語・擬態語を用いた状況提示技術
過去から現在までの出来事を、漏らさず短時間で把握できるようになります.

超低演算量映像符号化技術
一般の符号化方式と比較して,1/2 ~ 1/10 の演算量で圧縮符号化ができる技術です.

超臨場感テレワークシステムの心理学的評価
超臨場感テレワークシステムを、感性心理学的に評価できるようにします.

実用空間共有技術
隣にいるような感覚で,共通の作業オブジェクトを見ながら協調作業できるようになります.

ハイパーインフォメーションターミナル
オフィスの様々な情報を容易に表示して共有することができるようになります.

擬音語・擬態語変換技術
オフィス内の音や人の動きを,瞬時に理解できるようになります.

割り込み拒否度推定技術
互いの仕事を邪魔することなく,必要なコミュニケーションを取ることができるうになります.

任意エリア収音技術
広いオフィスの中で,あるエリアの音だけを収音できるようになります.