超臨場感テレワークを実現する技術:超低演算量映像符号化技術

印刷用表示 |テキストサイズ 小 |中 |大 |

超低演算量映像符号化技術

 近年,携帯電話,スマートフォン,タブレット端末などのモバイル端末が急激に普及しています.またモバイル通信回線が高速になったこともあり,YouTubeなどの映像の閲覧をモバイル端末で行うだけでなく,Facetimeなどのテレビ電話サービスや,Facebookなどへの映像のアップロードなども行われるようになっています.
 映像を送信するには,データサイズをコンパクトにする”圧縮符号化処理”をする必要があります.現在,動画像符号化の主流となっているH.264/MPEG-4 AVC[1]などは,フレーム間符号化(過去の画像との差分を符号化)の際に行う動き補償技術により高い圧縮率を実現していますが,演算量が多いことで知られています.このためモバイル端末のようにバッテリーで動作する機器で長時間動作させるのは困難でした.
 「Distributed Video Coding[2] (以下,DVC)」は,現在主流の符号化方式と比較して,1/2~1/10の演算量で圧縮符号化ができる技術です.外出先でもモバイル端末のバッテリー切れを心配することなくテレビ電話などの映像コミュニケーションを可能にします.

DVCの基本方式

DVCの特徴は,誤り訂正符号(Turbo符号,LDPC符号など)を用いているところにあります(図1).送信側では,映像をkey frameとnon-key frameに分け,key frameは従来から利用されているJPEGなどの静止画用符号化を行います.non-key frameは,LDPC符号などの誤り訂正符号化を行い,訂正用のパリティビットを送ります.一方受信側では,non-key frameの画像を予め予測し,その予測画像と送られてきたパリティビットを用いて予測誤りを訂正します.一般の動画像符号化と異なり,多くの演算が必要な動き補償を符号化側で行わない上,非常に少ない演算量で処理できる誤り訂正符号化を利用しているため,全体として大幅に少ない演算量で動画像の圧縮符号化を実現します.

DVCno.png
図1 DVCの基本方式

従来のDVC方式の課題

しかし,DVCの基本方式には以下の課題があります.
① 予測画像を生成するのは受信側であるため,訂正に必要なパリティビットの量は受信側でしかわからない.受信側から送信側に必要量を伝えると,遅延を発生してしまうため,現実的ではない.
② 誤り訂正符号化は少ない演算量で可能であるが,復号は多くの演算量が必要である.
 これらの課題から,リアルタイムシステムの実現が困難でした.

リアルタイム通信を可能とするDVC方式

 このような課題に対して,以下のように解決しました.
① DVCの圧縮符号化処理が軽量であるという特徴を損なわない範囲で,簡易的な予測画像生成および必要となるパリティビット量予測を行いました.これにより,受信側からの情報が不要となり,遅延を生じることはありません.
② 復号処理を並列化することで解決しました.画像を複数の領域に分割し,分割した単位でLDPC復号ができるような仕組みを採用しました.
 以上のことより,DVC方式のリアルタイムシステムへの適用が可能となりました.

DVC 5視点ネットワークカメラ

 超臨場感テレワークでの応用を想定して,本技術を利用した5視点一体型ネットワークカメラを開発しました(図2).一般的な動画像符号化方式を用いると大型化するという問題がありましたが,演算量の少ないDVC方式を採用しているため,1個のFPGAで5視点のFullHD映像(1920x1080) 30フレーム/秒を同時に圧縮符号化処理することが可能になり,小型・可搬型の5視点一体型ネットワークカメラを実現することができました.多視点ディスプレイと組み合わせて利用することで,両眼視差に加え運動視差を再現する対面型コミュニケーション環境を実現します.

nettowa-kukamera.png
図2 5視点一体型ネットワークカメラ

参考文献
[1] ISO/IEC 14496-10:2005, Advanced Video Coding(Third edition), December, 2005
[2]B.Girod, et al. “Distributed video coding,” Proceedings of the IEEE, Special Issue on video Coding and Delivery, vol.93, no.1, pp.71-83, January 2005. Invited paper.

メール配信タイミング制御技術
オフィスワークへの集中を邪魔しないタイミングでメールの着信を通知します.

擬音語・擬態語を用いた状況提示技術
過去から現在までの出来事を、漏らさず短時間で把握できるようになります.

超低演算量映像符号化技術
一般の符号化方式と比較して,1/2 ~ 1/10 の演算量で圧縮符号化ができる技術です.

超臨場感テレワークシステムの心理学的評価
超臨場感テレワークシステムを、感性心理学的に評価できるようにします.

実用空間共有技術
隣にいるような感覚で,共通の作業オブジェクトを見ながら協調作業できるようになります.

ハイパーインフォメーションターミナル
オフィスの様々な情報を容易に表示して共有することができるようになります.

擬音語・擬態語変換技術
オフィス内の音や人の動きを,瞬時に理解できるようになります.

割り込み拒否度推定技術
互いの仕事を邪魔することなく,必要なコミュニケーションを取ることができるうになります.

任意エリア収音技術
広いオフィスの中で,あるエリアの音だけを収音できるようになります.