人工知能と動画圧縮

人工知能の技術と動画圧縮の技術は共通点がある。
行列計算だ。
うちは、セル構造型コンピュータチップ設計という、十数年前に一度話題になった並列処理に用いられるプロセッサ設計、いわゆる大容量データ高速演算技術で生計を立てているのだが、これは元来スーパーコンピューターの為に作られたチップ設計になる。
この大容量データ高速演算技術を基に作ったのが弊社の高速エンコーダですが、ラインエンコードでエンコード処理遅延はマイクロ秒レベルで世界的にぶっちぎりに早いのが特徴だ。
数年前に、自分もプロセッサ設計の会社がやりたいなと思い、今のうちの開発者から動画圧縮について教わった時に、動画圧縮は現在のフレームと過去のフレームから違いを見つけることだと聞いた。
その時に思ったことが、
「画像圧縮は大量のデータの差分を取るのが主な処理ならば、行列計算がプロセッサのメインだということか」
だった。
動画圧縮の為のパターン解析は差分を取ることがメインの計算になるので、行列計算は必須になる。
だから、高速・行列演算処理が必要な人工知能のアクセラレータ設計は、GPU設計会社が行っているということになるのだろう。
うちでも人工知能のアクセラレータチップを現在開発中だが、そもそもレバトロンのコーデックには人工知能の機能が一部組み込まれている。
うちのエンコーダは美的表現よりも処理速度を優先する為、ワンタイムパスで、そこそこの画質を維持しながら圧縮率をなるべく下げることができるので、ビットレートと画質のバランスが良いほうだと評価して頂いている。
一般的には、そこそこの画質を維持しながらビットレートを下げるにはマルチパスエンコードで、動画を分析したうえで何度かエンコードを行なうケースが多い。
入力されて来る映像のタイプを瞬時に判断して、画質とビットレートのトレードオフ関係のバランスが良いモードを選び、処理時間内に収まるように人工知能(スマートプログラムというべきか?)が管理している。
コーデック・チップに人工知能の機能を一部組み込んでいる。
人工知能が処理時間を計って処理を掛けているので、遅延時間は一定に保たれたままだ。処理時間も今のところは世界最速。
符号化処理の時間が不安定になりがちな処理時間を安定させ、遠隔操作に最適な一定時間で低遅延動画伝送できる弊社のシステムを、自動車メーカーが、研究用途で遠隔運転や自動運転のテストに導入してくれている。
人工知能と相性の良い動画処理を組み合わせた結果である。
BY 浅田麻衣子
スポンサーサイト