japan

東芝トップページ > 企業情報 > 研究開発・技術 > 研究開発センター > 研究開発ライブラリ > 市販の単眼カメラでステレオカメラ並みに高精度な距離計測を実現する立体認識AIを開発−ディープラーニングを活用して高精度、省コスト、省スペースな距離測定を実現。ロボットピッキング、無人配送車の自律移動、ドローン遠隔操作によるインフラ点検などに活用−

知能化システム

市販の単眼カメラでステレオカメラ並みに高精度な距離計測を実現する立体認識AIを開発
−ディープラーニングを活用して高精度、省コスト、省スペースな距離測定を実現。
ロボットピッキング、無人配送車の自律移動、ドローン遠隔操作によるインフラ点検などに活用−

2019年10月25日
株式会社東芝

当社は、レンズによって生じる画像のぼけをディープラーニングで解析することで、市販のカメラで撮影した1枚の画像からステレオカメラ(注1)並みに高精度な距離計測を実現する立体認識AIを開発しました。ステレオカメラを必要としないため、コストとスペースの削減が可能となります。
当社は本AIの成果を、2019年10月30日 10:00から韓国で開催される International Conference on Computer Vision(ICCV2019)で発表します。

近年、ロボットによる物品のピックアップや工場内の無人搬送車の自律移動、ドローンの遠隔操作によるインフラ点検など、さまざまな分野で画像センシングの重要性が増しています。これらの用途では、被写体の画像を撮影するだけでなく、小型装置での、形状や距離情報などの3次元情報の把握が求められています。このようなニーズに対して、小型化に適した単眼カメラを使用した計測技術の開発に注目が集まっており、ディープラーニングによって被写体の形状や背景などの風景情報を学習し、距離を推定する単眼カメラ距離推定技術の研究が活発化しています。
しかし、単眼カメラによる距離推定技術の精度は学習した風景情報に依存するため、学習した風景情報と異なる背景で撮影すると精度が著しく低下する欠点があります。当社は2色のカラーフィルタをレンズに挿し、被写体までの距離に応じて生じる画像ぼけの色と大きさを分析することで、風景情報に依存せずに距離を推定するカラー開口撮影技術を開発(注2、3、4)しましたが、既存レンズの改造に伴うコストと手間が課題となっていました(図1)。

そこで当社は、ディープラーニングを活用してレンズ上の位置によって画像がどのようにぼけているか(ぼけの形状)を解析することで、通常の単眼カメラのみで、風景情報にも依存せずステレオカメラ並みの高精度な距離計測を実現する立体認識AIを開発しました(図2)。
これまでは、理論的にはピント位置から等距離であれば遠近どちらのポイントでもぼけの形状が等しくなるため、ぼけの形状から距離を計測することは難しいと考えられてきました(図3)。ところが、実際にぼけの形状を分析してみると、ピント位置から等距離であっても遠近それぞれのポイントでぼけの形状に大きな違いがあることが分かりました(図4)。そこで、深層ニューラルネットワークモデルを学習するディープラーニングによって、撮影した画像からぼけの情報を解析することに成功しました。
ぼけの形状は、光が通ったレンズ内の位置と光の波長によって変化することが分かっています。開発したネットワークは、ぼけの形状の変化を適切に捉えられるように位置と色情報を個別に処理し、アテンションと呼ばれる重み付け機構を経て、輝度勾配のどの部分に重点を置けば正しく距離が計測できるのかを制御するために活用されます(図5)。学習の過程で、予測した距離と実際の距離の誤差を小さくするようにネットワークを更新します。
当社は本AIを活用した結果、市販カメラの一枚の撮影画像からステレオカメラに匹敵する高精度な距離計測を実現できることを確認しました。

今後、市販されているカメラとレンズで汎用性の確認と画像処理の高速化を進め、2020年度を目指して社会実装を進めていきます。

図1:3次元計測における位置づけ

図2:提案技術の概要

図3:これまでの常識

図4:原理

図5:開発したニューラルネットワーク

図6:距離画像の例

(注1)対象物を複数の異なる方向から同時に撮影することにより、その奥行き方向の情報も記録できるようにしたカメラ。通常は、1台で両眼視差を再現し、立体的な空間把握のできる立体写真の撮影が可能になっているものをさす。

(注2)森内、三島、“カラー開口を用いたDFD技術”, 第22回画像センシングシンポジウム, IS1-34, 2016

(注3)三島、佐々木、“単眼カメラで撮影した1枚の画像から精度良く距離計測できるカラー開口撮像技術”、東芝レビュー、73巻1号、2018

(注4)N. Mishima et al., "Physical Cue based Depth-Sensing by Color Coding with Deaberration Network", 30th British Machine Vision Conference, 2019


  • 「研究開発センター」のトップへ
  • このページのトップへ