目次

自動運転とは

自動運転(無人運転)とは、人間が運転操作を行わなくとも、AIにより自動車が自動で走行できることを示します。テスラの自動運転車やグーグルのウェイモのようなプロジェクトの台頭と共に、自律走行車業界は年々成長を続けているように思われます。自律走行車はコンピュータービジョンの一分野であり、コンピュータービジョンを様々に活用することによって高い収益を生み出せる可能性があります。

現在の自動運転の技術レベル

「自動運転」という言葉を耳にすると、多くの方は、車に誰も乗車されていない状態、または人間が乗車していても、スマホをいじったり寝ていたり、運転操作は全く行わなくて良い状況を想像するでしょう。それは理想の自動運転かもしれませんが、現実的にまだ達していません。現在の日本では、AIによる自動的なブレーキやハンドル操作が行われる車は販売されておりますが、運転操作の主体はまだ人間の運転手です。このような自動車は「自動運転車」ではなく「運転支援者」と呼ばれています。

自動運転AIについては、SAE(Society of Automotive Engineers)という団体が定めた「SAE J3016」によってレベル分けがされています。

レベル 名称 主体者 走行エリア ルール
0 運転自動化なし 運転手 運転手がすべてのタスクを担当
1 運転支援 運転手 限定的 速度かハンドルを運転手が対応
2 部分運転自動化 運転手 限定的 常時運転手がシステムを監督
3 条件付き運転自動化 限定的 緊急時は運転手が対応
4 高度運転自動化 限定的 運転手なしでの走行OK
5 完全運転自動化 限定なし 運転手なしでの走行OK

自動運転AIの最新技術

自動運転AIは現在、運転手無しで走行できるレベルを達していませんが、研究開発は進化しています。例えば、YOLO(You Only Look Once)というアルゴリズムは2016年に発表され、領域判定(物体があるらしい領域を提案)と対象分類(物体が度のクラスに分類できるか)を同時に行うことで、物体認識処理を高速化しました。YOLO以前のアルゴリズムは、バウンディングボックスを使い、それぞれに含まれる対象のクラス分類を行っていたため、バウンディングボックスの数が多いと認識に時間がかかってしまいました。

自動運転AIの未来

自動運転AIは、各国の自動車大手やIT企業の多くが取り組んでいます。米国では、Googleの兄弟会社Waymoが代表的で、2018年末、世界初の自動運転による配車サービス「waymo one」を発表しました。中国では、2015年に政府が発表した「中国製造2025」でも、自動運転の目標が含まれており、2013年に自動運転レベル4〜5の砕砂搭載率を10%とすることです。

日本では、トヨタ自動車が2016年よりモビリティサービス・プラットフォーム(MSPF)を提唱し、国内外のテクノロジー企業と協業を進めています。2018年10月には、トヨタ自動車あとソフトバンクの共同出資会社MONET Technologies(モネ・テクノロジーズ)が設立されました。翌年の2019年2月に、本の社会課題の解決や新たな価値創造を可能にするモビリティサービスの実現と普及に向け、事業開始されました。

自動運転向けの画像、映像アノテーション

あらゆるAIアルゴリズムと同様、自動運転AIの開発にかかせないのが、画像及び動画(画像フレーム)のアノテーションです。しかし、大量かつ高品質の画像を取得したり、信頼できる映像アノテーションサービスを見つけたりするのは困難であることが多いのです。数千件もの画像に自分で手作業でタグ付けするのは大変手間が掛かってしまいます。

当社の画像アノテーションサービスは、20年以上に渡り、AI学習データ周りのサービスを提供してきたノウハウを持ち、大量の学習データ(教師データ)のアノテーションも素早く、正確に提供いたします。自動運転車における、物体検出用のバウンディングボックスアノテーションや、シーン理解用のセマンティックセグメンテーションなど、幅広い画像アノテーション機能が揃っています。

自動運転開発に使える車のデータセット

自動運転の研究開発に役立つ車のビッグデータを含む、データセットを9件まとめました。これらのデータセットには25万枚の画像や静止画像が含まれていて、既にタグ付けが行われているものもあります。

都市の景観の画像ペア: 運転中の車からドイツの通りを撮影した動画を使用。2,975件の画像のペアが含まれるデータセットで、各画像ファイルは左側にオリジナルの静止画像、右側に意味的アノテーションを施した同じ画像が並べられている。

GTI車両画像データベース: 道路上の車両を後方から撮影した画像3,425件と、車両が含まれない道路の画像3,900件から成るデータセット。

KITTIバウンディングボックス付きオブジェクト検出: カールスルーエ工科大学のベンチマークスイートのオブジェクト検出セクションから14,000件以上の画像を取得して作成。テスト画像7,518件とバウンディングボックスのラベルが別個のファイルに含まれるトレーニング画像7,481件から構成される。

LISA信号機データセット: 車を対象としたデータセットではないが、自律走行車アルゴリズムの学習で非常に役立つ画像データセット。夜間と日中の動画の静止画像がトータルで43,007件含まれ、113,888個の信号機がタグ付けされている。信号機に焦点を置いたデータセットであるが、ほぼ全ての画像に信号機と車両が含まれる。

ネパールの車両: カトマンズの通りで撮影された30件の動画から切り取った4,800台の車両画像から成る。4,800件の画像のうち1,811件は二輪車、2,989件は四輪車である。

悪天候における交通監視: それぞれ5分ほどの長さの動画22本から構成されたデータセット。RGBカラーカメラと赤外線サーマルカメラの両方を利用して撮影されているので、130,000件のRGB画像とサーマル画像のペアが含まれる。

スタンフォード車両データセット: スタンフォードAI研究所から取得したデータセット。196種類の車両の画像16,185件が含まれる。

自動運転車の開発に利用できるセマンティックセグメンテーション: Lyft Udacityチャレンジの一環として作成されたデータセット。5,000件の画像にセマンティックセグメンテーションがタグ付けされている。

TME(トヨタ・モーター・ヨーロッパ)高速道路データセット: 27分の動画に相当する28件のビデオクリップで構成されたデータセット。30,000件の画像が含まれ、車両がタグ付けされている。

自動運転向けの画像データをお探しですか?

お探しの自動車データセットが見つからない場合は、当社が作成いたします。顧客中心のアプローチを用い、学習データの作成や評価・検証サービスの提供を行っています。貴社のAIプロジェクトに最適な教師データを作成するため、プロジェクトの目的やニーズ、そして予算を十分理解するよう心がけますので、ぜひ無料トライアルでお試しください。

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中