
目次
新元号「令和」の時代に突入しましたが、「令和」時代には機械学習とAIイノベーションに何が起こるのでしょうか。今回はデータサイエンティストの五つの予想をお届けします。
「令和」時代は商業AIが世界的に広まる
ここ数年存在していたAIサービスや技術が「新しもの好き向けの段階」から「誰もが使用する段階」に変化するでしょう。AIもインターネットやWi-Fiのようにユーティリティとして広く認識されるようになるのを目に当たりにするはずです。
AIは携帯電話やスマートフォン、スマートフォンアプリの標準機能となるでしょう。 今お使いのiPhoneはすでに顔認証AIやSiri、位置情報サービスといったいくつかの機能でAIや機械学習を使用するようにプログラムされています。 今年は簡易モバイル動画ソーシャルアプリのTikTokのようなAI消費者ベースのアプリ新時代の幕開けの年となりました。
車向けの音声アシスタント
Siri、Alexa、CortanaといったAIアシスタントが車でも利用できるようになります。家庭用音声アシスタントは昨年からすでに消費者の間に普及しています。世間一般の人々は自然言語処理については知らないかもしれませんが、少なくともSiriやAlexaについては聞いたことがあるはずです。
「令和」時代には音声アシスタントを搭載した新型車が登場します。 トヨタ自動車はトヨタやレクサスの新型モデルへのAmazon Alexaの搭載を始めています。BMW、メルセデスベンツ、 フォードも最新モデルに音声アシスタントを搭載し始めています。今後はスマートフォンに向かってささやかなくとも、Alexaに方向や駐車場に関する情報を尋ねることができるようになります。ありがたいことに、データサイエンティストは車載音声アシスタントがすでに家庭で使用している音声アシスタントと同期化できるように設計を行っています。
小規模な経済の混乱が予測されている
自動化によって一夜にして大量の失業者が発生するということはありません。ですが仮に10~20パーセントの仕事が自動化で失われるとしても、求人市場や一般経済に混乱を引き起こすには十分です。例えば車の運転で生計を立てている労働者の数は多いですが、この人々は自動化によって現在の職を失う最初の一団となるのではないでしょうか。
AI開発が進むにつれて、企業は技術を利用した作業自動化のメリットとデメリットについて考える必要が出てきます。自動化の最も明らかな利点はコストを削減できることです。多くの業界で、人間を雇用し管理するコストは技術を実装・維持するコストをすぐに上回ることになるでしょう
しかし、ある種の業界では自動化は非倫理的なものとなり得るという危険が残っています。例えば医療分野におけるAI開発はかなり進歩していますが、がん患者を診断するアルゴリズムの結果についてはまだ人間がダブルチェックを行う必要があります。 法分野でも同様に、機械学習アルゴリズムを使用して裁判の結果を予測したり、刑事被告人への実刑判決を決定するのに役立てる弁護士や裁判官もいますが、このようなアルゴリズムは弁護士や裁判官にとって代わるには程遠いものです。
機械学習が多くの業界に行き渡る
下記のように、多くの業界でさまざまな業種の幅広い作業を自動化するのに人工知能が用いられています。
- 金融と銀行: アクセンチュア調査レポートによると、平成10年以降フォーチュン500の企業の半数以上が倒産し、AIがこの混乱を新たな段階に進化させました。さらに同レポートでは、金融機関がAIに十分投資すれば、ITオペレーションで20~25パーセントのコスト削減が期待できると示唆しています。例えば金融詐欺の検出システムは複雑なルールに大きく依存していましたが、機械学習システムでは通常と異なる動きを迅速かつ正確に検知してセキュリティチームに警告することができます。AIは場所や取引の異常を特定し、顧客の事業所を確認して、国境を越えた要注意の動きを警告することができるのです。
- Eコマース: チャットボットはオンラインショップ等のウェブサイトに導入することや、FacebookメッセンジャーやTwitterやInstagramのダイレクトメッセージのようなサードパーティーのメッセージプラットフォーム経由で実装することができます。チャットボットによって企業はカスタマーサービスの自動化が可能となります。若い顧客向けの企業では、チャットボットによって顧客の満足度が向上する傾向があります。ミレニアル世代の60%がチャットボットを使用したことがあり、そのうち70%が有益な体験であると報告しています。
- ジャーナリズム: AIがニュース編集室で最も役立つツールの一つだということが証明されつつあり、データ主導型の記事が活発化して調査記事が増加してきています。一例として、ワシントン・ポスト紙は下院選や知事選の投票日の報道にロボット記者のへリオグラフを使用しました。実のところ、へリオグラフは一年間に850件の記事を掲載するのに利用されました。
高品質な大規模データセットが公開される
最後の一つは予想というよりも願望です。AI学習データの不足は開発の大きな妨げとなっています。データサイエンティストは機械学習アルゴリズムを学習させるのに大量の高品質なAI学習データを必要とします。一般に学習データの質と量が向上すると、アルゴリズムの性能はより高速で高精度なものとなります。
データサイエンティストのデータ不足の一因として、データ収集に投資する大企業がそのデータセットを公開しない場合が多いということがあります。こういった企業はプライバシーに関する懸念や競合他社に負けることへの恐れからデータを囲い込んでいるのです。例えば、FacebookやTwitterなどのソーシャルメディア(SNS)の多くは、アーカイブした投稿の共有を禁止する開発者ポリシーを発表しています。
当社はこのような企業が自社のデータセットを公開し、誰もがそれを使用して機械学習技術を構築し、改良できるようになることを期待しています。データサイエンティストは、データそのものだけで企業が他社より優位に立つことなどできない、と即座に指摘するでしょう。さしあたっては機械学習に使えるソーシャルメディアデータセットやオープンデータセットののまとめ記事をご覧ください。
データサイエンティストにとって高品質なデータセットを大量に構築するのは時間のかかるつらい作業でした。しかし、今ではクラウド技術の出現によって、この作業はずっと容易なものとなっています。当社は最近の技術の進歩を利用してAI学習データを提供しています。AI学習データはまずは人間の手で準備しなければなりません。当社は世界の主要なタイムゾーンのほぼすべての国に100万人以上の人材を擁しており、お客様の機械学習プロジェクトためのカスタムAI学習データセットを迅速にご用意することができます。また、各プロジェクトに対して適した人材を割り当てて、プロセス全体を管理いたします。