目次

機械学習がメディアで大きく取り上げられることにはメリットもあればデメリットもあります。AIに関する認識が一般大衆にまで広がったのは良いことですが、メディアでの取り上げられ方によって用語の意味が非常にわかりにくくなってしまうことも多いのです。メディアでの露出が増えるにつれ、AIに関する多くの流行語が登場したり、異なる概念が同じ意味で使われたりといった状況が意図せず作り出されています。単純なアルゴリズムがSF映画に登場する人工意識を備えた機械と混同されることもあります。さらに悪いことに、AI分野の広がりや奥行きの深さには凄まじいものがあるので、その境界や区分に関してはまだある程度、議論の余地が残されています。

実際のところ、人工知能 (AI) とその関連分野である機械学習や深層学習の間には微妙な違いがいくつかあります。AIの世界に進出して成功を収めるためには、それら全てを明確に理解することが大切です。それでは、このことを念頭に置きつつ、三つの重要用語について、そしてデータ科学者がこれらの用語をどのように使い分けているのかを見ていきましょう。

AI (人工知能) とは?

AIは三つの中で最も古く最も広範な意味を持つ用語です。基本的に、人間のような手法で複雑な問題に取り組む技術または、一般的に人間のように振る舞う技術の総称です。 AIプロジェクトでは、タスクに対して人間と同様の取り組み方を用いながら、人間と同じように、あるいは人間より上手にタスクを行える機械を構築することを目標にしています。 AI研究は、コミュニケーションや推理、空間認識など従来、機械が苦手としていた分野に重点が置かれています。

AIアルゴリズムと従来のコンピューターアルゴリズムの主な違いは、ルールの作成方法にあります。従来のアルゴリズムでは、ソフトウェアが受け取る各種インプットに対してアウトプットを決定するための特別のルールを開発者が決定します。一方、AIアルゴリズムの場合、開発者にルールを設定してもらうのではなく、自ら独自のルールを構築するように設計されています。このアプローチを用いることで、以前は人間に頼っていたカスタマーサービスやテキスト分析、自動運転などの分野でコンピューターの利用が可能になってきました。

このような進歩は確かに非常に喜ばしいことですが、AI分野のことをサイエンス・フィクションに登場する人工意識を備えた全能のロボットと混同するのは間違いです。AI研究の究極の目標は、いつの日にか、しばしば強いAIと呼ばれるこのような機械を構築することです。これらの機械は理論的に、人間の指示に依存せず新しいタスクを学習することができます。しかし、それが可能かどうかでさえ、まだ議論の段階であって、このようなプロジェクトを開始するための糸口は見つかっていないのです。そのため、これが実現するとしても、いつになるかは全くわかりません。

それに対して、今日の全てのAIアプリケーションは弱いAIに分類されます。つまり、アルゴリズムは、非常に限定された分野において指示された事柄を学んでいるだけです。例えば、バーチャルアシスタントは音声による指示を難なく理解し、これまで聞いたことのない新しい種類のコマンドを認識できるように学習することができます。しかし、写真のタグ付けや車の運転を学習することはできません。そのため、機械が台頭する未来が近づいているといった話は実際、あまり役に立たないのです。強いAIや人工意識を備えた機械は、議論のための興味深いトピックではありますが、この分野で研究者が実際に行なっていることとは大きくかけ離れています。

そうは言うものの、 AI研究では、タスクの詳細を正確に定義すれば、どのような知能を真似する機械でも作ることができるとされています。そのため、特定のビデオゲームをプレーするなど特別なタスクに取り組むために、最も優れたAIアルゴリズムのいくつかが開発されてきたのは当然でしょう。これらのアルゴリズムは様々な高速処理技術を利用して、注釈付きデータセットのパターンや関係を理解します。 非常に具体的にタスクを指示し、的を絞ってタグ付けした大量の学習データセットを準備すれば、これまでコンピューターが苦手としていた様々な分野で人間のパフォーマンスを超えるアルゴリズムを構築することが完全に可能です。

AIの急速な進歩は主にこれらのアルゴリズムの開発に使われている機械学習プロセスのおかげですが、この二つの概念にはいくつか重要な違いがあります。次はこのことについて詳しく見ていきましょう。

機械学習とは?

機械学習は一般的にAIの一部と考えられています。しかし、この二つの用語が同じような意味で使われていることも多いのです。その理由は簡単です。現在存在するAIアプリケーションのほとんど全てが機械学習によって構築されているからです。AIはインテリジェントな機械という壮大なビジョンを表し、機械学習とはそこに至るまでに利用するコンピューターモデルやプロセス、そしてそれらを支える技術を意味しています。

もちろん、人工知能の機械を構築するために別の方法が存在する可能性もありますが、残念ながら、他の手法による人工知能はまだ有意義な進歩を遂げていません。AIの概念に曖昧性があるため、それらの手法を検討する余地はあるのですが、今日実際に進歩を遂げているのは機械学習プロセスによる製品です。

この分野には従来のコンピューターサイエンスの分野と一線を画する主な特徴がいくつかあります。最も重要な特徴は、機械学習アルゴリズムの学習方法にあります。例えば、顔認証AIの場合、従来のアルゴリズムが写真から特定の顔を認識してラベル付けするためには、ピクセルごとのレベルで指示を受け取る必要があります。開発者は、何千ものピクセルを非常に正確に設定することによって一定のラベル付きアウトプットが生成されるようにコードを書かなくてはならないでしょう。それだけでなく、人間の顔を構成する可能性のあるすべてのピクセル設定をアルゴリズムにコーディングする必要があります。

このような方法で顔認証を構築するのは膨大な数の変数が必要となる上、システムが予測不可能なインプットを受け取ることもあるので基本的に不可能です。それに対して、機械学習アルゴリズムは問題を再構築する方法で学習させられます。アルゴリズムは学習する際、正しいインプットとアウトプットの組み合わせを含む大量のデータポイントを与えられます。これを基にして、タスクを行うための独自のシステムを推定することができるのです。

さらに、機械学習アルゴリズムは新しいインプットから独自に学習することができるので、モデルを改良するために人間の介入を必要としません。コンピュータービジョン機械翻訳など、AIの特徴的な活用事例の多くにとってこれは非常に重要です。

現時点では、 機械学習以外の手法で構築されたAIアルゴリズムを特定するのは困難です。人間によって構築された包括的なルールシステムを利用して開発されたエッジケースも少しは存在しますが、先に述べた通り、それをAIとみなすのは難しいかもしれません。このようにはっきりしない部分があるということが、多くの研究者や開発者もこれら二つの用語をほぼ同じ意味で利用している大きな理由の一つになっています。

しかし、AIについて語るとき、同じような意味で使われている用語がもう一つあります。深層学習です。

深層学習とは?

深層学習は一言で言うと、規模に関係しています。計算能力が向上し、学習データが入手しやすくなるにつれ、研究者たちはこれまで以上に機械学習プロセスを進歩させることができるようになりました。その結果、深層学習という新しい用語が生まれました。完全に理解するためには、まずニューラルネットワークの基本知識があると良いです。

名前が示唆する通り、ニューラルネットワークとはタスクの実行において人間の脳の活動を真似しようとする機械学習の一種です。ハイレベルでは、このプロセスを以下のステップに分けることができます。

  • 入力された学習データを有効な属性に分解します。それから、これを0または1のインプットを持つセルに近似させることができます。例えば、顔認証の場合、各インプット写真はピクセルに分割され、それぞれのピクセルに値が割り当てられます。
  • これらの各セルを一つの層のノードに結合し、それぞれの結合に適切な重みを付与します。
  • すると、各ノードはセルの値に重みを乗算し、足し合わせた値を持ちます。そして、複数の層でこの計算を繰り返します。
  • ノードの最後の層はアウトプットデータ層に結合します。重みとノードを用いて最終的な計算を行ってから、その値を関数に入力すると、可能な答えの確率がアウトプット層に表示されます。

 

機械学習と深層学習の主な違いは、インプットデータが通過するノードの層の数にあります。今までは計算能力に限界があったため、結合できるノードの数が限られていました。しかし、技術進歩に伴い、より多くの隠れた層を含む「深い」ニューラルネットワークを構築することが可能になりました。データ科学者が深層学習について語るときに意味しているのはこのような種類のコンピューターモデルです。

このように層の数が増加したことは結果に大きな影響を与えるとともに、深層学習と機械学習を区別する役割も果たします。何度も計算を繰り返し、多数の結合を形成するため、深層学習の予測精度は通常、単純なモデルに比べてかなり高くなっています。重みや結合が桁違いに増えることで、新しいインプットデータに基づいて機械が非常に細かい調整を行うことが可能になります。

これはまた、深層学習モデルでは改良を続ける期間が長くなるという効果をもたらします。 機械学習による改良は学習データがある一定量に達すると停滞期に入る傾向があります。しかし、深層学習の場合、膨大な数の重みを調整しなければならないので、この限界点はかなり先になり、モデルが学習を続ける期間が長くなります。実際、深層学習モデルのメリットを最大限に引き出すためには膨大な数の学習データが必要です。機械学習の場合以上に膨大なデータがなければ、複雑なソリューションを構築しようとしても計算能力と時間の無駄になってしまいます。

モデルを構築している多くの人にとって、改良の可能性が向上することは、プロジェクトを成功に導くために重要な意味を持ちます。 深層学習は多くのAIと同様、非常に複雑な問題を解決したいという願いによって促進されていますが、その成功は際立っています。

 

AI、機械学習、深層学習には類似点がありますが、適切な方法でアプローチすると、かなり明確に区別できます。AIは壮大で包括的なビジョンであり、機械学習はそれを達成するためのプロセスや手法です。そして、深層学習はデータや計算能力を利用して機械学習を次のレベルに引き上げたものです。これらを考慮に入れると、この複雑で刺激的な分野での舵取りを開始し、独自のプロジェクトの構築に役立つプロセスを見つけることも可能です。

これまでの説明によってさらに多くの疑問が生じたら場合でも、ご心配なく。当社の参考資料のページには AI学習データの入門記事 AI学習の仕組みなど、機械学習に役立つ記事がたくさん掲載されています。

TranSynkのAI学習データサービス

当社はAI学習データの収集、アノテーション、検証などのサービスを提供しております。顧客企業中心のアプローチを用い、学習データの作成や評価・検証サービスの提供を行っております。貴社のAIプロジェクトに最適な教師データセットを作成するために、まずは貴社のニーズと予算を十分理解させていただくよう、心がけます。サンプルデータやご相談は、お気軽にお問い合わせください。

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中