目次

日常会話からAIビジネスに関わる、よくでてくるAI・機械学習の用語をまとめました。G検定のお勉強などにも役立てると幸いです。

アルゴリズム

アルゴリズムとは?

機械学習で、様々な問題を解くための手順を定式化した形で表現したもの。

オーバーフィッテイング(過剰適合)

オーバーフィッテイング(過剰適合)とは?

トレーニングデータに対してモデルを合わせこみすぎて、新しいデータに対する汎化性能が失われてしまうこと。

音韻表記

音韻表記とは?

言葉の発音を、単語ごとに記するために、音韻論的な解釈を加えた結果を書き表すこと。音韻論で抽出した有限の音素はスラッシュ / / の間に入れて音韻表記します。例えば、「さしみ [saʃimi]」は /sasimi/ となる。

回帰 (regression)

回帰(regression)とは?

大量のデータをプロットしたときに、その関係性を表す線(関数)を見出すこと。

拡張知能 (augmented intelligence)

拡張知能 (augmented intelligence)とは?

人工知能を拡張された身体機能の一部。もっと読む。

学習データ

学習データとは?

割り当てられたタスクの実行法をアルゴリズムに教えるためのテキスト。エンジニアは繰り返し何度も学習データを使用し、予測を微調整し、アルゴリズムの正解率を高めていきます。もっと読む。

画像認識

画像認識とは?

機械が画像の中から特定の部分を抽出し、対象物を認定する技術。もっと読む。

感情分析

感情分析とは?

文章の意見を判断し、それがポジティブかネガティブなのかを判断すること。出来事や製品に対する世間の意見を測るために役立つ機能。もっと読む。

機械学習

機械学習とは?

人工知能における研究課題の一つ。人間が自然に行なっている学習能力と同様の機能を機械で実現しようとする技術・手法。

強化学習

強化学習とは?

アルゴリズムに正解を与える代わりに、将来の価値を最大化して学習する方法。

教師あり学習

教師あり学習とは?

学習データに正解ラベルを付けて学習する方法。

教師なし学習

教師なし学習とは?

学習データにラベルを付けないで学習する方法。人工知能(AI): 機械を使って、学習・推論・判断など、人間の知能の働きを人口的に実現したもの。

キーポイント(特徴点)

キーポイント(特徴点)とは?

画像中の特徴的な点のこと。例えば、顔認証AIをトレーニングさせるための顔写真のでは、「目」「鼻」「口」などの顔のパーツがキーポイントとなるでしょう。

クラウドソーシング

クラウドソーシングとは?

大勢の参加者の知識、スキル、またはデータを利用して、一つの共同サービスを提供する過程。クラウドソーシングサービスはコスト削減、プロジェクト実行の迅速化、そして企業拡大に寄与しています。もっと読む。

クラスタリング

クラスタリングとは?

データをいくつかのグループに分類する基準を決め、沢山ある行を精査して、関係がありそうな行を同じグループにまとめる方法。

計算知能

計算知能とは?

数理論理学に基づく従来的な人工知能とは一線を画すもの。計算知能の研究は、ファジィシステムやニューラルネットワークや進化的計算といったヒューリスティック的アルゴリズムを中心とします。その他にも、群知能、フラクタル、カオス理論、人工免疫系、ウェーブレットといった技法も利用します。

形態素解析

形態素解析とは?

ある文章・フレーズを「意味を持つ最小限の単位(=単語)」に分解し、文章やフレーズの内容を判断するために用いる技術

固有表現認識

固有表現認識とは?

テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を認識する技術。もっと読む。

コンテンツ・モデレーション

コンテンツ・モデレーションとは?

WebサイトやSNS上の投稿をモニタリングする監視業務。業務内容はデータのラベル付けです。各WebサイトやSNSの許容ガイドラインに沿わないデータをラベル付け、すなわち「フラグ」を付けます。もっと読む。

コンピュータビジョン

コンピュータビジョンとは?

コンピュータがデジタルな画像と動画をいかによく理解できるか、ということを扱う研究分野。もっと読む。

自己符合化器(オートエンコーダ)

自己符合化器(オートエンコーダ)とは?

砂時計型の構造を持つニューラルネットワークを示す。入力側から半分をエンコーダ、残り半分をデコーダと呼びます。自己符合化器は入力層、出力層のノード数が同じで、中間層のノード数が入出力層よりも少ない。

自然言語処理

自然言語処理とは?

話しかけられた言葉に気付き、意味を理解し、適切な行動を決定し、ユーザーが理解できる言語で反応する機械の能力の総称。もっと読む。

自然言語生成

自然言語生成とは?

自然言語処理の一種。知識ベースや論理形式などの機械表現系から自然言語を生成すること。

自然言語理解

自然言語理解とは?

自然言語処理の一種。構造化されていないインプットをどのようにうまく処理して、機械が理解して行動できる構造化された形へ変換するかという、はるかに狭い分野。

照応解析

照応解析とは?

照応詞(代名詞や指示詞など)の指示対象を推定したり、省略された名詞句(ゼロ代名詞)を補完する処理のこと。

シーン理解

シーン理解とは?

画像内のシーン構造を理解するタスク

ストップワード

ストップワードとは?

自然言語を処理するにあたって一般的であるなどの理由で処理対象外とする単語。例えば検索エンジンは、一般的な単語である「the」「a」「for」などをストップワードとして扱い、検索の対象外にしている。

セマンティックアノテーション

セマンティックアノテーションとは?

「人」「物」「企業名」などテキスト内のさまざまな単語に意味付けをするアノテーション。

シンギュラリティ

シンギュラリティとは?

最近の人工知能をめぐる話題沸騰の課題。もし人工知能が、自分自身より賢い人工知能を開発することができるようになったら、それを無限に繰り返すとすれば、爆発的に技術が進展するだろう。

深層学習(ディープラーニング)

深層学習(ディープラーニング)とは?

機械学習の一種であるニューラルネットワーク(neural network)の階層を深めたアルゴリズム。もっと読む。

チャットボット

チャットボットとは?

自然言語処理を使った、人間の会話を真似る機械。チャットボットはWebサイトに埋め込むこともできれば、FacebookメッセンジャーやSlackのような第三者メッセンジャーサービスを介して提供することもできます。もっと読む。

データクレンジング

データクレンジングとは?

データをいくつかのグループに分類する基準を決め、沢山ある行を精査して、関係がありそうな行を同じグループにまとめる方法。

データサイエンティスト

データサイエンティストとは?

ビッグデータを活用・分析し、それをマーケティングなどの企業に活かすために研究を行う職人。もっと読む。

データセット

データセットとは?

機械学習で使われるデータをまとめたもの。こちらをご覧ください。

データマイニング

データマイニングとは?

データ解析の技法をビッグデータに網羅的に適用して、知識を取り出す技術。

敵対的生成ネットワーク(GAN)

敵対的生成ネットワーク(GAN)とは?

用意されたデータから特徴を学習し、擬似的なデータを生成するモデル。

特異値分類

特異値分類とは?

ある行列を複数の行列の積で表現する行列分解のひとつ。次元削減をはじめとして、機械学習の様々な場面で登場する重要な技術。

特徴量

特徴量とは?

今扱ってるデータをよく表す特徴を数値で示したもの。たとえば「人間」を表す特徴量としては、身長、体重、年齢、性別など。

特徴量エンジニアリング

特徴量エンジニアリングとは?

モデルが認識しやすい特徴をデータから作ること。

特定物体認識

特定物体認識とは?

画像に写っている物体の固有名詞をこたえるタスク。

トレーニングフレーズ

トレーニングフレーズとは?

チャットボットを学習させるための、違う言い回しで同じ意味の言葉(同義文)

ニューラルネットワーク (neural network)

ニューラルネットワーク (neural network)とは?

生物の脳の神経細胞(ニューロン)をモデルとしたアルゴリズム。

人間参加型 (human in the loop)機械学習

人間参加型(human in the loop)機械学習とは?

人間と機械知能を組み合わせて、アルゴリズムを学習させる方法。もっと読む。

能動学習(質問学習)

能動学習(質問学習)とは?

専門家に質問しながら分類器を学習させる機械学習のフレームワークのひとつ。

バウンディングボックス

バウンディングボックスとは?

画像に写っている物体を囲う四角い箱(矩形)のことで、X座標とY座標によって定義されます。もっと読む。

非構造化データ

非構造化データとは?

構造定義されておらず、関係モデルにうまく適合されていないデータセット。もっと読む。

ビッグデータ

ビッグデータとは?

一般的なデータ管理・処理ソフトウェアで対応できないような、巨大で複雑なデータの集合。もっと読む。

不均衡データ

不均衡データとは?

コンプーターやソフトウェアが情報を提示する際に、画像や図形を多用することで、ユーザーが視覚的かつ直観的に操作できるようにする方法のこと。

物体検出

物体検出とは?

画像に写っている物体や画像自体の種類を答えるタスク。もっと読む。

物体照合

物体称号とは?

画像に写っている物体が対象と同じ物体かを照合するタスク。

プログラミング

プログラミングとは?

コンピュータ・プログラムを作成することにより、人間の意図した処理をお香なうようにコンピュータに指導を与える行為。もっと読む。

文字起こし

文字起こしとは?

音声を文章に変更する作業。ビジネスや医療、法的な目標で用いられることの多いサービス。もっと読む。

API

APIとは?

「Application Programming Interface (アプリケーション・プログラミング・インターフェイス)」の略。ある一つの機能に特化したプログラムで共有可能なものや、ソフトウェアの機能を共有する仕組みのこと。

Caffe

Caffeとは?

公開の深層学習ライブラリ。画像認識に特化しており、高速処理が可能。もっと読む。

CPU

CPUとは?

記憶装置や入出力装置と接続され、コンピュータ内で演算や制御を行う部品。コンピュータの司令塔のような役割を果たし、コンピュータの頭脳に当たる存在。

Deep-Q-Network (DQN)

Deep-Q-Network (DQN) とは?

価値関数の計算を近似計算するディープニューラルネットワーク。ディープマインド社が開発した(DQNを用いる強化学習を、深層強化学習と呼びます)

GPU

GPUとは?

3Dグラフィックスなどの画像描写を行う際に必要となる計算処理を行う半導体チップ。

GUI

GUIとは?

コンプーターやソフトウェアが情報を提示する際に、画像や図形を多用することで、ユーザーが視覚的かつ直観的に操作できるようにする方法のこと。

IBMワトソン

IBMワトソンとは?

IBMが開発した質問応答システム。人工知能と紹介されることもあるが、IBMはワトソンを、自然言語を理解・学習し人間の意思決定を支援する「コグニティブ・コンピューティング・システム(Cognitive Computing System)」と定義している。もっと読む。

IoT

IoTとは?

Internet of Thingsの略。情報通信技術の概念を指す言葉。現代では主にパソコンやスマートフォンなどの情報機器が接続していたインターネットに、産業用機器から自動車、家電製品まで、様々な機械を繋げる技術。

kNN法

kNN法とは?

クラス分類のアルゴリズムの中でも非常に単純明快な「道データから距離が近いほうから純にk個のデータを調べ、初速クラスの多数決をとる」というアルゴリズム。

Java

Javaとは?

C言語の構文を主に引き継いだプログラミング言語。多種多様な環境で実行可能だけど、現代ではAndroidアプリなどに多く使われている。もっと読む。

POSタグ(品詞タグ)

POSタグとは?

動詞や形容詞といった品詞のタグのこと。

SIer

SIerとは?

企業のシステムを構築・運用する業者。

2045年問題

2045年問題とは?

米国の未来学者、レイ・カーツワイルは、2045年にシンギュラリティに到達するのではないかと予言している。

5G

5Gとは?

第5世代移動通信システムのことを示します。次世代津伸規格として注目を集め、2020年の実用化に向けて各企業が動き出しています。主に「超高速・大容量」「超的遅延」「多数同時接続」の3つの特徴があります。

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中