目次

画像アノテーションとは

画像アノテーション(画像のタグ・ラベル付けともいう)とは、画像内の領域を手作業で指定し、テキストベースの説明を作成することです。画像のアノテーションは、コンピュータービジョン向け教師データセットを構築するための重要な最初のステップです。そして、この学習データセットを利用して学習したコンピュータービジョンは、コンテンツモデレーションや自律走行車、顔認識などのAIシステムの構築に役立ちます。

安価な画像アノテーションサービスはどこで入手できるのか

この記事では、AIやコンピュータービジョンの構築に利用できる安価な画像アノテーションサービスを入手するためのいくつかの選択肢と、それぞれの選択肢に関わる費用について見ていきましょう。 一つ目の選択肢は社内でのアノテーションです。つまり、画像のアノテーションを社内のデータサイエンスチームに任せることです。この方法のメリットは、進捗を追跡し、予測可能な結果を得ることができることです。アノテーションする画像が少量であれば、社内でアノテーションするのもよいでしょう。複雑な指示がある場合も、全ての要件を理解していない外部のアノテーターを審査して委託するより、社内でアノテーションする方が実際、早くできることがあります。 また、画像が少量の場合、パートタイマーを数人雇って社内でアノテーションを行うこともできます。しかし、この解決策のデメリットは、後でより多くの画像のアノテーションが必要なことに気付いた時に拡張できないことです。さらに、パートタイマーの採用や研修に追加の管理コストがかかります。 多くの場合、社内でアノテーションを行うとコストがメリットを上回ります。貴重な社内リソースを消費してしまうだけでなく、データの多様性が低下し、時間もかかります。 大部分のAI企業は、手間のかかる手作業の画像アノテーションを業務委託することを選択します。委託先としては一般的なクラウドソーシング企業、あるいはAI学習データを専門とするプロバイダーなどがあります。適切なアウトソーシング企業を見つけることができれば、リソースの取得や品質評価を管理する必要なく、多様性を確保したデータを入手できます。

画像アノテーションはどのように価格設定されているのか

アウトソーシングを検討している場合、次に知りたいのは、アノテーションの価格設定でしょう。市場調査をする際に考慮すべきいくつかの要素を以下にまとめました。

画像アノテーションの品質水準

画像のアノテーションを行うアウトソーシング企業の中には、顧客が求める品質水準によって異なる価格設定を行っているものがあります。画像のアノテーションの品質は、画像の全てのオブジェクトが正確に判別され、アノテーションされていること、バウンディングボックスやキーポイントが対象物の上に正確に表示されていることなどで決まります。例えば、当社の画像のアノテーションサービスの料金プランは以下のようになっています。

  • シングルパス: 一人のアノテーターが各画像のアノテーションを行います。
  • シングルパス + 10%: シングルパスでアノテーションを行った後、アノテーションの品質を保証するため、当社のプロジェクトマネジャーが画像の一部を見直します。
  • ダブルパス: 二人のアノテーターが各画像のアノテーションに関わります。二人目のアノテーターが最初のアノテーターのアノテーションを確認し、必要と判断した場合は、修正します。
  • ダブルパス・ブラインド: 二人のアノテーターがお互いの注釈を見ることなく、独自に各画像のアノテーションを行います。この方法では、一人のアノテーターがミスを犯しても、二人目のアノテーターに影響を与えません。二人のアノテーターが異なるアノテーションをした場合、当社のプロジェクトマネジャーが不一致の理由を調査し、アノテーションプロジェクトの他の部分でエラーが発生しないようにします。

画像アノテーションのガイドライン

どのような画像のアノテーションプロジェクトでも、明確なガイドラインを確立することが重要です。アノテーターに明確な指示を与えるために包括的な文書を作成し、そのプロジェクトでどのような結果を求めているのかを明らかにする必要があります。プロジェクトガイドラインには、アノテーションの種類やアノテーションのためのベストプラクティスなどを含めるとよいでしょう。当社ロボットがバッテリーを充電できるようにすることを目標としたロボットドッカー用の画像アノテーションプロジェクトに取り組んだことがあります。このプロジェクトでは、お客様がドッカーのアノテーション方法に関する特定のガイドラインをお持ちでした。 委託の際、独特のガイドラインや非常に複雑なガイドラインがある場合は、アノテーターをトレーニングするための費用がかさむ可能性があります。

画像アノテーションのプロジェクト管理費

プロジェクト管理には、アノテーションプロジェクトの予算を作成し、スケジュールを組むことなどが含まれます。クラウドソーシング企業を利用する場合は、適切な資格を持つクラウドワーカーを集めてトレーニングすることもプロジェクト管理の対象になります。 プロジェクト管理費は、お客様がアノテーションプロジェクトでどのようなツールの利用を希望しているかによっても異なります。

当社では、お客様が弊社の既存の画像アノテーションプラットフォームをご利用になる場合、プロジェクト管理費はかなり低く設定されています。プラットフォームの構築はすでに完了しているので、お客様はそのプラットフォームを利用してアノテーションの品質や分量を管理し、最適化することができます。 その他の場合は、弊社のプロジェクト管理チームがインテグレーションを設定し、追加のトレーニングを行って、アノテーターが新しいプラットフォームを利用できるようにする必要があります。そのため、プロジェクト管理費は高くなります。 多くの場合、画像のアノテーションの価格を左右する要素は固定化されています。特にプロジェクトガイドラインはその傾向があります。機械学習プロジェクトのためにどのようなアノテーションサービスが必要かについてはなかなか柔軟に変更できません。しかし、当社の画像アノテーションプラットフォームと既に統合されているツールを利用できれば、コストを大幅に下げることができます。当社のプラットフォームをご利用いただければ、プロジェクト管理費を可能な限り低価格で提供いたします。弊社のプラットフォームでは、アノテーターがバウンディングボックスを利用した画像のアノテーションタスクを作成、編集、削除、提出することができます。また、プロジェクトマネジャーもこのプラットフォームを利用して新しい画像アノテーションプロジェクトの作成、進捗の確認、JSON形式による結果のエクスポート、そして必要に応じて、提出されたアノテーションの拒否を行うことができます。

画像アノテーションの分量

画像のアノテーションの分量は、ご注文いただいた画像の件数に各画像のタグ数を単純に掛けたものです。例えば、1,000件の画像にそれぞれ約5つのバウンディングボックスを付ける必要があるという具合です。 当社も含めて、大規模なプロジェクトには数量割引を提供するアウトソーシング企業があります。これは規模の経済によるものです。お客様のプロジェクトガイドラインに精通している特定のチームを利用すると、時間と共に費用効率が高くなります。チームがプロジェクトに慣れ、熟達するようになるからです。 大規模なアノテーションを注文する方が小規模なタスクを注文するより安くなることがあります。これまでアノテーションの価格設定は次の事柄に基づいていることを見てきました。(1)画像データの分量(2)品質水準(3)プロジェクト管理費。大部分の画像のアノテーションタスクではプロジェクト管理費は固定費です。 例えば、次のような価格設定に基づいて画像のアノテーションを注文したとしましょう。

  • プロジェクト管理費: ¥50,000
  • 画像1件あたりのアノテーション費用: ¥100
  • 品質: ダブルパス

この場合、100件の画像のアノテーションを注文したとすると、画像のアノテーション費用¥20,000に対して¥50,000のプロジェクト管理費がかかります。しかし、10,000件の画像のアノテーションを注文すると、画像のアノテーション費用¥2,000,000に対してプロジェクト管理費は前と同じ¥50,000です。このように考えると、大規模な画像のアノテーションプロジェクトの方がコスト面で比較的有利になります。

画像アノテーションの活用事例

現代のアスリートにとって、ビデオ分析は、成果を出すためのトレーニング体制の構築に不可欠です。 この手法はチームスポーツで一般的に用いられ、戦術的な弱点を特定するだけなく、ビデオ分析は個人レベルでも役立ちます。人間の目では見逃す可能性のあるごく些細なパフォーマンスの向上を明らかにし、怪我を未然に防ぐ事もにも使用されています。ビデオ分析は、アスリートが最高レベルで競い合い、その状態により長く留まるための助けとなります。

画像アノテーションサービスをお探しの方へ

画像アノテーションのサービスをお探しでしたら、ぜひ当社にご連絡ください。データ作成・画像アノテーション済みのデータセットを提供しております。また新規のカスタムプロジェクトも承ります。アノテーターは秘密保持契約に署名することが義務付けられており、データ保護のためにオンサイトスタッフやリモートスタッフを派遣し、アノテーターにお客様ご指定のツールを利用してもらうこともできます。必要に応じて案件に特化した秘密保持契約も作成できるので、データの安全性も保証しております。

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中