文字起こし

クラウドソーシングによる、
音声ファイルの
文字起こしサービス

文字起こしとは、音声ファイルを文字に変換する作業を意味します。当社はクラウドソーシングを用い、ECサイトや法律、医療、AIなど様々な業界リーダーに文字起こしサービスを提供しております。標準的な文字起こしサービスの他に、納期短縮、多言語音声、タイムスタンプ、話者認識、異なるファイル形式などの追加サービスもご提供します。

プロジェクトの設定

お客様のプロジェクト目的とスケジュールに応じて、ソリューションをご提案します。

文字起こし作業開始

各言語のリンギストが、音声文字起こしの作業を行います。

納品

プロジェクト管理者が文字データの最終確認を行い、納品いたします。

当社が選ばれる理由

当社は、音声や動画ファイルの文字起こしや音韻表記のサービスを100言語で提供しています。ご依頼いただく音声の分量に基づいて、競争力のある価格設定を行っています。納期短縮や多言語文字起こし、異なるファイル形式などの追加サービスも提供しています。

拡張性

クラウドソーシングによる音声文字起こしと合理化されたAIプラットフォームによって、大規模なプロジェクトも対応可能。

品質保証

組込み式の検証機能、アカウント管理者の定期的レビュー、コントリビューターのレベル分けを導入。

実績

当社は、自然言語処理タスクを強みとしております。

整文

整文の文字起こしサービスは、音声を読みやすいテキストに変換することを目的とします。他の文字起こしサービスより比較的多くの編集が行われ、発生された音声をそのまま文字起こしすることよりも、音声の意味内容を自然な形で伝えることに主眼が置かれます。繰り返しの文やフレーズを削除したり、文法の誤りを修正し、文を再構築することもあります。

素起こし(逐語記録)

最も詳細な文字起こしの種類です。話者が発した全ての単語だけでなく、録音に含まれる間投詞やフィラー、非言語コミュニケーションを全て文字起こしします。二人以上の話者の音声の場合「うん」、「ええ」などの相槌表現、発話の重なりも記録します。

音韻表記

ここで取り上げたその他の手法とは大きく異なる特殊な文字起こしの形態です。単語の発音に特に焦点を置き、話者の発音方法を把握することを目的としています。声のトーンの上げ下げや音声ファイル内で異なる音がどのように重なっているかに関するアノテーションが含まれる場合もあります。音韻表記の文字起こしを適切に実行するためには特別な表記法が必要です。

音声文字起こし

音声文字起こしとは、発話データをテキストデータに変換する作業をいいます。貴重なデータが録画や音声ファイルのみで保存されているが、自然言語処理にはテキスト形式が必要となる場合もあります。当社は300言語で音声文字起こしを提供しており、標準の文字起こしサービスに増して、タイムスタンプ、多数のファイルタイプにも対応可能。

機械学習データ

プロジェクト事例のご紹介

データ作成やアノテーションのサービスを提供し、AIの研究開発を支援いたします。

  • 文章分類サービスでは、リンギストとコントリビューターが貴社の文章を解析し、特徴をタグ付けします。これらのタグは、貴社のコンテンツを適切なカテゴリに分類するために使われます。文章分類はチャットボット開発、検索精度の向上、音声アシスタント、スパム検知など、多くのAIソリューションに必要となります。

  • 機械翻訳の品質評価では、機械によって翻訳されたテキストの品質をネイティブスピーカーが評価します。専門の翻訳者が機械翻訳のエラーを修正し、誤りのない自然な訳文を作成します。その他、指示や用語集に従っているかどうかのチェック、適切な文体やトーンで書かれているかの判断、複数の翻訳から最適なものを選択する作業なども行います。

  • 国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。