目次
書き起こしとは?
書き起こしは、話し言葉をテキスト化する作業で、ビジネスや医療、法的な目的で用いられることの多いサービスです。特にオンラインでの商品の販促や販売を目指す企業にとって、書き起こしは情報の視認性や可用性を最大化するのにますます重要なものとなってきています。企業Webサイトの音声や動画コンテンツに文章が添えられていれば、検索エンジンの順位が上がり、アクセスの増加が見込めます。
機械学習のおかげで、書き起こしの活用の可能性が急速に拡大しています。しかし、ますます重要性を増すこのサービスを最大限に活用するためには、サービスの内容を明確に理解することが重要です。書き起こしサービスには様々な種類があり、それぞれ異なるメリットと制約があります。そのため、どのようなタイプの書き起こしサービスを選ぶかがプロジェクトの結果に大きな影響を与える可能性があります。
この記事では、最適な書き起こしサービスを選択するためのお役に立てるよう、主な四つの書き起こしサービスについてまとめました。それぞれのサービスについて詳しく知ることにより、自社の音声ファイルに最も適した書き起こしへの一歩を踏み出すことができます。
素起こし
逐語記録とも呼ばれますが、可能な限り最も詳細な書き起こしの種類の一つです。これは、話者が発した全ての単語だけでなく、録音に含まれる間投詞やフィラー、非言語コミュニケーションを全て書き写します。そのため、素起こしは通常、長くて非常に詳細なものになります。複数の話者の音声が含まれる場合、会話における割り込みや「そう、そう」「うん、うん」などの相づち表現、発話の重なりも記録します。
- 素起こしに含まれるもの: 全ての単語のほか、笑い、間、咳などの非言語コミュニケーション。聴衆の話し声や雑音などの周囲環境音も含まれる場合があります。
- 素起こしに含まれないもの: パトカーのサイレンや雷、工事の音など、書き起こしとは関係のない騒音や録音された話の流れを不必要に妨げる可能性のある音。
ケバ取り
書き起こしサービスで通常デフォルトになっているのがクリーンな逐語記録とも呼ばれるケバ取りです。素起こしと同様、テキストの意味を保存することを最優先し、言い換えたり意味を変更したりすることは一切行われません。
一方、話者のコミュニケーションスタイルを把握することは意図していないので、「あのー」、「えー」などと口ごもる時などのフィラーや不必要な非言語コミュニケーションは一般的に省略されます。これらはテキストの意味にあまり影響を与えないからです。つまり、ケバ取りではテキストの完全性と読みやすさのバランスを取ることを目的としています。
- ケバ取りに含まれるもの: 話者が発した全ての重要な文章。
- ケバ取りに含まれないもの: 周囲の雑音や音、非言語コミュニケーション。意味に影響を与えないフィラーも省略されます。複数の話者が含まれる場合、会話における割り込みや相づちも省略される可能性があります。
整文
インテリジェント逐語記録とも呼ばれるこのサービスは、音声を簡潔で読みやすいテキストに変換することを主な目的としています。この書き起こしの場合、上記のサービスと比べてより多くの編集や削除が行われます。発生された音声をそのまま書き起こすことよりも音声の意味内容を可能な限り最も自然な形で伝えることに主眼が置かれています。繰り返しの文やフレーズを削除したり、文法の誤りを修正して文を再構築することも含まれます。
- 整文に含まれるもの: 話の内容を明確に伝えることを最優先する書き起こしのなので、句読点や文法的な誤りは必要に応じて修正されます。
- 整文に含まれないもの: 最終製品では、ノイズや非言語コミュニケーションに加え、全てのフィラー、繰り返し、トピックに関係のないコンテンツが除去されます。発話された音声と正確に一致していない場合もありますが、話の意味内容は網羅されているはずです。
音韻表記
音韻表記とは、上記の手法とは大きく異なる特殊な書き起こしの形態です。単語の発音に特に焦点を置き、話者の発音方法を把握することを目的としています。声のトーンの上げ下げや音声ファイル内で異なる音がどのように重なっているかに関するアノテーションが含まれるので、音韻表記を適切に実行するためには特別な表記法が必要です。
- 音韻表記に含まれるもの: 発話された全ての音を音標文字で完全に列記したもの。話者のイントネーションに関するアノテーションが含まれる場合もあります。より伝統的なタイプの書き起こしも含まれるかどうか確認するとよいでしょう。
- 音韻表記に含まれないもの: 書き起こしの障害となる可能性のあるノイズ
どのタイプの書き起こしを使うべきか
このように書き起こしサービスの種類の違いによって最終製品の内容が異なるので、それぞれ適したプロジェクトタイプがあります。そのため、自社のプロジェクトの投資対効果を最も高めるのはどれなのか慎重に検討する必要があります。
一般的に、素起こしは、法律業務など、完全なトランスクリプトを非常に詳細に分析する必要があるプロジェクトに適しています。ケバ取りは、クリーンなトランスクリプトを、理解しやすいフォーマルな形式で作成します。公開する必要があるテキストは多くの場合、このタイプの書き起こしを利用するとメリットがあります。整文は、明確で理解しやすいトランスクリプトを提供します。そのため、文書を速く読んで理解、共有する必要のある一般的なビジネス目的で、様々に利用できます。最後に音韻表記は、発話方法を非常に詳細に説明する手法なので、一般的に学問や言語学の特別なプロジェクトで利用されます。業界別で一般的に多く使われる書き起こしの種類をまとめた以下の表もご覧ください。
素起こし | ケバ取り | 整文 | 音韻表記 | |
---|---|---|---|---|
法務 | ○ | |||
市場調査 | ○ | |||
広報 | ○ | |||
映画 | ○ | |||
採用 | ○ | ○ | ||
出版 | ○ | |||
学会 | ○ | ○ | ||
ラジオ | ○ | ○ | ||
医療 | ○ | |||
ビジネス対話 | ○ | |||
言語学 | ○ | |||
心理学 | ○ |
音声書き起こしサービス
上記の情報は、書き起こしを実行するために役立ちますが、適切なサービスを選択することはプロセスの始まりにすぎません。投資対効果を最大にするためには、経験豊富な専門家をそろえた書き起こし業者を探す必要があります。
CrowdWorks: 日本最大級のクラウドソーシングサービスCrowdWorksの書き起こしサービス。年間1万件以上の書き起こしタスクの実績がある。取材の録音ファイル、通話記録の分析、講演の書き起こし、会議の議事起こしなどにご利用可能。
VoXT: 幅広い書き起こしニーズに対応するソリューション。専門スタッフが音声認識技術を使い、貴社に適切なプランで書き起こし作業を行います。
NextGen: 通信技術のコンサルティング企業NextGenが提供する、人手による音声書き起こしサービス。音声認識エンジンの開発で書き起こしを実施している経験豊富な人材によって、書き起こしを実施します。
テープリライト: 専門スタッフがいるため、議事録、法廷、医療などの専門分野などに対応可能な多言語書き起こしサービス。