テキストコーパス

機械学習向け
テキストコーパスとは

機械学習向けテキストコーパスとは、チャットボットや電子機器への命令を構築する際に必要となる、テキストや音声の教師データのことをいいます。この教師データは、自社サイトの「よくある質問」ページ、顧客サポートのチャットスクリプト、コールログ、お問い合わせセンターのメールなどから収集できる場合もありますが、既存データが不足の場合は、当社がご用意しているデータセットのご利用はいかがでしょうか?。

1000万文以上

20万文以上の日本語自由会話をはじめさまざまな言語のテキストデータ

.txt

.txt/.csv等のフォーマットで納品します。

自由会話、コマンドからニュースまで

映画やショッピング等についての自由会話、自動車機器への指示、政治経済ニュース、スポーツニュース、病院会話、スマートホーム等、さまざまな場面のテキストコーパスを提供します。英語の自動車コマンド文例:Open the door/Switch on lighting

当社が選ばれる理由

自動車機器・電子機器への命令、チャットボットAIの学習等に必要な教師データを提供

拡張性

100言語以上のネイティブ話者である、100万人のコントリビューターが登録されているため、大規模な会話コーパスも正確且つ素早く作成いたします。

品質保証

組込み式の検証機能、アカウント管理者の定期的レビュー、コントリビューターのレベル分けを導入。

実績

20年に渡る翻訳業界での実績を誇る当社は、自然言語処理タスクを強みとしております。

データセットサンプル

テキスト コーパス データセットの
サンプルを以下にご紹介します。