トランシンク株式会社

AI・機械学習データセット販売と作成

既存データセットから必要なだけ販売。

テキスト、音声、画像、動画等様々なデータに対応。

トランシンクのサポート内容・特徴

データセットの販売・ご提供

AI開発に必要なデータセットをパッケージとして必要なだけご購入いただけます。

多言語、多地域に対応可能

言語はもちろん、様々な年齢、方言を含むデータ収集を行います。

テキスト・画像・音声・動画に対応

テキストだけでなく、画像や音声、動画などのコンテンツを収集可能です。

ご要望に合わせたカスタムデータ

お客様個別のご要求事項に応じたデータ収集を行います。
お気軽にご相談ください。

AI・機械学習データセット販売・作成

トランシンクの
AI・機械学習支援サービス

AI開発のための機械学習データセットをパッケージとして販売しています。必要なデータセットを既存のライブラリーから必要なだけ購入できるため、限られた予算の中からご提供が可能です。

当社のデータセットパッケージにはテキスト、画像、動画、音声のデータに加えて、アノテーションデータも提供しています。

【音声認識・音声合成】音声コーパスデータセット

音声認識、音声合成(TTS)用機械学習データセット販売

多言語、多地域の音声コーパス販売と収集作業

画像・動画データセット

損傷した自動車、歴史的遺産、銀行明細、顔認証のデータセット

必要な分野、分量をパッケージとして販売

医療系データセット

電子カルテ、レントゲン、MRI、CTスキャン等のデータセット

必要な分野、分量をパッケージとして販売

テキスト・文章コーパス

カスタマーサポート、車載機器・電子機器へのコマンド文等のデータセット

機械学習用文字データセット販売・収集・作成

クラウドソーシング

多言語、多地域クラウドソーシング

多言語、多地域人材をクラウド採用

商品カテゴリ分け・タグ付けサービス

商品のカテゴリー化、分類とキーワードのタグ付けサービス

品目を人間が認識できるように分類

音声データの文字起こし

文字起こしとは、音声を文字に変換する作業

音声を文字に変換する作業

画像アノテーション

高品質な画像データで、コンピュータビジョン技術を向上

画像全体または画像の一部を分類

教師データの収集、アノテーションなどのサービスを提供し、AI開発をサポート!

AI向け教師データのご提供

お問い合わせ対応時間:平日9時00分 – 17時00分

03-6697-4400

ご利用企業様

様々な場面でサポートいたします

ご利用事例

動画、音声、画像、様々なデータタイプを様々な言語で対応することができます。

過去にも以下のような作業をご依頼いただいております。

自動車、通行人の
バウンディングボックス作業

中国語

自動車、通行人の
バウンディングボックス作業

中国語

道路標識認識

ドイツ語

道路標識認識

ドイツ語

人名(橙)、職業(緑)、
地名(青)の分類作業

英語

人名(橙)、職業(緑)、
地名(青)の分類作業

英語

文字書き起こし作業

ベトナム語

文字書き起こし作業

ベトナム語

住宅識別

画像の識別

住宅識別

画像の識別

音声書き起こし

アラビア語

音声書き起こし

アラビア語

宿泊レビューコメント分析

日本語

宿泊レビューコメント分析

日本語

テキスト画像文字起こし

英語

テキスト画像文字起こし

英語

様々な業界でご利用いただけます

ご利用いただける業界

近年、AI・機械学習は様々な業界で活用されております。
一例ですが、ご利用いただける場面の多い業界をご紹介いたします。

自動車・交通・事故

自動運転、標識、看板、など

自動車・交通・事故

自動運転、標識、看板、など

医療・保険

カルテ・CTスキャン・レントゲン・MRI

医療・保険

カルテ・CTスキャン・レントゲン・MRI

小売店

コンビニ・スーパーなど

小売店

コンビニ・スーパー

工場

半導体・電気など

工場

半導体・電気など

既存データセット

60言語、20時間超の
データセット

会話、独話、合成音声用高品質音声、挨拶、コンヒューターコメント、車載機器コマンド等、様々な書き起こしやメタデータ(性別、年齢、方言)付き音声データを有しています。

0
データセット
0
言語
0
収録時間

支援体制

トランシンクが選ばれる理由

アウトソーシングやクラウドソーシングなどのアノテーションリソースとの連携によりスケーラブルな体制を構築することができます。機械学習データ作成と多言語対応の経験が豊富なスタッフが対応します。

  • 経験豊富なアノテーターや品質検査員から専門的なプロジェクトチームを構成

  • 効率的なデータアノテーションプラットフォームを使用して、効率的に学習データを作成
  • 品質管理プロセスを通じで、安全性の高い環境で、正確性を高める検査プロセスを実施し、適格なデータをご提供

要件定義 → 提案 → 作業開始 → 納品

機械学習データのサービス提供までの流れ

機械学習データは言語、時間、人数、ファイル数、ワード数等、ご要件によって価格、納期が大きく異なります。
既存のデータとして弊社またはパートナーネットワークでご用意があるデータについては、
ゼロからデータ収集する必要がないため価格を抑えることができ、納品も翌日〜数日で対応可能です。

言語数、時間、ファイル数等による要件定義

お客様のプロジェクト目的とご予算に応じて、ソリューションをご提案します。言語、時間、人数、ファイル数、ワード数等、お客様のご要件に基づいてご提案書、お見積書を作成します。

既存データの場合、翌営業日〜数日で作業完了

言語、時間、人数、ファイル数、ワード数等、お客様のご要件に基づいて、データ抽出、アノテーション、分類作業を開始します。既存データの場合、翌営業日〜数日で作業完了が完了します。アノテーション等のカスタムデータ作成の場合には数週間〜数ヶ月の期間を要することもあります。

メール添付、ファイル転送システムで納品

プロジェクト管理者が納品データの最終確認を行い、メール添付、ファイル転送システム(FTP)、クラウドストレージサービス(Dropbox、OneDrive、Google Drive、SharePoint、AWS)等で納品いたします。音声、動画についてはデータサイズによっては数ギガバイト以上になることもあります。

参考価格

機械学習データの価格

機械学習データの価格は時間数、人数、言語数、ワード数、
ファイル数など様々な要件に基づきます。

詳しくはお問い合わせください。

米国英語自由会話音声コーパス

35,000円 / 時間
  • 室内/モバイル録音

  • WAV+txt
  • ビットレート:16 bit
  • サンプルレート: 16 kHz
  • 書き起こしデータ(性別、年齢、言語)

中国母語話者英語音声コーパス

15,000円 / 時間
  • 室内/モバイル録音
  • WAV+txt
  • ビットレート: 16 bit

  • サンプルレート: 16 kHz
  • 書き起こしデータ(性別、年齢、言語)

人物写真画像収集

300円 / 画像
  • 子供20人(未成年限定)X5,000枚
  • 4種類の画像/人
  • 年齢確認

  • 保護者・本人承諾

* 本ページに掲載されている価格は予告なく変更される場合があります。詳細はお問い合わせフォームまたはお電話にてご確認ください。

お役立ちブログ

最新のお知らせとブログ

機械学習データの作成や収集についての基礎知識や最新情報をお届けしています。
国内だけでなく、海外の情報についても広くご紹介しています。