医療系、ヘルスケアデータセット

医師口述テキスト、CTスキャン・MRI画像データ集

既存データセット

利用目的に合わせて必要なだけ、既存データをパッケージとしてご提供するので、短期間に納品。

専門性

神経障害、心血管疾患、循環器、家庭医療、腫瘍、整形外科等の30以上の専門分野データを網羅。

個人情報対応済

HIPAAセーフハーバーガイドラインに準拠した個人情報除去対応。

CTスキャン画像データセット

実際の患者から収集され、高解像度CTスキャン画像。医療専門家や研究者向けの機械学習データセットです。

  • 15000点以上のCTスキャン画像

  • 頭部、胸部、腹部、頚椎、血管、脳、骨盤の部位を網羅
  • アジア、欧州、インド等の地域情報
MRI画像データセット

実際の患者から収集された、MRI画像。神経障害、心血管疾患などのさまざまな病状の機械学習に使用できるデータセットです。

  • 15000点以上のMRI画像

  • 頭部、腹部、胸部、臀部、前立腺、脳、脊椎の部位を網羅
  • アジア、欧州、インド等の地域情報
X線画像データセット

実際の患者から収集された、レントゲン画像データセット。医療系AI研究開発の機械学習に使用できる高解像度画像パッケージです。

  • 3000点以上のレントゲン写真
  • 足首、胸部、骨盤、上肢、下肢の部位を網羅
  • アジア、欧州、インド等の地域情報
エコーカーディオグラム データセット

実際の患者から収集された、心臓超音波検査(心エコー検査)DICOM画像です。さまざまな循環器疾患のAI画像診断開発に使用される機械学習データセットです。

  • 60000点以上のエコーカーディオグラム画像

  • 心臓弁膜症、心筋梗塞、心筋症、先天性心疾患など、循環器疾患検査等に使用。

  • ブラジル等の地域情報

マンモグラム データセット

実際の患者から収集された、マンモグラフィーDICOM画像。乳癌のAI画像診断等に機械学習に使用できるデータセットです。

  • 1000点以上のDICOM画像

  • 腫瘤、マイクロカルシフィケーション(微小石灰化)、構築の乱れなど、乳がんの兆候を検出する放射線科医によるAI診断支援

  • ブラジル等の地域情報

シンチグラフィ検査データセット

実際の患者から収集された、シンチグラフィ検査(核医学検査)DICOMデータセット。核医学スキャンの構造や組織をセグメンテーションするためのの機械学習に使用できる高解像度画像パッケージです。

  • 6000点以上のDICOM画像

  • 化学療法や放射線療法などの治療の有効性を評価するためのAIモデル開発等
  • ブラジル等の地域情報

医師口述データセット

医師と患者の臨床での症状や治療についての音声ファイルです。個人情報は全て排除されており、31の専門分野の口述データセットです。

  • 20万時間以上の口述音声

  • 循環器、家庭医療、腫瘍、整形外科等の30以上診療科目

  • 録音機器:電話、電子機器、スマートフォン

  • HIPAAセーフハーバーガイドラインに準拠した個人情報除去

医療記録データセット

医療記録のテキストデータセットです。患者の病歴のマッピングや治療提案に利用できます。

  • 20万時間以上のテキスト
  • 治療内容報告書、退院サマリー、EDノート等の記録
  • HIPAAセーフハーバーガイドラインに準拠した個人情報除去

電子健康記録(EHR)
データセット

電子カルテ(EHR)とは、患者の病歴、診断、処方、治療計画、予防接種日、アレルギー、放射線画像(CTスキャン、MRI、X線)、臨床検査などを含む医療記録です。

  • 30以上の診療科目、500万点以上の医療記録音声ファイル

  • 個人情報を除外した電子カルテ、入退院記録、AMLOS、GMLOS、病院情報等の医療メタデータ
  • 年齢グループ、性別等のデモグラフィック情報

  • 医療系NLPやDocument AIモデル用の学習データ

医療・ヘルスケアカタログ

医療系、ヘルスケア用
機械学習データとは

医療系、ヘルスケアデータセットは、医療情報を機械学習するための、医師の口述音声や病歴データ、CTスキャン画像、MRI画像等からなるデータセットです。機械学習に必要な医療情報は個人情報に配慮した高度なデータ処理・管理が求められます。当社では高度なゼロベースでプロジェクトを立ち上げることなく、既存のデータセットから目的に合わせて必要なだけご購入できるデータセットをご用意しており、短期間に低コストで学習データを入手できます。

要件設定

お客様のプロジェクト目的とご予算に応じて、ソリューションをご提案します。

データ抽出作業開始

言語、時間、人数等、お客様のご要件に基づいて、データセットを抽出します。既存データの場合、翌日〜数日で作業が完了します。

納品

抽出したデータをお客様指定のプラットフォームまたは弊社のデータ転送システムから、納品いたします。