目次

今回は金融や経済のデータセットを特集します。金融業界(ファイナンス)では何十年も前から定量的な記録があるので、機械学習の応用に適している分野です。システムトレード、株価予想、不正検出などの分野で、AIは金融業界に革命をもたらしています。経済においては、機械学習は経済モデルをテストしたり、政策立案者が市民の行動を予測したりするのに使用できます。

機械学習向けの金融(ファイナンス)や経済データセット

Quandl: 投資専門家のための代表的な金融・経済データセット。世界トップクラスのヘッジファンドや資産運用管理会社、投資銀行のアナリストら25万人以上が使用。

EUオープンデータ・ポータル: 経済だけでなく雇用、科学、環境、教育に関するEU各機関のオープンデータにアクセスできる。

世界銀行オープンデータ: 世界中の人口構成及び膨大な数の経済・開発指標をカバーしたデータセット。

IMFデータ: 国際通貨基金による、国際金融、負債金利、外貨準備金、物価、投資などに関するデータ。

フィナンシャル・タイムズ市場データ: 株価指数、商品、外国為替など、世界中の金融市場に関する最新情報。

Googleトレンド: 世界中のインターネット検索と話題のニュースのデータを検証・分析。

アメリカ経済学会(AEA): 米国のマクロ経済データを探す際に役立つ。

学校制度の財政: 米国の学校制度の財政状況に関する調査。

米国株式データ: 2009年以降の米国株式市場のヒストリカルデータ。毎日更新。

シカゴオプション取引所ボラティリティ・インデックス(VIX): 市場が短期的変動をどのように想定しているかを表したS&Pによる指数。日々の始値、終値、高値、安値が含まれた時系列のデータセット。

ダウ・ジョーンズ週間リターン: 週ごとの株式の収益率から成るデータセット。翌週どの株式が最も高い収益率を上げるかを決定できるようにアルゴリズムを学習させることを目的として、是非使用してください。

EconData: 米国政府機関が作成し、様々なフォーマットと媒体で配布した数千に及ぶ経済時系列データ。パソコンで容易に使用できる効率的な標準フォーマットで整理されており、サイトを通じて一般に提供されている。

Simfin: 証券取引委員会のウェブサイトにアップロードされた財務諸表のデータ。クリーンアップして1つの文書にまとめられているため、ダウンロード後直ちに作業に入れる。

サウジアラビア公債: サウジアラビア通貨庁の提供による、2005年から2017年までのサウジアラビア公債のデータ。

AssetMarco: 120カ国以上の25,000を超える指標から成るマクロ経済データベース.

Eurostat Comext: 商品ごとに整理された1988年以降の貿易動向のデータセット。

CIA世界ファクトブック: 世界各国の経済統計に加えて、人口、地理、通信、軍事に関する統計も含まれている。

以上、機械学習向けの金融(ファイナンス)や経済データセットをご紹介しましたが、いかがだったでしょうか。

金融データセットをお探しですか?

お探しのデータセットが見つからない場合は、当社がご用意いたします。こちらから、お気軽にご相談ください

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中