目次

GISデータとは

地理情報システム(GIS)は、地理データを取得、保存、操作、表示するために設計されます。そして、GISには、ライドシェアや地図アプリの最適化など様々な活用の可能性があるので、GISと組み合わせた機械学習がますます活発化しています。つまり、このようなロケーションベースのソフトウェアは全て、大規模な構造化された地理データを基盤として作成されているのです。

Appleマップが最初に公開された頃は地名の不正確さや間違いがあり、Apple社が厳しく批判されました。例えば、ニューヨークの象徴とも言えるマディソンスクエアガーデンは、「ガーデン」という語を含んでいるだけで自然地域として分類されていました。地図アプリに苦情や批判が相次いだため、ティム・クックがサービスの向上を約束する公式の謝罪文を掲載するほどでした。

それ以来、Appleは誤りを修正し、新しい機能を開発し、さらにはプラットフォームの大幅な見直しを計画して、ソフトウェアを大きく改良しました。このことから、地図アプリでは、最も正確なGISデータを持つアプリが勝つことが分かります。

地図アプリの成功を後押ししているのは、人間がタグ付けしたデータです。GISデータの強化・検証に関与することによってユーザーは大きな価値を享受します。GISデータが地図アプリの改良にどのように役立っているかについて以下に三点まとめました。

GISデータによるローカル検索

検索エンジンの中核となる機能は、正確で関連性のある結果を提供することです。地図アプリの場合、ローカル検索は、特定の地域で何かを見つけることを目的としています(例えば、「東京の中華料理」)。他社の製品より精度の高いローカル検索結果を提供できれば、地図アプリにとって非常に有利です。そのため、ローカル検索結果の精度を検証することは、ユーザーを維持するために非常に重要です。

検索関連性とは、検索結果がユーザーの求めているものにどれくらい一致しているかを意味します。そして、ローカル検索の関連性を向上させるための最も重要なリソースは人間の知識なのです。

検索アルゴリズムが高精度と高再現率を達成するためには、人間がタグ付けした高品質のGISデータで継続的に学習させる必要があります。つまり、GISデータ作成の裏側では、人間が何百万件もの検索クエリと結果を突き合わせて評価しているのです。

GISデータによる地理データの強化

地図アプリにとってもう一つの重要な要素は、ビジネス情報の正確さです。完全で詳細かつ最新のビジネス情報を保有していることもローカル検索の関連性の向上に役立ちます。正確なローカルリスティングを維持しておかなければ、検索エンジンのGISデータの信頼性が失われ、ユーザーが次に検索するときは競争相手の地図アプリを使うようになるでしょう。

データの精度を向上させる最も良い方法は、その市場の専門家に各場所のメタデータと地理データを検証させることです。全ての市場の顧客に可能な限り正確で関連性のあるビジネスリスティングを提供するためには、人間があらゆる種類のデータを見直して検証し、前処理し、ラベル付けする必要があります。

GISデータによる経路検証

地図アプリでもう一つの重要なのは、最も効率的なドライブルート、自転車ルート、徒歩ルートを素早く見つけられる機能です。 特に発展途上の市場では、現実的なシナリオに即した正確なローカライズ化は地図アプリの課題です。

この過程において人間は大きな役割を担っています。ソフトウェアテスターは、地点間のルートが正確で安全、そして時間通りであることを確認する作業を行っています。そして、地元の専門家だけが持つ知識を利用することができるように、地元の評価者が雇われてこの作業にあたっています。

GISデータベース

地理情報システムの構築や機械学習のために誰でも無料で入手できる地理データがいくつか存在します。お客様のお役に立てるよう、公開されている優れた地理データセットを15件まとめました。

ナチュララルアース・データ: 地図の作成に必要な最も一般的な要素を含むGISデータセット。見た目の美しい形式で主要な地図機能(文化的、物理的、ラスター)を提供。

地球地図: 地球地図国際運営委員会によって作成された地球地図。地球全体をカバーする一連のGISレイヤーを特徴とし、交通機関、標高、排水、植生、土地利用、人口に関する情報が提供されている。

ArcGISオープンデータ: 世界中の2,601の機関が公開しているGISデータセット230,981件にアクセスできるオープンデータポータル。

Googleランドマークデータセット: Googleランドマーク認識チャレンジの一環として公開されたデータセット。世界のランドマークのテスト画像、トレーニング画像、インデックス画像が含まれる。コンピュータービジョンタスクにおける認識と検索を評価するために二つのカテゴリーに分類されている。

UNEP GEOデータ: 国連環境計画によるオンラインデータベース。国別、準地域別、地域別および地球全体の統計や地理空間情報として500個以上の異なる変数が含まれる。

ONS地理ポータル: あらゆる種類の地理データに無料でアクセスできるGISデータセット。

USGS歴史的地形図: 過去125年間のUSGS地形図の電子コピーをGeoPDF形式で提供。

DIVA-GIS国別データ: 数々の情報源から収集した国別地理データが含まれる。このウェブサイトを利用すると、世界のどの国についても簡単な地理(GIS)データをダウンロードできる。

ナチュラルアース: ベースマップのためのコンテキストデータおよびグローバル境界データを取得できる優れた情報源。

国立地球物理データセンター: 標高モデル、土地被覆、地震学を含むGISデータセット。

グローバル多重解像度トポグラフィー: 地上および海底の地形をカバーする解像度約100mの格子状の標高データ。

SRTM: 世界のほとんどをカバーするシャトル・レーダー・トポグラフィー・ミッションからの標高データ。

GDEM: ASTER衛星画像から取得した解像度30mの地球全体の標高データ。

オープン・トポグラフィー: 高密度点群や加工済みDEM(数値標高モデル)として、高解像度の地形データへの無料アクセスを提供するサイト。

地図アプリの開発にお勧めなサービス

必要なGISデータをお持ちでしたら、次に地図アプリの開発に取り組みます。全ての作業を自社開発で行うと大変手間がかかってしまう場合もあるので、地図アプリ開発のサービスもぜひご検討ください。地図アプリ開発に定評のある会社の紹介は、こちらの記事をご参照ください。開発ソリューションだけでなく、AIコンサルティング、マーケティング、クリエイティブ制作などまでご依頼できるワンストップサービスも多く紹介されています。

アラビア語音声コーパス

国立研究開発法人情報通信研究機構(NICT)では、先進的な音声認識及び自動翻訳技術の研究開発を推進しており、これらの研究開発における、アラビア語の音声翻訳対応のために必要な音声認識学習用コーパスを必要とされていました。

無料
機械学習用
音声コーパス
YouTubeビデオから抽出した10秒程度のサウンドクリップ他

随時追加中