ビッグデータを有効利用するための効果的情報選別手法

keywords.jpgビッグデータ, 情報選別, スカイライン, 異常検出, 知識発掘, Hadoop MapReduce 

森本 康彦 

YASUHIKO MORIMOTO

division.jpg工学研究院 情報部門 情報コミュニケーション工学講座

position.jpg准教授

研究概要

研究の背景

情報化の普及と,収集技術,記録技術の進歩に伴い,あらゆる分野の記録・ログが大規模化している.このような,いわゆるビッグデータを有効利用するためには,効果的な情報の選別が必要となる.我々は,MapReduceを用いた並列分散計算手法などを利用した,スカイライン問合せと呼ばれる情報選別手法を研究開発している.とくに,グラフデータやプライバシーに配慮しなければならないデータに対する情報選別技術では世界に先駆けた独自の分析手法を有している.

研究内容

データベース中の各データは,たとえば価格など,ある基準で比較することで優劣をつけることができる.データを詳細に分析する場合や,データを選択する場合には,(あらゆる評価基準で)他のデータに劣っているデータをあらかじめ取り除いたコンパクトなデータとすることが有効である.この機能をスカイライン問合せと呼ぶ.
 我々は,GISやインターネット等に由来するグラフデータに対する独自のスカイライン問合せ計算技術をもっている.この手法で,たとえば,ある現象が発生しやすい道路区間などをあらゆる基準で選別することができる.
 また,プライバシーを配慮しなければならないコンテンツに関しては,集計データの形式でスカイライン問合せを計算する手法も開発している.

成果

上述した内容の各機能を作成し,いくつかの実証実験をすませている.その内容は学術雑誌,国際会議等で発表している.

実用化に向けて(想定業界・用途、課題、企業への期待など)

上述した基礎技術の応用問題に取り組みたいと考えており,実データ,とくに時空間情報やグラフデータを所有するパートナーを探しています.この技術に関心をもってくださる方には,まず,知見の提供,講演,助言等させていただきます.お気楽にお問い合わせください.

本研究の特徴・優位性

スカイライン問合せ技術は,とくに「ビックデータに対する情報選別」や,「(キーワード検索などのように)詳細な検索条件を使わないデータ検索」に有効利用できる.一般的なスカイライン問い合わせの研究は多くの大学や研究機関で行われているが,GISやインターネット等に由来するグラフ形式のデータに対する独自のスカイライン問合せ計算技術や,プライバシーを配慮したスカイライン問合せでは,我々は独自の技術やノウハウを持っています.
他にもデータ分析,データマイニング,大規模データベースに関連する基礎研究に取り組んでいます.

お問い合わせ