Web構造とコンテンツを同時に考慮した次世代情報検索エンジンの開発

keywords.jpg情報検索,拡張 PageRank アルゴリズム,検索エンジン,Web ページランキング,光電子分光 

岡村 寛之 

HIROYUKI OKAMURA

division.jpg工学研究院 情報部門 ディペンダブルシステム論研究室

position.jpg准教授

研究概要

研究内容

従来のWeb構造のみに依存したPageRankに対して,ページコンテンツを考慮したWebページランキングアルゴリズムの開発を行った。提案アルゴリズムはページコンテンツと検索ワードの類似度をマルコフ決定過程の報酬として与えることによって,従来のPageRankではできなかった様々な検索方法が可能となった。例えば「検索ワードではなく検索文として与える」ことや「検索ワードが存在しないが重要なページの抽出」などが行える。
 現在,当研究室ではPCサーバの処理能力に限界があるため,小規模なサイトに対する検索しか行えていない。 これをインターネット上の全Webページを対象に展開したい。
<用語説明> ・PageRank:Google社のページのスコアリングに関する登録商標

実用化に向けて(想定業界・用途、課題、企業への期待など)

企業と実用化のための共同研究を行いたい.
応用分野
Web アプリケーション,データマイニング

本研究の特徴・優位性

PageRank をマルコフ決定過程によって拡張することで,コンテンツの重要度とリンク構造に基づいたランキングを確率的な解釈から導出することができる.

detailsubtitle3.jpg

岡村寛之,宮内聡, 土肥正,“マルコフ決定過程による Web ページランキングアルゴリズムの提案,'' 電子情報通信学会論文誌 (D-I), vol. J89-D, no. 2, pp. 210--219, 2006.

お問い合わせ