寺田研究室学生部屋ページ > 論文 > 統計的手法を用いたWeb閲覧履歴の解析とWeb推薦への応用

統計的手法を用いたWeb閲覧履歴の解析とWeb推薦への応用


著者

鶴原 翔夢

論文名

統計的手法を用いたWeb閲覧履歴の解析とWeb推薦への応用

発表年月

2007年2月

発表学会等

電気通信大学平成19年度修士論文

概要

Web 上の大量の情報の中から必要な情報を引き出すためには,Google やYahoo!といった検索エンジンを利用することが一般的である.検索エンジンではユーザは明示的にキーワードを指定し,それに関連するWeb ページを取得する.必要な情報に関する何らかのキーワードが明確に分かっている場合には,適切なページをすぐに発見できることが多いが,そのようなキーワードをはっきりと示すことができないような場合も多い.

これに対して,ユーザが明示的にキーワードを示すことなく,何らかの有用な情報を取得するシステムの例として,Web ページ推薦システムが提案されている[1][2][6][7].これらのWebページ推薦システムでは,ユーザの閲覧履歴やブックマークデータを基にして,そのユーザにとって有用と考えられるページを見つけ出す.
履歴データなどを基にして推薦を生成するアルゴリズムとしては,協調フィルタリングの考え方を基にしたものが多い.協調フィルタリングを用いたシステムでは,推薦を要求しているユーザの履歴とよく似た閲覧履歴を持つ別のユーザを見つけ出し,そのユーザの履歴を使って推薦を生成する.似ている履歴を探し出すためには履歴データの間に類似度と呼べるような距離尺度を導入する必要がある.従来用いたれていた類似度計算手法では,多くのユーザ間の類似度が0 となってしまうという問題があった.本研究では,閲覧履歴に統計的解析手法を適用することで,従来法の問題点を克服し,より精度の良い推薦システムを構築することを目的とする.
統計的解析手法としては,主成分分析(PCA) と独立成分分析(ICA) を用いる.これらの手法は,文書の自動分類などの研究において文書間の類似度を計算するための手法としてその有効性が示されている[11][12][13].文書間の類似度計算に用いられる考え方を閲覧履歴間の類似度計算に応用することは,有効と考えられる.

今後の課題としては以下のようなものが挙げられる.

  • 実データの質の向上
  • 被験者を増やしての評価実験
  • 長い期間の履歴データを用いた実験
  • 閲覧コンセプトの提示方法の開発
  • ファイル

    http://sp.ice.uec.ac.jp/thesis/tsuruhara_master.pdf