寺田研究室学生部屋ページ > 論文 > 1文字タグづけ手法実現のための重要語抽出アルゴリズムの提案

1文字タグづけ手法実現のための重要語抽出アルゴリズムの提案


著者

田中 英人

論文名

1文字タグづけ手法実現のための重要語抽出アルゴリズムの提案

発表年月

2012年2月

発表学会等

電気通信大学平成23年度修士論文

概要

長大な文書情報が多く存在する近年のWeb 上においては,適切な文書管理能力 が必要とされている.特に,効率的な情報検索を行なうためには,あらかじめ文書 に対して付加情報を持たせておく方法が考えられる.その一つとして要約生成の 技術が挙げられる.文書の大まかな内容を表す簡潔な要約が付随していれば,全 文には目を通さなくとも要点を把握することができ,情報検索において取捨選択 の手助けとなりうる.また,要約は一般的に文章ベースで生成されるのに対し,単 語やフレーズ単位で重要語を与えるキーワード抽出の概念がある.キーワードに ついても要約と同様,文書の内容および特徴を簡潔に表す際に用いられることが 多い.

もう一つの文書整理の手段として,タグを付加する手法が挙げられる.内容が 関連した複数の文書に同一のタグをつけることで文書間に関係性を持たせること が可能であり,大まかなカテゴリ分類を行なうことができる.したがって,文書 を特徴づける適切なタグが付加されていることにより,管理および検索への効果 が期待される.

本研究では,以上に挙げたキーワード抽出技術およびタグづけの技術を組み合 わせることで,文書に対するタグを自動抽出する技術に着目する.

ファイル

http://sp.ice.uec.ac.jp/thesis/tanaka_master.pdf