寺田研究室学生部屋ページ > 論文 > 野球実況ツイートを対象とした機械学習によるネタバレ検知の試み

野球実況ツイートを対象とした機械学習によるネタバレ検知の試み


著者

齊藤 令, 寺田 実

論文名

野球実況ツイートを対象とした機械学習によるネタバレ検知の試み

発表年月

2016年2月

発表学会等

DEIM 2016

概要

あらまし Twitter の自分のタイムラインに現れるスポーツ等の試合状況・結果がわかるネタバレツイートを除去し,ユーザにネタバレを見せないようにしたい. ネタバレと非ネタバレを分類するために, Twitter 上の実況ツイートに着目した. これにはネタバレなツイートと非ネタバレなツイートが混在している. 実況ツイートを利用してネタバレ推定の分類器を作成し, ネタバレなツイートの推定ができないか考えた. 提案手法では, 実況ツイートを収集し, ネタバレか非ネタバレかのラベルをつける. 実況ツイートをBag of Words モデルでベクトル化し, Latent Semantic Indexingによって次元削減を行う. ベクトル化したツイートをサポートベクトルマシンによる機械学習を行い, 分類器を作成する. 本報告では, 提案手法によって実況ツイートをもとに作成した分類器でネタバレツイートを特定できるか検証する.また, ツイートの投稿頻度やユーザの興奮度を特徴に加えたとき, 分類器に変化があるか検証する. 実験では, Twitter上のプロ野球に関する実況ツイートを使用し, ネタバレツイートの推定を試み, 提案手法の有効性を検証した. キーワードTwitter, サポートベクトルマシン, ネタバレ.

ファイル

http://sp.ice.uec.ac.jp/thesis/saitoh_deim2016.pdf