投稿日: その他 論文紹介

VODUM: A Topic Model Unifying Viewpoint, Topic and Opinion Discovery

Thibaut, Thonet and Guillaume, Cabanac and Mohand, Boughanem and Karen, Pinel-Sauvagnat
In Proc. of ECIR 2016

概要

文書が与えられたときに、文書のviewpoint、文書で触れられているtopic集合、各topicで述べられているopinion集合を求めることを目的とした論文。
語の意味は以下のとおり(論文から引用)。

  • topic: one of the subjects discussed in a document collection.
  • viewpoint: the standpoint of one or several authors on a set of topics.
  • opinion: a wording that is specific to a topic and a viewpoint.

先行研究との違い

以下の4点すべてを同時に考慮した点が新しい。

  • 教師なしのモデル。
  • topicに関する単語(名詞)とopinionに関する単語(動詞、形容詞、形容動詞)を別々に扱う。
  • viewpointが文書レベルで割り当てられる。
  • スレッド情報やユーザ間のインタラクション情報などは必要なく、プレーンテキストの集合を扱える。

文書の生成モデル

以下のような順で単語が記述される生成モデルを提案。

  1. 文書の著者がviewpointを1つ決める。
  2. 文ごとにtopicを1つ決める。
  3. viewpointとtopicの組み合わせに応じて、topicを記述する単語とopinionを記述する単語を決めて文を記述する。

評価方法

使用するデータセットは、Bitterlemonsと呼ばれるサービス上でイスラエル人とパレスチナ人によって記述された297本ずつのエッセイ。したがって、このデータセットではviewpointの数は2となる。
評価では、10-fold cross-validationを行った際のperplexityをベースライン手法と比較している。
また、viewpointの正解データは各文書がイスラエル人かパレスチナ人のどちらによって記述されたかという正解データがあるため、文書ごとに推定されるviewpointの推定精度の評価も行った。


-その他, 論文紹介

関連記事

Contextual queries express mobile information needs

Hinze, Annika M. Chang, Carole Nichols, David M. In Proc. of MobileHCI 2010 http://dl.acm.org/citati …

【論文紹介】Will This Paper Increase Your h-index?: Scientific Impact Prediction

Dong, Yuxiao and Johnson, Reid A. and Chawla, Nitesh V. WSDM 2015 ACM, PDF 概要 2007年に発表された論文dは、論文dの中で …

Semantic Role Labeling of Emotions in Tweets

Saif M. Mohammad Xiaodan Zhu Joel Martin In Proc. of WASSA 2014 概要 これまでにも、ツイートに含まれる感情を推定する研究は行われてきたが …

Modeling User Posting Behavior on Social Media

Xu, Zhiheng Zhang, Yang Wu, Yao Yang, Qing In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id= …

【論文紹介】How Much Novelty is Relevant?: It Depends on Your Curiosity

Zhao, Pengfei and Lee, Dik Lun In Proc. of SIGIR 2016 概要 心理学の分野では、対象物の刺激が強すぎても弱すぎても人は惹き付けられず、中程度のとき最 …