投稿日: その他 論文紹介

Modeling documents as mixtures of persons for expert finding

Serdyukov, Pavel
Hiemstra, Djoerd
In Proc. of ECIR2008
http://dl.acm.org/citation.cfm?id=1793313

概要

ユーザが入力したクエリに関する専門家の発見を目的とした論文。専門家の候補は与えられており、クエリに関して専門度の高い順に専門家がランキングされてユーザに提示される。

モデル

専門家をe、クエリ内の単語をq_{1},\cdots ,q_{k}としたときに、P(e,q_{1},\cdots ,q_{k})の値が大きい専門家を求めることが目的。従来モデルでは以下のように専門家と文書内の単語が切り離されていた。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(D)P(e|D) \prod_{i=1}^{k}P(q_{i}|D)
これに対して提案モデルでは、以下のように専門家が単語を生成する。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(q_{1},\cdots ,q_{k}|e)P(e|D)P(D)
1つの文書内の各単語は、その文書内に名前やメールアドレスのある複数の専門家の影響を受けて生成されていると考える。つまり、各専門家の語生成モデルの重ねあわせを考える。
この考えに基づき、P(w|e)およびP(e|D)をEMアルゴリズムにより求める。

P(e)=\sum_{D\in R}P(e|D)P(D)であるので、P(e)=1/専門家の総数、とするシンプルな方法もあるが、実験の結果はP(e|D)を計算した方が高精度であった。


-その他, 論文紹介

関連記事

AutoWeb: automatic classification of mobile web pages for revisitation

Liu, Jie Xu, Wenchang Shi, Yuanchun In Proc. of MobileHCI 2012 http://dl.acm.org/citation.cfm?id=237 …

How smart does your profile image look? Estimating intelligence from social network profile images

Wei, Xingjie and Stillwell, David In Proc. of WSDM 2017 概要 Facebookの1,122ユーザを対象にして、(1)ユーザのIQ、(2)ユーザの …

Tourist Trip Planning Functionalities: State–of–the–Art and Future

Souffriau, W. Vansteenwegen, P. In Current Trends in Web Engineering http://link.springer.com/chapte …

Explainable User Clustering in Short Text Streams

Zhao, Yukun and Liang, Shangsong and Ren, Zhaochun and Ma, Jun and Yilmaz, Emine and de Rijke, Maart …

On a Topic Model for Sentences

Balikas, Georgios and Amini, Massih-Reza and Clausel, Marianne In Proc. of SIGIR 2016 概要 通常のLDAでは文書ご …