投稿日: SIGIR 論文紹介

Using preference judgments for novel document retrieval

Chandar, Praveen
Carterette, Ben
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348398

概要

検索結果の多様化に関する研究でこれまで前提とされていた,「新しいサブトピックを含み,既に選ばれた文書とサブトピックの重複がない文書が好ましい」という考えが本当に正しいのかを検証することを目的としている.

検証方法

あるトピックに関する文書を評価者に1つ見せ,その下に2つの文書を並べて見せたときに,どちらがより好まれるかをもとに検証を行う.より具体的には,以下の3点について検証を行う.
ただし,D_{T}は最初に見せる文書で,D_{L}D_{R}はそれぞれD_{T}の下に表示される左の文書と右の文書を表す.また,S_{i}はサブトピックを表す.

・仮説1
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2}\},\{S_{1}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(重複よりも新規性の方が好まれる.)

・仮説2
 もし<D_{L},D_{R}|D_{T}> = <\{S_{1},S_{2}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性のみよりも新規性+重複の方が好まれる.)

・仮説3
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2},S_{3}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性が1つだけよりも,新規性が2つある方が好まれる.)

各仮説に対して6つのトピックを用意し,さらに各トピックに対してD_{T}D_{L}D_{R}の組を4つずつ用意する.
評価にはAmazon Mechanical Turkを利用し,1つの組を5人が評価する.

結果

仮説1に関しては,新規性の方が好まれるであろうという予想に反して,差はなかった.仮説2と3については,予想通りの結果で,新規性のみよりも新規性+重複の方が好まれ,新規性が1つだけよりも新規性が2つある方が好まれる,という結果になった.


-SIGIR, 論文紹介
-

関連記事

【論文紹介】How Much Novelty is Relevant?: It Depends on Your Curiosity

Zhao, Pengfei and Lee, Dik Lun In Proc. of SIGIR 2016 概要 心理学の分野では、対象物の刺激が強すぎても弱すぎても人は惹き付けられず、中程度のとき最 …

Who uses web search for what: and how

Weber, Ingmar Jaimes, Alejandro In Proc. of WSDM 2011 http://dl.acm.org/citation.cfm?id=1935839 概要 Y …

Everyday Life Music Information-Seeking Behaviour of Young Adults

Audrey Laplante J. Stephen Downie In Proc. of ISMIR 2006 概要 20人の若者を対象に、新しい音楽を探す際にとる行動についてインタビューを行い、結 …

【論文紹介】Identifying Informational vs. Conversational Questions on Community Question Answering Archives

Ido Guy, Victor Makarenkov, Niva Hazon, Bracha Shapira WSDM 2018 ACM, PDF 概要 Yahoo Answersに投稿された質問がi …

TwitterRank: Finding Topic-sensitive Influential Twitterers

Weng, Jianshu Lim, Ee-Peng Jiang, Jing He, Qi In Proc. of WSDM 2010 http://dl.acm.org/citation.cfm?i …