投稿日: SIGIR 論文紹介

Using preference judgments for novel document retrieval

Chandar, Praveen
Carterette, Ben
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348398

概要

検索結果の多様化に関する研究でこれまで前提とされていた,「新しいサブトピックを含み,既に選ばれた文書とサブトピックの重複がない文書が好ましい」という考えが本当に正しいのかを検証することを目的としている.

検証方法

あるトピックに関する文書を評価者に1つ見せ,その下に2つの文書を並べて見せたときに,どちらがより好まれるかをもとに検証を行う.より具体的には,以下の3点について検証を行う.
ただし,D_{T}は最初に見せる文書で,D_{L}D_{R}はそれぞれD_{T}の下に表示される左の文書と右の文書を表す.また,S_{i}はサブトピックを表す.

・仮説1
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2}\},\{S_{1}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(重複よりも新規性の方が好まれる.)

・仮説2
 もし<D_{L},D_{R}|D_{T}> = <\{S_{1},S_{2}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性のみよりも新規性+重複の方が好まれる.)

・仮説3
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2},S_{3}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性が1つだけよりも,新規性が2つある方が好まれる.)

各仮説に対して6つのトピックを用意し,さらに各トピックに対してD_{T}D_{L}D_{R}の組を4つずつ用意する.
評価にはAmazon Mechanical Turkを利用し,1つの組を5人が評価する.

結果

仮説1に関しては,新規性の方が好まれるであろうという予想に反して,差はなかった.仮説2と3については,予想通りの結果で,新規性のみよりも新規性+重複の方が好まれ,新規性が1つだけよりも新規性が2つある方が好まれる,という結果になった.


-SIGIR, 論文紹介
-

関連記事

A New Semantic Similarity Measuring Method Based on Web Search Engines

Lu, Gang Huang, Peng He, Lijun Cu, Changyong Li, Xiaobo In W. Trans. on Comp. vol. 9 http://dl.acm.o …

Your neighbors affect your ratings: on geographical neighborhood influence to rating prediction

Hu, Longke and Sun, Aixin and Liu, Yong In Proc. of SIGIR 2014 概要 店sの周辺の店の情報を利用することで、ユーザuのsに対するレーティン …

【論文紹介】Online Actions with Offline Impact: How Online Social Networks Influence Online and Offline User Behavior

Althoff, Tim and Jindal, Pranav and Leskovec, Jure In Proc. of WSDM 2017 概要 スマホのArgusという活動記録アプリのログから …

Fusion Helps Diversification

Liang, Shangsong and Ren, Zhaochun and de Rijke, Maarten In Proc. of SIGIR 2014 概要 検索結果を多様化する際に、複数の検 …

It Is Not Just What We Say, But How We Say Them: LDA-based Behavior-Topic Model

Qiu, Minghui and Zhu, Feida and Jiang, Jing In Proc. of SDM 2013 概要 トピックモデルを用いて文書の生成過程をモデル化する際、通常は文書 …