投稿日: CIKM 論文紹介

Supporting Complex Search Tasks

Ahmed Hassan Awadallah
Ryen W. White
Patrick Pantel
Susan T. Dumais
Yi-Min Wang
In Proc. of CIKM2014

概要

複雑なタスクに関するクエリを入力しているユーザに 対して、興味を引く関連のあるタスクを推薦することを目的とした論文。
例えば、「Cheap Flights to Grand Cayman」というクエリを入力したユーザに対して、「Grand Cayman Car Rental」、「Grand Cayman Vacation Rentals」、「Grand Cayman Hurricane Season」などを推薦する。

タスク推薦までの流れ

大きく分けて以下の5つのステップを通してタスクを推薦する。

  1. クエリログからの複雑なタスクを含むセッション抽出
  2. セッション中のクエリからの複雑なタスク抽出
  3. タスクのクラスタリング
  4. タスクをノードとするグラフ構築
  5. グラフ上のrandom walkを用いたタスク推薦

この中でメインとなるのは2である。

セッション中のクエリからの複雑なタスク抽出

まず、用語の定義を以下のようにする。

  • Entity
  • FreebaseとWikipediaに登録されている人物名や組織名。

  • Collocation
  • 連語。{cheap hotels in new york city}というクエリ内のcheap hotelsとnew yorkなどが該当。

  • Preposition
  • 前置詞。

  • Term
  • 上記以外の語。

  • Pivot
  • クエリ内で主題となるような語。「京都 観光」というクエリであれば「京都」が該当。EntityまたはCollocationから成る。

  • Refiner
  • クエリ内で副題となるような語。「京都 観光」というクエリであれば「観光」が該当。CollocationまたはTermから成る。

以上の定義のもとで、「Refiner Preposition Pivot」、「Pivot Refiner」、「Pivot」のいずれかの形を持つクエリを複雑なタスクを表すクエリとして抽出する。

その後、タスク間の編集距離等に基づいてタスクをクラスタリングし、クラスタ内で最もクエリログ中の出現頻度の高いタスクを代表タスクとして、タスクをノードとするグラフを構築する。枝の重みはクエリログ中でのタスクの共起度に基づいて決める。ユーザの入力があれば、入力に対応するノードにのみ初期値を持たせてrandom walkの要領で値を伝播させ、値の大きいタスクから順にユーザに推薦する。

実験

クラウドソーシングを使用。7種類の手法を用意し、各手法で最大8個まで推薦タスクを提示。Relatedness、Interestingness、Diversity、Completenessの各観点において、各手法の推薦するタスクリストの良さを3段階で評価。

また、提案手法で推薦されるタスクと、従来の関連クエリ推薦手法で推薦されるクエリのどちらが良いかを、同じくRelatedness、Interestingness、Diversity、Completenessの観点から評価。実験の結果、Relatednessのみ従来手法が優れていたが、その他3つの観点では提案手法が優れていた。


-CIKM, 論文紹介

関連記事

Towards Better Measurement of Attention and Satisfaction in Mobile Search

Lagun, Dmitry Hsieh, Chih-Hung Webster, Dale Navalpakkam, Vidhya In Proc. of SIGIR2014 http://dl.acm …

【論文紹介】A Peek Into the Future: Predicting the Popularity of Online Videos

Shuxin Ouyang, Chenyu Li, Xueming Li Access, 2016 IEEE, PDF 概要 中国のYouTubeに相当するYoukuの動画を対象にして、動画の投稿後7 …

Efficiently answering top-k typicality queries on large databases

Hua, Ming Pei, Jian Fu, Ada W. C. Lin, Xuemin Leung, Ho-Fung In Proc. of VLDB 2007 http://dl.acm.org …

Predicting the popularity of web 2.0 items based on user comments

He, Xiangnan and Gao, Ming and Kan, Min-Yen and Liu, Yiqun and Sugiyama, Kazunari In Proc. of SIGIR …

Crowdsourcing for relevance evaluation

Alonso, Omar Rose, Daniel E. Stewart, Benjamin In SIGIR Forum, Vol.42, Num.2 http://dl.acm.org/citat …