投稿日: SIGIR 論文紹介

Ready to buy or just browsing?: detecting web searcher goals from interaction data

Guo, Qi
Agichtein, Eugene
In Proc. of SIGIR 2010
http://dl.acm.org/citation.cfm?id=1835473

概要

ユーザの検索中の振る舞い(マウスのポインタの位置やスクロールの有無)から,ユーザの検索意図を推定することが目的.
この論文では特に,あるクエリを入力したユーザの意図が調べ物なのか,購入なのかを区別することを目的としている.例えば,blackberryというクエリが入力されたときに,blackberryの製品を購入することが目的のユーザには広告を提示し,blackberryについて調べているユーザには広告を表示しないといったことをすることでユーザのストレスを軽減できる.

手法

タスクの定義:1つ前のクエリと1語以上共通した語が存在する一連のクエリ集合.
使用する特徴量は検索結果ページでの行動のみで,クリックしたページ内での行動は無視.ブラウザを拡張してデータを収集.
機械学習により検索意図を推定する.素性は計127個で大きく6個のグループに分けられる.

  1. クエリ(4個)クエリ長,TLD(.com等)の有無,等
  2. SERPデータ(3個)広告部分のテキスト長,非広告部分のテキスト長さ,等
  3. 検索結果の質(7個)広告の数,検索結果のスニペットに含まれるクエリの数,等
  4. ユーザの行動(99個)マウスを動かす速さ,スクロール量,1つ目の検索結果をクリックするまでの時間,等
  5. クリックデータ(7個)クリックされたURLのユニグラム,ページ滞在時間が30秒以上の「成功」URL,等
  6. コンテキスト(7個)タスクで最初に入力されたクエリか,前のクエリに語を追加したクエリか,等

実験

  • 実験1:調べ物と購入の検索意図の分類
    10人の被験者が自分の好きな製品について調べ物をするタスクと購入するタスクに取り組む.各ユーザの最初から90%のデータをSVMの教師データとして使い,残り10%について調べ物と購入のどちらか推定.全ての素性を使った場合の精度は97%.最も有効な素性はSERPデータであった.

  • 実験2:購入を目的とした検索における広告のクリック率の検証.
    440人のユーザの図書館での検索データ使用.分類には先ほどの実験でつくられたSVMを使用.結果は,調べ物で広告がクリックされる割合が4.1%に対して購入では9.7%と仮説通りの結果に.

  • 実験3:広告のクリックの有無の推定
    上記の440人のデータを用いてCRFにより推定.全体の80%を訓練に使用.実験の結果,全素性を使用した場合,適合率15%,再現率21%でクリックの有無を推定可能.


-SIGIR, 論文紹介
-,

関連記事

Modeling User Interest and Community Interest in Microbloggings: An Integrated Approach

Tuan-Anh Hoang In Proc. of PAKDD 2015 概要 ツイッターユーザの興味と所属するコミュニティを、ユーザのツイート内容と振る舞い(リツイート、メンション、ハッシュタグの …

【論文紹介】Modeling Paying Behavior in Game Social Networks

Fang, Zhanpeng and Zhou, Xinyu and Tang, Jie and Shao, Wei and Fong, A.C.M. and Sun, Longjun and Din …

Personalized Models of Search Satisfaction

Ahmed Hassan Ryen W. White In Proc. of CIKM 2013 概要 ユーザが検索セッションに対して満足したか,不満足だったかを知ることは検索エンジンの質を高めるうえ …

Measuring Pair-Wise Social Influence in Microblog

Zibin Yin Ya Zhang In Proc. of SocialCom 2012 概要 Weibo上でのリツイートのモデル化を提案。提案モデルを使うことで、ユーザAのツイートがフォロワーのユ …

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew Dominowska, Ewa Ragno, Robert In Proc. of WWW2007 概要 検索結果の横に表示される広告のCTRの推定を目的として …