投稿日: SIGIR 論文紹介

Your neighbors affect your ratings: on geographical neighborhood influence to rating prediction

Hu, Longke and Sun, Aixin and Liu, Yong
In Proc. of SIGIR 2014

概要

sの周辺の店の情報を利用することで、ユーザusに対するレーティング(星1~5)の予測を目的とした論文。

先行研究との違い

ユーザのアイテムに対するレーティングから行列を作成してmatrix factorization(MF)を適用する手法や、ユーザ間の影響を考慮したMFは提案されてきたが、地理的な情報を考慮してMFに適用したのはこの研究が初めて。

手法の概要

ユーザuの店sに対するレーティングを予測する際に、通常のMFに以下の要素を加えることで拡張。

  1. sの周辺k件の店の情報(各店を20次元に圧縮したベクトルで表現)。予備調査から、sに対するレーティングと周辺の店のレーティングには弱い相関があることがわかっており、この要素を加えた。
  2. sの属するカテゴリ情報(各カテゴリを20次元に圧縮したベクトルで表現)。各カテゴリに対するuの好みを考慮。
  3. sに対する他のユーザのレビュー文情報(各単語を20次元に圧縮したベクトルで表現)。
  4. sの人気度(レビュー数とチェックイン数の和)。
  5. uの”home location”とsの距離。

評価

Yelpの公開データを使用して、通常の推薦の研究と同様、テストデータにおけるMAEとRMSEを評価。
実験の結果、要素1~4を組み合わせた手法が最も精度が高く、要素5を取り入れると精度が悪化した。これは、ユーザが普段活動している場所からの距離はレーティングには無関係であることを表している。


-SIGIR, 論文紹介

関連記事

Analyzing and evaluating query reformulation strategies in web search logs

Huang, Jeff Efthimiadis, Efthimis N. In Proc. of CIKM2009 http://dl.acm.org/citation.cfm?id=1645966 …

【論文紹介】Identifying Informational vs. Conversational Questions on Community Question Answering Archives

Ido Guy, Victor Makarenkov, Niva Hazon, Bracha Shapira WSDM 2018 ACM, PDF 概要 Yahoo Answersに投稿された質問がi …

【論文紹介】Fun Facts: Automatic Trivia Fact Extraction from Wikipedia

Tsurel, David and Pelleg, Dan and Guy, Ido and Shahaf, Dafna WSDM 2017 ACM, PDF 概要 人物名を対象として、Wikiped …

Semantic Role Labeling of Emotions in Tweets

Saif M. Mohammad Xiaodan Zhu Joel Martin In Proc. of WASSA 2014 概要 これまでにも、ツイートに含まれる感情を推定する研究は行われてきたが …

Everyday Life Music Information-Seeking Behaviour of Young Adults

Audrey Laplante J. Stephen Downie In Proc. of ISMIR 2006 概要 20人の若者を対象に、新しい音楽を探す際にとる行動についてインタビューを行い、結 …