投稿日:2017/06/05 更新日: CIKM 論文紹介

【論文紹介】Regularising Factorised Models for Venue Recommendation using Friends and their Comments

Manotumruksa, Jarana and Macdonald, Craig and Ounis, Iadh
CIKM 2016
ACM, PDF

概要

グラスゴー大学のIadh Ounisのグループの論文。ユーザにPOIを推薦する際に、全ユーザのPOIへのレーティング情報に加えて、全ユーザのPOIへのコメント情報も利用できるようにMatrix Factorization(MF)を拡張した。

手法

ユーザがPOIにレーティングとコメントを投稿できる位置情報サービスを想定。Word2Vecを用いて、コメント内の各単語を100次元のベクトルで表し、ひとつのコメントはコメント内の全単語のベクトルの和で表す。これによりコメント間の類似度を100次元ベクトルのコサイン類似度で計算可能になる。さらに、2ユーザ間の類似度は、両ユーザが共にコメントを残した場所に対するコメント類似度の平均値により求める。

行がユーザ、列が場所、要素がレーティング、の行列に対する通常のMFに、コメントが類似した友人同士は潜在ベクトルも類似する、という制約を加えた拡張を行う。「コメントが類似したユーザ同士」ではなく、あくまでも友人関係にあるユーザとのコメント類似度だけを考慮する。

評価

Yelpの公開データを使用。レーティングの予測精度をRMSEとMAEで評価。比較手法として、友人とのレーティングの類似度を考慮して、レーティングの類似した友人同士は潜在ベクトルも類似する、という制約をMFに加えた手法を使用(Hao Maによって提案された手法)。また、提案手法において、Word2Vecの代わりにBag-of-Words(BoW)を用いてコメントをベクトル表現し(要素は各単語の出現回数)、コメント間の類似度を測る手法とも比較。
実験の結果、提案手法が最も高い精度を示し、Hao Maの手法に比べてRMSEを2.99%、BoWの手法に比べてRMSEを6.26%改善することができた。


-CIKM, 論文紹介
-, ,

関連記事

Lessons from the Journey: A Query Log Analysis of Within-Session Learning

Carsten Eickhoff Jaime Teevan Ryen White Susan T. Dumais In Proc. of WSDM 2014 概要 ユーザの検索トピックに対する専門度は …

Emotional Divergence Influences Information Spreading in Twitter

Rene Pfitzner Antonios Garas Frank Schweitzer In Proc. of ICWSM 2012 概要 ツイッターでリツイートされやすいツイートの性質を、ツイー …

Modeling User Interest and Community Interest in Microbloggings: An Integrated Approach

Tuan-Anh Hoang In Proc. of PAKDD 2015 概要 ツイッターユーザの興味と所属するコミュニティを、ユーザのツイート内容と振る舞い(リツイート、メンション、ハッシュタグの …

Improving relevance judgment of web search results with image excerpts

Li, Zhiwei Shi, Shuming Zhang, Lei In Proc. of WWW2008 http://dl.acm.org/citation.cfm?id=1367497.136 …

Time-critical search

Mishra, Nina and White, Ryen W. and Ieong, Samuel and Horvitz, Eric In Proc. of SIGIR 2014 概要 一緒にいる人 …