投稿日:2017/06/02 更新日: その他 論文紹介

【論文紹介】Matrix factorization techniques for context aware recommendation

Baltrunas, Linas and Ludwig, Bernd and Ricci, Francesco
RecSys 2011
ACM, PDF

概要

コンテキストによるバイアスを考慮したレーティング予測モデルを提案した論文。たとえば、「清水寺」に対するレーティングは、「天気」というコンテキストが「晴れ」の場合はレーティングが高くなるように、「雨」の場合は低くなるようなバイアスを考慮しつつ予測できるようになる。「天気」以外にも「場所」や「時間帯」など、複数のコンテキストを同時に考慮可能なモデルになっている。

手法

基本的には、通常のMatrix Factorizationに、コンテキストによるバイアス項が加わっただけのシンプルなモデル。コンテキストをどの粒度で考慮するかに応じて3種類のモデルを提案している。

  1. アイテムを無視してコンテキストのみ考慮
    「清水寺」であろうと「京都タワー」であろうと、「天気」というコンテキストが「晴れ」であれば一貫してレーティングが高くなるようなバイアスがかかる、といったように、アイテムを無視してコンテキストのみ考慮したモデル。粒度は粗いがパラメータ数は少なくて済む。
  2. アイテムとコンテキストのペアを考慮
    「清水寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかり、「京都タワー」は「晴れ」のときはレーティングが低くなるようなバイアスがかかる、といったように、各アイテムの各コンテキストを考慮したモデル。粒度は細かいがパラメータ数は多くなる。
  3. アイテムのカテゴリごとのコンテキストを考慮
    「清水寺」や「金閣寺」を「寺」カテゴリとして扱い、「寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかる、といったように、アイテムのカテゴリごとにコンテキストを考慮したモデル。粒度、パラメータ数ともに上記の二つのモデルの中間。

評価

コンテキストを考慮したレーティング予測をする際に一般的に用いられるテンソル分解と、モデル(2)を比較。テンソル分解には、コンテキストの数に応じてパラメータ数が指数関数的に増加するというデメリットがある。モデル(2)はパラメータ数はコンテキストの数に対して線形に増加。映画のデータセットを用いた評価実験では、モデル(2)の方がテンソル分解を上回った。

続いて、モデル(1)~(3)を、観光値と音楽のデータセットを用いて比較。いずれもカテゴリ情報はデータセットに含まれている(音楽であればジャンル)。評価の結果、モデル(3)が最も高い精度を示した。


-その他, 論文紹介
-, ,

関連記事

【論文紹介】I’ll Be Back: On the Multiple Lives of Users of a Mobile Activity Tracking Application

Zhiyuan Lin, Tim Althoff, Jure Leskovec WWW 2018 ACM, PDF 概要 Argusというスマホのダイエット用アプリのログを使って、ユーザのengage …

Spatio-Temporal Topic Modeling in Mobile Social Media for Location Recommendation

Bo, Hu and Mohsen, Jamali and Martin, Ester In Proc. of ICDM 2013 概要 チェックインサービス等でのユーザと場所と時刻を考慮したモデル化 …

Tagging Your Tweets: A Probabilistic Modeling of Hashtag Annotation in Twitter

Ma, Zongyang Sun, Aixin Yuan, Quan Cong, Gao In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id= …

【論文紹介】From Popularity Prediction to Ranking Online News

Alexandru TatarEmail, Panayotis Antoniadis, Marcelo Dias de Amorim, Serge Fdida Social Network Analy …

Personalized Diversification of Search Results

D. Vallet and P. Castells In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348396 目的 検索結果の多 …