投稿日:2017/06/02 更新日: その他 論文紹介

【論文紹介】Matrix factorization techniques for context aware recommendation

Baltrunas, Linas and Ludwig, Bernd and Ricci, Francesco
RecSys 2011
ACM, PDF

概要

コンテキストによるバイアスを考慮したレーティング予測モデルを提案した論文。たとえば、「清水寺」に対するレーティングは、「天気」というコンテキストが「晴れ」の場合はレーティングが高くなるように、「雨」の場合は低くなるようなバイアスを考慮しつつ予測できるようになる。「天気」以外にも「場所」や「時間帯」など、複数のコンテキストを同時に考慮可能なモデルになっている。

手法

基本的には、通常のMatrix Factorizationに、コンテキストによるバイアス項が加わっただけのシンプルなモデル。コンテキストをどの粒度で考慮するかに応じて3種類のモデルを提案している。

  1. アイテムを無視してコンテキストのみ考慮
    「清水寺」であろうと「京都タワー」であろうと、「天気」というコンテキストが「晴れ」であれば一貫してレーティングが高くなるようなバイアスがかかる、といったように、アイテムを無視してコンテキストのみ考慮したモデル。粒度は粗いがパラメータ数は少なくて済む。
  2. アイテムとコンテキストのペアを考慮
    「清水寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかり、「京都タワー」は「晴れ」のときはレーティングが低くなるようなバイアスがかかる、といったように、各アイテムの各コンテキストを考慮したモデル。粒度は細かいがパラメータ数は多くなる。
  3. アイテムのカテゴリごとのコンテキストを考慮
    「清水寺」や「金閣寺」を「寺」カテゴリとして扱い、「寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかる、といったように、アイテムのカテゴリごとにコンテキストを考慮したモデル。粒度、パラメータ数ともに上記の二つのモデルの中間。

評価

コンテキストを考慮したレーティング予測をする際に一般的に用いられるテンソル分解と、モデル(2)を比較。テンソル分解には、コンテキストの数に応じてパラメータ数が指数関数的に増加するというデメリットがある。モデル(2)はパラメータ数はコンテキストの数に対して線形に増加。映画のデータセットを用いた評価実験では、モデル(2)の方がテンソル分解を上回った。

続いて、モデル(1)~(3)を、観光値と音楽のデータセットを用いて比較。いずれもカテゴリ情報はデータセットに含まれている(音楽であればジャンル)。評価の結果、モデル(3)が最も高い精度を示した。


-その他, 論文紹介
-, ,

関連記事

Collective intelligence in the online social network of yahoo!answers and its implications

Li, Ze Shen, Haiying Grant, Joseph Edward In Proc. of CIKM 2012 http://dl.acm.org/citation.cfm?id=23 …

Who uses web search for what: and how

Weber, Ingmar Jaimes, Alejandro In Proc. of WSDM 2011 http://dl.acm.org/citation.cfm?id=1935839 概要 Y …

A comparison of visual and textual page previews in judging the helpfulness of web pages

Aula, Anne Khan, Rehan M. Guan, Zhiwei Fontes, Paul Hong, Peter In Proc. of WWW2010 http://dl.acm.or …

【論文紹介】VizByWiki: Mining Data Visualizations from the Web to Enrich News Articles

Allen Yilun Lin, Joshua Ford, Eytan Adar, Brent Hecht WWW 2018 ACM, PDF 概要 ニュース記事に関連した画像をWikimediaから …

【論文紹介】LARM: A Lifetime Aware Regression Model for Predicting YouTube Video Popularity

Changsha Ma and Zhisheng Yan and Chang Wen Chen CIKM 2017 PDF 概要 YouTubeに投稿された動画の、投稿後の短時間(1日とか1時間)で得 …