ktsukuda-0415 のすべての投稿

推薦理由の多様化

概要

この研究では、ユーザにアイテムを推薦する際に、アイテムの多様化に加えて、推薦理由も多様化するための手法を提案しています。下図のようにアーティストの推薦システムを例にとると、推薦理由というのは「The Beatlesはあなたの好きなアーティストOasisに似ているのでお薦めです」のような「アーティストベース」のものや、「The Beatlesはあなたの友人のTomが好きなアーティストなのでお薦めです」のような「友人ベース」のものがあり、全部で7種類の推薦理由を扱っています。

UGC recommendation



ロックが大好きでポップも少し好きというユーザに対して、一番左の推薦リストのように、ロックのアーティストばかりを上位に推薦すると、ユーザが「今はポップ系のアーティストの曲を聴きたい」という意図を持っているときに対応できません。そこで、アーティストのタグを使うことで、真ん中の推薦リストのように、ロックだけでなくポップに関連するアーティストも推薦されるようにします。
しかし、2位と3位のポップ系のアーティストには、いずれもアーティストベースとタグベースの推薦理由が提示されているため、ユーザがこれらの推薦理由は説得力に欠けると感じると、いずれのアーティストも聴かれない可能性があります。そこで、右の推薦リストのように、アーティストの多様化に加えて推薦理由も多様化することで、ポップ系のアーティストに別々の推薦理由が提示されるようにします。こうすることで、友人ベースの推薦理由に説得力があると思っているユーザであっても、聴きたくなるアーティストを1組は見つけられる可能性を高くしています。

推薦時にアイテムの多様化を行う研究はこれまでにも取り組まれていましたが、推薦理由の多様化に初めて着目し、そのための手法を提案した点がこの研究の貢献のひとつです。推薦理由の多様化手法では、推薦リスト内での任意のアイテム間の推薦理由の多様化に加えて、類似したアイテム間では類似した推薦理由が提示されないように推薦理由を多様化するという工夫をしています。より詳細な内容は下にある論文PDFをご覧ください。

発表論文

  • K. Tsukuda and M. Goto
    DualDiv: Diversifying Items and Explanation Styles in Explainable Hybrid Recommendation
    Proceedings of the 13th ACM Conference on Recommender Systems (RecSys 2019), pp.398-402, Sep. 2019.
    [Paper] [Poster]

発表資料

RecSys2019論文読み会の発表資料です。


RecSys 2019のポスター発表用資料です。

クリエータのコラボレーション分析

概要

この研究では、複数人のクリエータが協力してひとつの動画コンテンツを創作する「コラボレーション」に関する分析をしています。ニコニコ動画に投稿された動画の中でも、VOCALOIDを用いて創作された楽曲を歌ったり、踊ったり、演奏したりする「派生動画」におけるコラボレーションを扱っています。



分析はコラボレーションと(1)動画の視聴のされ方との関係、(2)クリエータの活動との関係、(3)クリエータの特性との関係、といった観点から行いました。代表的な結果を以下に記述します。

動画の視聴のされ方との関係
コラボレーションによって創作された動画(コラボ動画)と、一人のクリエータによって創作された動画(非コラボ動画)の再生数の分布を調べると下図のようになりました。コラボ動画の方が分布が右に偏っていることから、コラボ動画の方が再生数が多い傾向にあることがわかりました。コラボ動画の場合、創作に関わった各クリエータの動画を日頃視聴して
いるユーザが同じコラボ動画を視聴するために再生数が多くなるのではないかと推測されます。


クリエータの活動との関係
コラボレーション動画を一度でも創作した経験のあるクリエータと、一度も経験したことのないクリエータの活動期間の長さの分布を調べると下図のようになりました。クリエータの活動期間は、その人の最初の動画投稿日と最新の動画投稿日の差により定義しています。図から、コレボレーションの経験したクリエータの方が活動期間が長い傾向にあることがわかりました。現状では相関があることだけがわかっており、因果関係までは検証できていませんが、コラボレーションを経験した結果として活動期間が長くなることが明らかになれば、より容易にコラボレーションができるような環境づくりをしてクリエータ間のコラボレーションを支援する研究への発展などが期待できます。


より詳細な内容は下にある論文PDFをご覧ください。

発表論文

  • S. Hironaka, K. Tsukuda, M. Hamasaki, and M. Goto
    Collaboration in N-th Order Derivative Creation
    Proceedings of the 12th International AAAI Conference on Web and Social Media (ICWSM 2018), pp.608-611, Jun, 2018.
    [Paper]
  • 廣中詩織,佃洸摂,濱崎雅弘,後藤真孝
    N次創作動画におけるクリエータのコラボレーションに関する分析
    ARG 第11回Webインテリジェンスとインタラクション研究会(WI2),2017年12月
    萌芽研究賞
    ステージ発表選出
    [Paper]

依頼講演

  • 廣中詩織,佃洸摂,濱崎雅弘,後藤真孝
    N次創作動画におけるクリエータのコラボレーションに関する分析
    第6回WI2研究会ステージ発表,2018年12月

ユーザ生成コンテンツ推薦

概要

この研究では、ユーザ生成コンテンツ(UGC)を推薦するためのモデルを提案しています。UGCとは、プロのクリエータではない一般の人々によって創作されたコンテンツのことで、YouTubeの動画やFlickrの写真などがその一例としてあげられます。
UGCを扱わない一般的なeコマースサービスなどでは、ユーザは消費者としての役割しか持たないのですが、UGCを扱うWebサービスでは、一人のユーザが消費者としての役割に加えて創作者としての役割も持つのが特徴です。この特徴を活かし、従来の推薦モデルが「ユーザがどのコンテンツを消費したか」という情報だけを使っていたのに対して、提案モデルではその情報に加えて「ユーザがどのコンテンツを創作したか」という情報も使い、それにより推薦精度の改善を実現しました。

猫画像左:by Emma
猫画像右:by CetusPhotography



より具体的には、まず各ユーザに対して消費者に対応するk次元ベクトルと創作者に対応するk次元ベクトルを用意します。そのうえで、ユーザuの消費者としての性質と創作者としての性質が似ていれば、uの消費者ベクトルの値と創作者ベクトルの値が近くなるように目的関数に制約を加えます。
このとき、「uの消費者としての性質と創作者としての性質の類似度」≒「uの消費コンテンツと創作コンテンツの類似度」≒「uの消費コンテンツの消費ユーザとuの創作コンテンツの消費ユーザの類似度」とみなして類似度を測ります。「uの消費コンテンツの消費ユーザ」は下図のユーザ集合Aに、「uの創作コンテンツの消費ユーザ」は下図のユーザ集合Bに相当し、AとBの重複が大きくなるほどuの消費者ベクトルの値と創作者ベクトルの値が近くなるようにベクトルの値を学習します。

実験を通して、提案モデルの推薦精度がRecSys 2018で提案されたUGC推薦の最新手法の精度を上回ることを示しました。
より詳細な内容は下にある論文PDFおよび発表スライドをご覧ください。


発表論文

  • K. Tsukuda, S. Fukayama, and M. Goto
    ABCPRec: Adaptively Bridging Consumer and Producer Roles for User-Generated Content Recommendation
    Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2019), pp.1197-1200, July 2019.
    [Paper] [Poster]
  • 佃洸摂,深山覚,後藤真孝
    ABCPRec:ユーザの消費者としての役割と創作者としての役割の適応的対応付けによるユーザ生成コンテンツ推薦
    ARG 第14回Webインテリジェンスとインタラクション研究会(WI2),2019年6月
    優秀研究賞
    優秀ポスター発表賞
    [Paper] [Slide] [Poster]

招待講演

  • 佃洸摂
    ABCPRec:何を創作したかという情報がコンテンツの消費時に反映されるユーザ生成コンテンツ推薦手法
    第12回Webとデータベースに関するフォーラム(WebDB Forum 2019)先端研究解説セッション2,2019年9月
    [Slide] [Poster]

発表資料

WebDB Forum 2019の登壇発表の資料です。

WebDB Forum 2019のポスター発表の資料です。

DEIM2017で発表した主著論文が最優秀論文賞を受賞しました

データベースコミュニティにおける最大の国内会議DEIM2017で発表した主著論文「Songrium派生要因分析:N次創作活動のモデル化による派生要因鑑賞サービス」が最優秀論文賞を受賞し、2017年6月24日に行われた授賞式に出席してきました。

DEIMの口頭発表には、次の2種類のセッションがあります。(1)博士後期課程の学生、博士号取得希望の学生および社会人、博士号取得後3年以内の若手研究者が対象のPh.Dセッション。(2)それ以外の学生・研究者が対象の一般セッション。最優秀論文賞はPh.Dセッション、一般セッションそれぞれから1本ずつ選ばれます。私は博士号取得後2年半であったため、Ph.Dセッションで発表しました。今回発表した内容の概要はこちらからご覧いただけます。

特にPh.Dセッションでは、トップレベルの国際会議に採択された研究を始めとして、質の高い研究が多いように思います。Ph.Dセッションの他の方の発表を色々と聞きましたが、研究テーマとして面白いことに加えて、技術的にも深いことをしている研究が多く、素直に「みんなすごい研究をしてるな」と思いました。そんな中で、最優秀論文賞の受賞の通知を貰ったときは、喜ぶよりも先に非常に驚きました。我々の論文を評価していただいた委員の皆さまに改めて感謝申し上げます。

今後も、国際会議で発表することはもちろんですが、国内会議でも積極的に発表し続けたいと思います。

DEIM2017実行委員長の東大の豊田先生(左)から賞状をいただきました。
立派な盾もいただきました。

SoC2017 参加報告

2017年6月23日と24日にリクルートテクノロジーズで開催されたSoC2017に参加しました。SoCは「ソーシャルコンピューティング」を指しており、ソーシャルコンピューティングとは、SNSを始めとした、コンピュータを通してコンテンツや人をつなぐ仕組みのことです。SoCでは通常の研究会に比べて、特に企業の方の招待講演が充実しているという特徴があります。今年は、2日間で5件の招待講演があり、1件あたりの発表時間は1時間という充実ぶりでした(プログラム)。以下では、5件の招待講演のうち2件について、簡単な感想とともに紹介します。

仕掛学:データなき世界へのアプローチ

講演者:松村 真宏 先生(阪大)

街中のゴミ箱にバスケットボールのネットを取り付けることで、人がゲーム感覚でゴミを捨てたくなり、ポイ捨てを減らす、というのが「仕掛け」の代表的な例です。講演では冒頭から、世界各地で実際に実施された20個以上もの仕掛けの例をあげていました。沢山の事例を見る中で、思わず行動したくなる仕組みが備わっていれば仕掛けと呼べるのかな、ぐらいに考えていたのですが、例を列挙した後で、仕掛けが満たすべき3つの要件に関する話がありました。以下がその3要件です。

  • 公平性:誰も不利益を被らない
  • 誘引性:思わずその行動を取りたくなる
  • 目的の二重性:仕掛ける側と仕掛けられる側で目的がことなる

ともすると、なんでもかんでも仕掛けなんです、となってしまいかねないのですが、このように要件が明確になっていることで、研究の対象として扱いやすくなっていると感じました。

データを分析することで問題に対処することが盛んに行われていますが、新しい事象に関してはデータが存在しなかったり、人の内面に関してはデータが十分に取れなかったりします。また、ゴミのポイ捨てを減らすためのアイデアは、いくらデータを見ても思いつくものではありません。そういうときこそ仕掛け学が活きる、という話で講演を締めくくられていました。

リクルートグループの現場事例から見るAI/ディープラーニング技術のビジネス活用と、”A3RT” 外部公開の裏側

講演者:奥田 裕樹 さん(リクルートテクノロジーズ)

リクルートテクノロジーズが公開している、機械学習に関するAPI提供サービス「A3RT」に関する講演でした。前半では、どういったAPIが提供されているか、各APIをどのように使うか、を実際に動かしながら説明していました。

後半は、A3RTを作る際の思想に関する話でした。APIを提供する狙いや、サービスとして継続的に提供し続ける上でのポイントといった様々な話の中でも、機械学習によって何をしなければならないかを適切に見極めることの重要性に関する話が印象に残りました。機械学習が流行っているからといって、闇雲に機械学習を使ってAPIを提供するのではなく、機械学習を使うことが有用な問題、解決することがユーザにとって本当に有用な問題を吟味して、APIを提供していることがよくわかりました。講演では、アメリカの心理学者アブラハム・マズローの「ハンマーを持つ人には、すべてが釘に見える。」という言葉と共にこの点の思想が語られていました。

講演のあと、奥田さんと話をする機会があったのですが、このブログの論文紹介記事を見てくださっている、ということを聞いて驚きました。

まとめ

SoCには初めて参加しましたが、研究発表・招待講演ともに、質疑の時間がかなり長くとられている点が非常に良かったです。参加者は100名ほどで規模が大きすぎないこともあり、質問をしやすい雰囲気で、私も何度か質問しました。研究会で複数の企業の方の講演をこれだけじっくり聞けることはあまりないので、来年もタイミングが合えばぜひ参加してみたいです。

Songriumコメント分析:視聴者の反応に基づく動画検索

概要

従来の動画検索では、動画のタイトルやタグに含まれる語をキーワードとして入力して、自分の興味のある動画を探す方法が一般的でした。この研究では、動画に投稿された時刻同期コメントを利用することで、みんなが「かわいい」や「高音綺麗」、「イントロ超かっこいい」などと言っている動画を探すことを実現しました。
より具体的には、コメントの長さや文字バイグラム、類似コメントの数や曲のサビでの生起確率などを素性として機械学習によりコメントの有用度を推定することで、有用度の高い思わず検索に使用したくなるコメントを求めています。

ニコニコ動画に投稿された動画およびコメントを対象として提案手法を適用したWebサービス「Songriumコメント分析」を公開しています。Songriumコメント分析では、サービス側が表示するおすすめのコメントから動画を探したり、自分が興味のあるコメントを直接入力して動画を探したりできます。視聴者の反応を利用することで、より直感的な動画の検索を目指しています。

Songriumコメント分析

Webサービス

Songriumコメント分析

発表論文

  • K. Tsukuda, M. Hamasaki, and M. Goto,
    “SmartVideoRanking: Video Search by Mining Emotions from Time-Synchronized Comments”,
    Proceeding of 2016 IEEE 16th International Conference on Data Mining Workshops (ICDMW 2016), pp.960-969, Dec, 2016.

    [PDF]
  • 佃洸摂,濱崎雅弘,後藤真孝
    SmartVideoRanking:視聴者の時刻同期コメントに基づく動画ランキングシステム
    Webとデータベースに関するフォーラム(WebDB Forum 2015),2015年11月

    [PDF] [Slide]

発表資料


Songrium派生要因分析:N次創作活動のモデル化

概要

この研究では、オリジナルコンテンツから次々と新しい派生コンテンツが創作されるN次創作活動において、派生コンテンツの創作を引き起こした要因を推定するためのモデルを提案しています。
提案モデルでは、クリエータが派生コンテンツを創作する際に次の3つの要因が影響すると考えています:(1)オリジナルコンテンツの魅力、(2)オリジナルコンテンツの人気、(3)派生コンテンツの人気。

ニコニコ動画に投稿されたオリジナルコンテンツおよび派生コンテンツを対象として提案モデルを適用した、派生要因鑑賞サービス「Songrium 派生要因分析」を公開しています。Songrium派生要因分析では、N次創作活動におけるオリジナルコンテンツの特性の可視化、オリジナルコンテンツから派生コンテンツが創作される過程の可視化、クリエータが3つの各要因から受けた影響の大きさの可視化などの機能を提供しています。
動画コンテンツの探索や視聴をする際に、これまでは明らかではなかった、派生コンテンツ間の関係やクリエータの特性を可視化することで、ユーザやクリエータの新たなコンテンツとの出会いやN次創作現象のより深い理解の支援を目指しています。

Webサービス

Songrium 派生要因分析

発表論文

  • K. Tsukuda, K. Ishida, M. Hamasaki, and M. Goto
    Songrium Derivation Factor Analysis: A Web Service for Browsing Derivation Factors by Modeling N-th Order Derivative Creation
    IEICE Transactions on Information and Systems E101-D(4), pp.1096-1106, Apr, 2018.
    [PDF]
  • 佃洸摂,石田啓介,濱崎雅弘,後藤真孝
    Songrium派生要因分析:N次創作活動のモデル化による派生要因鑑賞サービス
    第9回データ工学と情報マネジメントに関するフォーラム(DEIM2017),G7-1,2017年3月
    最優秀論文賞
  • K. Tsukuda, M. Hamasaki, and M. Goto
    Why Did You Cover That Song?: Modeling N-th Order Derivative Creation with Content Popularity
    Proceedings of 25th ACM International Conference on Information and Knowledge Management (CIKM 2016), pp.2239-2244, Oct, 2016.
    [PDF] [Poster]
  • 佃洸摂,濱崎雅弘,後藤真孝
    コンテンツの人気度を考慮したN次創作活動のモデル化
    第9回Webとデータベースに関するフォーラム(WebDB Forum 2016),2016年9月
    山下記念研究賞
    [PDF] [Slide] [Poster]

発表資料

WebDB Forum 2016の発表資料


Lyric Jumper:歌詞のトピックに基づく楽曲探索

概要

これまで、膨大な楽曲の中から興味のある楽曲を探す際には「曲名」「アーティスト名」「歌詞フレーズ」などで検索する方法が一般的でした。それに対してこの研究では、歌詞を解析することで、楽曲ごとのトピック(「青春」「センチメンタル」「大人の恋愛(女性編)」など)を推定し、トピックに基づいて楽曲を探すことを実現しました。

より具体的には、アーティスト、歌詞、単語という3階層の構造を考慮しながら、歌詞でのさまざまな単語の出現の仕方からトピックを解析して、事前に決めた個数のトピック群を推定しています。そのようにして推定したトピックを元に楽曲を探せる歌詞探索サービス「Lyric Jumper」を公開しています。「Lyric Jumper」を使うことで、ユーザーは探し求めているイメージをたどりながら歌詞に出会うことができます。

Lyric Jumper

Webサービス

Lyric Jumper

プレスリリース

報道

コラボレーション

発表論文

  • 佃洸摂,石田啓介,後藤真孝
    Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づき様々な歌詞に出会える歌詞探索サービス
    第22回一般社団法人情報処理学会シンポジウム インタラクション2018, 2018年3月
    [
    PDF] [Slide]
  • K. Tsukuda, K. Ishida, and M. Goto
    Lyric Jumper: A Lyrics-Based Music Exploratory Web Service by Modeling Lyrics Generative Process
    Proceedings of the 18th International Society for Music Information Retrieval Conference (ISMIR 2017), pp.544-551, Dec, 2017.
    [PDF] [Poster]
  • 佃洸摂,石田啓介,後藤真孝
    Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
    第10回Webとデータベースに関するフォーラム(WebDB Forum 2017),2017年9月
    [PDF] [Slide] [Poster]

発表資料

インタラクション2018で使用した発表資料。


WebDB Forum 2017で使用した発表資料。


Taste or Addiction: 音楽の再生モチベーション推定

概要

ある人がある曲を聴いたときに、なぜその人はその曲を聴こうと思ったのか、そのモチベーションの推定を目的とした研究です。人がいつ、どの音楽を聴いたかを表す情報として、この研究ではLast.fmやApple Musicのような音楽配信サービス上での曲の再生情報を利用しています。

音楽を再生するモチベーションは様々だと思いますが、次の二つの要因は特に影響が大きいのではないかと仮定しました。

要因1. 日頃の音楽の好み
ロックが好きな人は日頃からロックを頻繁に聴いたり、懐メロが好きな人は日頃から懐メロを聴いたり、というように、あるジャンルの曲が好きだから聴いた、というものが該当します。

要因2. 特定のアーティストにハマった
自分が普段聴くジャンルからは外れるけれど、テレビであるアーティストの曲を聴いたことがきっかけでそのアーティストに一時的にハマってそのアーティストの曲を聴いたり、友だちからあるアーティストのアルバムを勧められて聴いてみたらハマってしまった、という場合に相当します。このように、日頃の好みとは無関係に、特定のアーティストにハマったことが理由で音楽を聴いた、というものが該当します。同時期に複数のアーティストにハマることも想定しています。

以上の二つの要因を仮定したうえで、あるユーザがある曲を再生したときに、それが要因1と2のどちらの影響によるものかを推定するモデルを提案しました。要因1だけを考慮したモデルはWWW’10で提案されており、それを拡張したモデルとなっています。音楽配信サービスの実際の再生ログを使った実験により、要因1だけを考慮したモデルよりも、要因1と2を考慮したモデルの方が優れていることを示しました。

提案モデルを使うことで、以下に示すような様々なデータを推定できるようになります。

1. 各ユーザの日頃の音楽の好み
ユーザAはロックとジャズを日頃好んで聴いている、ユーザBはヒップホップを日頃好んで聴いている、ということが推定できます。

2. 各ユーザがハマっているアーティスト
ユーザAはAKB48にハマっている、ユーザBはMr.ChildrenとONE OK ROCKにハマっている、ということが推定できます。

3. 時間と各要因の影響度の関係
各ユーザが音楽を再生した時間と各要因の影響力の関係を推定し、その結果を全ユーザについて集約することで、時間と各要因の影響度の一般的な関係を知ることができます。今回用いたデータでは、朝早い時間帯はハマっているアーティストの曲が聴かれやすく、夜の時間帯は日頃の好みに応じた曲が聴かれやすい、という結果が出ました。ここからは推測ですが、朝は忙しいので、好みに応じて色々な曲を聴く余裕がなく、ハマっている特定のアーティストの曲を聴いているのかもしれません。そのため、ユーザに色々なアーティストの曲を推薦するのであれば、夜の方が受け入れられやすい、ということもあるかもしれません。また、土日よりも平日の方が要因2の影響力が大きいという結果も出ており、こちらも、平日は仕事で忙しいからということが影響しているとも考えられます。

発表論文

  • K. Tsukuda and M. Goto,
    “Taste or Addiction?: Using Play Logs to Infer Song Selection Motivation”,
    Proceeding of the 21st Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2017), pp.721-733, May, 2017. [PDF]

発表資料

PAKDD 2017で使用した発表資料。