投稿日:2012/10/21 更新日: WWW 論文紹介

Learning from the Past: Answering New Questions with Past Answers

A. Shtok, G. Dror, Y. Maarek, and I. Szpektor
In Proc. of WWW 2012
http://dl.acm.org/citation.cfm?id=2187939

目的

Yahoo! Answersの過去の質問とベストアンサーを再利用して,未回答の質問に適した回答を発見することが目的.

手法

手法は大きく2つの段階から成る.
まず,未回答の質問と最も類似した過去の質問を見つける.
次に,最も類似した質問に対するベストアンサーが,未回答の質問に対する回答として適切かをSVMにより判定する.

1段階目では,質問のタイトルと本文をもとにTF-IDFベクトルを作り,コサイン類似度により類似度を測っている.

2段階目では,95個の素性を使っているが,有効な素性は論文中で「Query Feedback」と呼ばれるものであった.この素性では,CQA内での検索結果の重複度合いを用いており,例えば未回答の質問をクエリとした検索結果と1段階目で求められた質問をクエリとした検索結果の重複度などがある.

実験

実験では,SVMの教師データ作成にはAmazon Mechanical Turkを使用.交差検定の結果,分類精度は80%程度.
また,新しく投稿された質問に対して提案手法で自動的に回答するロボットを作って実際にYahoo! Answersで回答を投稿してみると,人間が回答するよりも高い確率でベストアンサーに選ばれた.


-WWW, 論文紹介
-

関連記事

【論文紹介】Precision-Oriented Evaluation of Recommender Systems: An Algorithmic Comparison

Alejandro Bellogín, Pablo Castells, Iván Cantador RecSys 2011 ACM, PDF 概要 推薦結果の評価をする際に、テストデータの作り方の違い …

【論文紹介】Bartering Books to Beers: A Recommender System for Exchange Platforms

Rappaz, Jérémie and Vladarean, Maria-Luiza and McAuley, Julian and Catasta, Michele WSDM 2017 ACM, P …

【論文紹介】Exploiting Geographical Influence for Collaborative Point-of-Interest Recommendation

Ye, Mao and Yin, Peifeng and Lee, Wang-Chien and Lee, Dik-Lun SIGIR 2011 ACM, PDF 概要 POIに対するユーザの興味、友 …

Who uses web search for what: and how

Weber, Ingmar Jaimes, Alejandro In Proc. of WSDM 2011 http://dl.acm.org/citation.cfm?id=1935839 概要 Y …

Fighting search engine amnesia: reranking repeated results

Shokouhi, Milad White, Ryen W. Bennett, Paul Radlinski, Filip In Proc. of SIGIR 2013 http://dl.acm.o …