投稿日: その他 論文紹介

Happy, Nervous or Surprised? Classification of Human Affective States in Social Media

Munmun De Choudhury
Michael Gamon
Scott Counts
In Proc. of ICWSM 2012

概要

ツイートを11種類の感情に分類することを目的とした論文。

感情情報の取得

ANEWやLIWCなどから、感情語の候補となる語を収集し、それぞれの語が感情を表しているかどうかをクラウドソーシングで調べ、172の感情語を取得。
分類の対象とする感情として、PANAS-Xで定義された11種類(fear、sadness、guilt、hostility、joviality、self assurance、attentiveness、shyness、fatigue、surprise、serenity)を使用。先ほどの172語が11種類のどれに対応するかをクラウドソーシングでラベル付け。jovialityやsadness、fatigueに属する語が多い。

ツイートの感情の分類

分類に使用するデータとして、ツイートの最後に172語のいずれかをハッシュタグとして持つ680万ツイートを収集。各ツイートをユニグラムとバイグラムを要素とするベクトルで表し、交差検定を用いてロジスティック回帰で各ツイートが11種類の感情のどれに属するかを分類。
分類の結果、jovialityやfatigueのように、対応する語が多い感情ほど、教師データの数が多くなるため、分類精度が高い傾向にあった。


-その他, 論文紹介

関連記事

Fighting search engine amnesia: reranking repeated results

Shokouhi, Milad White, Ryen W. Bennett, Paul Radlinski, Filip In Proc. of SIGIR 2013 http://dl.acm.o …

A comparison of visual and textual page previews in judging the helpfulness of web pages

Aula, Anne Khan, Rehan M. Guan, Zhiwei Fontes, Paul Hong, Peter In Proc. of WWW2010 http://dl.acm.or …

Fusion Helps Diversification

Liang, Shangsong and Ren, Zhaochun and de Rijke, Maarten In Proc. of SIGIR 2014 概要 検索結果を多様化する際に、複数の検 …

Regularization of Latent Variable Models to Obtain Sparsity

Ramnath Balasubramanyan, William W. Cohen In Proc. of SDM 2013 概要 LDAのようなトピックモデルでは、単語が所属するトピックの分布や、文 …

A Study of Mobile Search Queries in Japan

Ricardo Baeza-yates Georges Dupret Javier Velasco In Proc. of WWW2007 概要 デスクトップ検索とモバイル検索の日本語のクエリログに着 …