投稿日:2018/05/13 更新日: WWW 論文紹介

【論文紹介】 Through a Gender Lens: Learning Usage Patterns of Emojis from Large-Scale Android Users

Zhenpeng Chen, Xuan Lu, Wei Ai, Huoran Li, Qiaozhu Mei, Xuanzhe Liu
WWW 2018
ACM, PDF

概要

性別による絵文字の使い方の違いを分析した論文。絵文字の使い方だけから性別の推定をして、テキスト情報よりも高い精度で性別推定ができることも示した。

分析

Kika Keyboardというスマホ用キーボードアプリの2016/12/4〜2017/2/28のログを使用。ユーザ数は134,419で、入力された絵文字の種類は1,356。83.9%のユーザが絵文字を1回以上入力。アプリの使用開始時に性別を入力するようになっていて、53%が女性で47%が男性。
分析の結果、男性よりも女性の方が絵文字を使う頻度が高いこと、性別ごとの使用頻度の高い10個の絵文字のうち8個は男女で共通していること、女性の方がセンチメント(ポジティブ、ネガティブ)を表す絵文字の使用頻度が高いことなどを示した。ハートに関する絵文字の使用頻度は男性の方が高いのが特徴的な結果。

性別推定

次の3カテゴリの特徴量を使用。

  • Emoji frequency(9次元):絵文字を含むメッセージの割合や、一つのメッセージに含まれる絵文字の数の最大値など。
  • Emoji preference(1,356次元):全絵文字に対する各絵文字の使用頻度の割合。
  • Sentiment expression(5次元):ポジ・ネガそれぞれの絵文字を含むメッセージの割合など。

いくつかの分類器で精度を比較し、Gradient Boosting Classifierが最も高い精度で男性、女性ともに8割前後の正答率であった。テキストを使った性別推定手法とも比較し、絵文字を使った方が推定精度が高いことを示した。

感想

絵文字関連の論文を読んだのは恐らくこれが初めて。研究対象としては最近盛んに取り上げられていることは知っていたので、絵文字の性別間での使用傾向の差異という、割と基本的な分析がこれまで行われてなかったというのは意外だった。


-WWW, 論文紹介
-, , , ,

関連記事

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …

Improving the exploration of tag spaces using automated tag clustering

Radelaar, Joni Boor, Aart-Jan Vandic, Damir Van Dam, Jan-Willem Hogenboom, Frederik Frasincar, Flavi …

Can social features help learning to rank youtube videos?

Chelaru, Sergiu Viorel Orellana-Rodriguez, Claudia Altingovde, Ismail Sengor In Proc. of WISE 2012 概 …

【論文紹介】LARM: A Lifetime Aware Regression Model for Predicting YouTube Video Popularity

Changsha Ma and Zhisheng Yan and Chang Wen Chen CIKM 2017 PDF 概要 YouTubeに投稿された動画の、投稿後の短時間(1日とか1時間)で得 …

Topic-Driven Reader Comments Summarization

Ma, Zongyang and Sun, Aixin and Yuan, Quan and Cong, Gao In Proc. of CIKM 2012 概要 ニュース記事のコメントをトピックごと …