投稿日:2018/05/13 更新日: WWW 論文紹介

【論文紹介】 Through a Gender Lens: Learning Usage Patterns of Emojis from Large-Scale Android Users

Zhenpeng Chen, Xuan Lu, Wei Ai, Huoran Li, Qiaozhu Mei, Xuanzhe Liu
WWW 2018
ACM, PDF

概要

性別による絵文字の使い方の違いを分析した論文。絵文字の使い方だけから性別の推定をして、テキスト情報よりも高い精度で性別推定ができることも示した。

分析

Kika Keyboardというスマホ用キーボードアプリの2016/12/4〜2017/2/28のログを使用。ユーザ数は134,419で、入力された絵文字の種類は1,356。83.9%のユーザが絵文字を1回以上入力。アプリの使用開始時に性別を入力するようになっていて、53%が女性で47%が男性。
分析の結果、男性よりも女性の方が絵文字を使う頻度が高いこと、性別ごとの使用頻度の高い10個の絵文字のうち8個は男女で共通していること、女性の方がセンチメント(ポジティブ、ネガティブ)を表す絵文字の使用頻度が高いことなどを示した。ハートに関する絵文字の使用頻度は男性の方が高いのが特徴的な結果。

性別推定

次の3カテゴリの特徴量を使用。

  • Emoji frequency(9次元):絵文字を含むメッセージの割合や、一つのメッセージに含まれる絵文字の数の最大値など。
  • Emoji preference(1,356次元):全絵文字に対する各絵文字の使用頻度の割合。
  • Sentiment expression(5次元):ポジ・ネガそれぞれの絵文字を含むメッセージの割合など。

いくつかの分類器で精度を比較し、Gradient Boosting Classifierが最も高い精度で男性、女性ともに8割前後の正答率であった。テキストを使った性別推定手法とも比較し、絵文字を使った方が推定精度が高いことを示した。

感想

絵文字関連の論文を読んだのは恐らくこれが初めて。研究対象としては最近盛んに取り上げられていることは知っていたので、絵文字の性別間での使用傾向の差異という、割と基本的な分析がこれまで行われてなかったというのは意外だった。


-WWW, 論文紹介
-, , , ,

関連記事

Where you Instagram?: Associating Your Instagram Photos with Points of Interest

Li, Xutao and Pham, Tuan-Anh Nguyen and Cong, Gao and Yuan, Quan and Li, Xiao-Li and Krishnaswamy, S …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …

Explainable User Clustering in Short Text Streams

Zhao, Yukun and Liang, Shangsong and Ren, Zhaochun and Ma, Jun and Yilmaz, Emine and de Rijke, Maart …

Who uses web search for what: and how

Weber, Ingmar Jaimes, Alejandro In Proc. of WSDM 2011 http://dl.acm.org/citation.cfm?id=1935839 概要 Y …

A Study of Mobile Search Queries in Japan

Ricardo Baeza-yates Georges Dupret Javier Velasco In Proc. of WWW2007 概要 デスクトップ検索とモバイル検索の日本語のクエリログに着 …