試行・思考

VTuber(ユーザ)の属性を決めているのは一体誰なのか~Twitterデータから分析する~

こんにちは,しまさん(@shimasan0x00)です.

大学院の講義で聞いたのですが,社会学ではユーザからなるネットワークがあるときにそのユーザがどのような特性を持っているかはそのユーザ自身の情報は必要ではなく,接続されているユーザから決定されると考えるそうです.

私はソーシャルメディアの分析をしているので単純にこれがTwitterでも適用されるのか気になりました.

特に実社会とは異なる形態(フォロー:フォロワーの比率が1:10^x)に対して適用するとユーザの分析において何か特徴的な結果が得られるのではないでしょうか.

ユーザの持つフォローユーザ群,フォロワーユーザ群を集合と見立てると6種類のデータを生成することができます(ex.相互フォロー,一方的なフォロワー).

それらの6種類のデータから分析を行うことでどの集合がそのユーザの属性を決定しているのかを分析していきます.

今回は初動としてユーザのbio(自己紹介部分)情報から名詞を抽出し,WordCloudで可視化を行います.

フォロー,フォロワーの比率が特徴的なユーザとしてVTuberから個人勢と企業勢からそれぞれ1名選びました.

今回は個人勢VTuberで最近気になっている「魔界の一般人シャレトン(@shareton_sha)」さんと企業勢である「戌神ころね(@inugamikorone)」さんを採用しました.

これは今回の分析とは別に企業勢VTuberにおける制約はあるのか,表出するのかについて興味があるので選定しました.

以前も似たモチベーションで分析もどきをしています.

hololive所属ユーザのフォロー類似度をjaccard係数で可視化する話hololive所属ユーザのフォロー類似度をjaccard係数で可視化する話. PythonとTwitterAPIを使って可視化しました....

今回はVTuberに対して適用していますが,認証付きユーザやインフルエンサー,企業アカウント,著名ユーザにも本手法を適用して差分比較することで新たな知見を得られる可能性があります.

関連研究

対象のユーザが含まれている公開リストの名前からその名前の出てくる頻度によってそのユーザがどんな役割を担っているかを判定する研究です.

この研究は普通に面白いのですが,この関連研究を用いてもVTuberの場合は「VTuber」や「企業名」などのわかりきっているものだけが表出することになると考えられます.

また,ツイートデータを用いたとしても各ユーザ単位でコンテンツの揺れがでかすぎるのであまり使用したくありません.なので今回はbioデータを使用しています.

スポンサーリンク

環境

  • macOS Catalina 10.15
  • Python 3.6.8
    • wordcloud 1.6.0
  • Mecab
    • mecab-ipadic-NEologd

Python環境の構築とMecab周りの設定は以下の記事を参照.

Mac OS X(Mojave)にAnaconda(Python環境)をインストールする方法Mac OS X(Mojave)にAnaconda(Python3.7環境)をインストールする方法を紹介しています.Anacondaをインストールしたら使用可能となるJypyterLab,Jupyter Notebook,Qt Console,Spyder,Glueviz,Orangeについても簡単に紹介をしています....
Mac OS X(Mojave)にMecab+mecab-ipadic-NEologdをインストールする方法(+Python)macOS Mojave(10.14)にMecabとmecab-ipadic-NEologd,Pythonで使うmecab-python3のインストール方法について紹介しています.また,辞書をアップデートするためのcronの設定についても書いています.インストールは主にHomebrew,pipを使っています....

スポンサーリンク

分析手法

はじめの部分で社会学においてユーザの特性をつながっているユーザから求めることについて話しました.

しかし,実社会とTwitterのソーシャルネットワークではエッジを張る部分が異なります.その有り様が有向で明示的に示されている点です.

ユーザA(私)とユーザBが存在するときに以下のエッジの貼り方があります.

  1. A -> B の関係(フォロー)
  2. B <- A の関係(フォロワー)
  3. A <-> B の関係(相互フォロー)

これらの関係から各ユーザにはフォロー集合とフォロワー集合が得られ,結果以下の6種類のデータが得ることができます.

  1. Follow集合
  2. Follower集合
  3. Follow集合とFollower集合の和集合
  4. Follow集合とFollower集合の積集合
  5. (Follow集合 – Follower集合)の差集合
  6. (Follower集合 – Follow集合)の差集合

この6種類のデータからTwitterAPIを用いてbio情報を取り出し,Mecabで名詞のみを取り出してwordcloudを作成します.

期待する結果

  • VTuberが世界観(設定)を求められているのか,器ではなくその中の属人性に期待しているのか.
  • 企業勢の場合,フォローするユーザに制約がある.完全に自分が興味あるからフォローするという行為だけで構成されていない.
  • 実は相互フォロー関係よりもフォロワーだけの集合のほうがそのユーザを表しているのではないか.
  • 1,5の集合はユーザのこうありたいという理想や興味対象を表す
  • 2,6の集合は実際にそのユーザに期待されてる属性を表す

集合の差分を比較されることで該当ユーザ自身が求める姿と期待されている姿が違うなんてことがわかると面白いなと思います.

スポンサーリンク

分析結果

  1. Follow集合
  2. Follower集合
  3. Follow集合とFollower集合の和集合
  4. Follow集合とFollower集合の積集合
  5. (Follow集合 – Follower集合)の差集合
  6. (Follower集合 – Follow集合)の差集合

上記の6種類のデータに対してwordcloudを作成した結果を示す.

1. Follow集合

Follow集合はそのユーザがフォローしている全てのユーザデータを含んだ集合である.

(i) 魔界の一般人シャレトン:1955

VTuber,個人勢,マシュマロなどはシャレトンさんを特徴付けられていると考えられる.バ美肉やバーチャルなどVTuberの属性も表出できている.フォローユーザにシャレトンさんと同じ属性ユーザが多いことがわかる.

(ii) 戌神ころね:207

ホロライブ,VTuberなど企業所属であることがわかる.絵やイラストレーター,イラストなどVTuberにとって不可欠な要素を含有している.

ユーザの属性を示す集合の可能性がある.

5. (Follow集合 – Follower集合)の差集合

Follow集合 – Follower集合はフォローしているがフォローを返されていない集合である.

(i) 魔界の一般人シャレトン:199

企業所属系のVTuberにフォローを返されていない頻度が大きいからか「企業名」,「所属」が大きく可視化されている.また,VTuberという固有表現でなく「バーチャルライバー」という表現を取るユーザの存在が確認される.

(ii) 戌神ころね:53

集合自体が少ないことに注意したいが,規模の大きい公式アカウント系のユーザが出ている.属人性,ユーザの特性(配信したゲーム関連,公言している趣味その他)が表されている可能性がある.

この集合はfollow集合よりも個人の興味を色濃く反映されている可能性がある.

2. Follower集合

Follower集合はそのユーザがフォローされている全てのユーザデータを含んだ集合である.

(i) 魔界の一般人シャレトン:9353

Vtuber,アイコン,ゲームが頻度が大きく,可視化されている.ゲームに関する単語も確認できる.フォローされているユーザはやはりVtuber,もしくはVtuberを好きであること,Vtuber関連の仕事をされている人の影響を大きく受けている可能性がある.

(ii) 戌神ころね:105330

所属しているホロライブが現れている.これは同じ企業所属ユーザによる影響が大きい.ユーザ層はシャレトンさんに近いがフォロワー数が多いために各人の特性を示す単語が消え,強い属性のみが表出している.

follower集合はそのユーザに近い属性を持つユーザ群によってラベル付けされるため該当ユーザの一番の属性を特徴付けられ,その他のフォロワーによって期待されている属性が付与されていることが考えられる.

6. (Follower集合 – Follow集合)の差集合

Follower集合 – Follow集合はフォローされているがフォローを返していない集合である.

(i) 魔界の一般人シャレトン:7596

趣味や趣味垢などが見られる.これは(ii)でも言えるがVTuberを推すユーザは趣味垢をプライベートアカウントとは別に用意して活動されていることが示唆され,それらのユーザによって期待されている属性/シャレトンさんを推すユーザの興味が表出していると考えられる.

(ii) 戌神ころね:105176

フォロー返しをしていないユーザ群であるのに企業所属ユーザであることがわかるのはすごい.先述の通り趣味垢があることは同様だが,「ホロライブ」というコンテンツは単一ユーザを推すのではなく,複数人を推す傾向があることが示唆されている.

この集合はユーザの一番の属性及びユーザによって期待されている属性/該当ユーザを推すユーザの興味を示している可能性が高く,非常に有用な集合といえる.

Follow集合とFollower集合の和集合

Follow集合とFollower集合の和集合はFollow集合とFollower集合すべてのデータを対象とする集合である.

(i) 魔界の一般人シャレトン:8728

(ii) 戌神ころね:75457

(i) のほうが「ゲーム」の出現頻度が多いが,既存の結果とあまり差はない.和集合を用いなくても属性を決定することは可能.

Follow集合とFollower集合の積集合

Follow集合とFollower集合の積集合はFollow集合とFollower集合の共通する部分である.

(i) 魔界の一般人シャレトン:1757

(ii) 戌神ころね:154

積集合ではデータ数が少ないが該当ユーザを表す第一属性は表現できている.しかし,複数の属性を確認することは難しい.

考察

今回はVTuberを採用し,フォロー,フォロワーを集合とすることで6種類のデータを用意しその特徴を可視化しました.

VTuberは同じ属性を持つユーザと繋がっているがゆえに集合によって見える単語にあまりバラツキがなく,同じ結果に近いものが多々得られています.

ただし,一方的なフォロー,一方的なフォロワー集合の結果は非常に重要です.一方的なフォローにはそのユーザの願望や興味がある対象が強く表出する可能性があり,一方的なフォロワー集合はそのユーザを決定させる属性や推すユーザ層が反映されている可能性があります.これはVTuberが自身に求められているコンテンツを把握するのに重要な手段となりうるかもしれません.

また,VTuberを推すユーザはその興味がある対象だけで自分のパーソナリティを切りとり,Twitter上で活動していることが示唆されました.

今回の分析によって積集合に対して疑問が湧いています.一方的なフォロー,一方的なフォロワー集合に価値が見いだされるという知見の裏側を見ると,現実の社会ネットワークに対応する積集合にはユーザの属性を決定させる価値が低いという点です.これはVTuberが実社会というよりはWeb上にその価値の主があるからかもしれませんが,この部分を詳細に分析することは非常に重要であると考えられます.

さらにユーザのFF比が1:10^xのユーザに対しても仮説を立てることができます.もしfollow集合がfollower集合の完全に部分集合,もしくは一方的なフォロー集合が十分に小さい場合,そこにユーザの属人性は欠落しており,大衆がユーザに対してラベル付けした属性のみが反映されているのではないだろうかという仮説です.

ユーザのFF比が1:10^xであるユーザはある時点から,もしくはそのユーザに既に価値が認められている場合はTwitterに情報取得の側面を求めず情報拡散のみを行うのではないでしょうか.これはユーザが自身の属性をアカウントという単位で切ることができるTwitterの特徴を反映しています.パーソナルなアカウントとオフィシャルで使用するアカウントを切るという発想は自然です.VTuberであればその属人性を表出するよりはその設定から伸びるパーソナリティ(もしくは配信活動を通じて出た特徴)が分析の結果として出てくるのでしょう.FF比が大きいユーザはユーザの一方的なフォローからユーザの持つ興味の対象や願望を観測する際,大衆によってラベル付けされた属性に大きく外れる属性は表出することはないでしょう.分析する側としては属性が見やすくて一見嬉しいですが,それはユーザが大衆からのぞまれている側面だけが見えているだけの可能性が十分に高いことは注意したほうがよさそうです.

もし,Twitter上で活動するユーザに多面的な属性を期待する場合,FF比が1:1に近いかつ,ダンパー数から大きく外れないようなフォロー,フォロワー数のユーザを対象にしたほうがいいでしょう.FF比が1:10^xになるあるタイミングでユーザのパーソナリティは分割される可能性が非常に高いからです(これを調べるのはかなり重要で,できれば研究として価値が高いと思います).

今回の結果からVtuberの属性を決定するのはフォロー集合と言えるがそれは一方的なフォロワー集合の期待によって得られている可能性が十分に高く,VTuber自身ではなく,それ以外のユーザによって決定していると言えるでしょう.他の認証付きユーザやインフルエンサー,企業アカウント,著名ユーザに対しても分析をかけたいですがエンタープライズAPIを叩くのは難しいので(お金がないので)この差分を取ることは私ではできないかもしれません.今回得た知見から別の分析をすることになるでしょう.

p.s.

  • VTuberの表記ゆれがでかすぎる.統一規格をください.
  • データ収集がマジで時間かかる.どうにかしてほしい(ムリ).
ABOUT ME
しまさん
高専→大学編入→大学院→? / 計算社会科学,ウェブマイニングなど / グレープフルーツと本が好き / SNS(Twitter,YouTube,Twitch)やVTuberのデータ分析屋 詳しいプロフィールはこちら≫ 投げ銭はコチラ