にじさんじ,ホロライブが獲得できているユーザ層は同じなのではないかと思って調べてみた
( 2020年2月16日)
こんにちは,しまさん(@shimasan0x00)です.
最近は収集できているデータの都合と興味もあって,VTuber関連ばかりの分析をしている気がします.
今回はVTuberのTwitterのフォロワーのidを取得していこうと思います.
そして各事務所ごとにsetオブジェクトとしてidを集めることでそれぞれの事務所が抱えているユーザ数がわかります.
にじさんじとホロライブのid集合の積集合が大きければVTuberを追う人は思っている以上に実は少ないんじゃないか,VTuberの性質は事務所に依存しない可能性も考えられるので面白いです.
逆に積集合が小さければ固有のファンがいることがわかり,事務所によって抱えているユーザ層が違う可能性があるのでこれも面白いです.
つまりどっちに転んでも面白いので私がやらないわけがないということですね.
検証環境
- macOS Catalina 10.15
- Python 3.6.8
フォロワーのidを収集する
今回はにじさんじを例にとってデータ収集しますがホロライブも同様の手順でやっています.
にじさんじのライバー97名,ホロライブのライバー27名のフォロワーデータを集めていきます.
今回はTwitter API(followers/ids)を使用して該当ライバーのフォロワーidを集めていきます.一度に5000id収集でき,それを回すことで収集していきます.
にじさんじの場合は大体36時間,ホロライブの場合は11時間ほどで収集が終わりました.
idだけなのであまり時間がかからず取得できて満足です.
にじさんじのライバー全体で10,353,932 id,ホロライブのライバー全体で3,199,697 id集まりました.
にじさんじのライバーは平均10万6000フォロワー,ホロライブは平均11万8000フォロワーということになりますが,単純平均ではあまり違いはわかりません.
また,事務所単位で考えたい場合は重複しているidを除去する必要があります.
事務所ごとに抱えるユーザ集合を作成
先程データ収集したのは各ライバーごとに対するフォロワーidとなっています.そこで階層を1つ上げた(=事務所単位)ユーザ集合を作成し,事務所が抱えるユーザ数を調べていきます.
にじさんじのユニークユーザー数は839,146,ホロライブのユニークユーザー数は600,787となりました.
…あれ??先程集めたデータから桁が1~2落ちてますね.
しかもユニークユーザー数が20万違うとはいえライバー数の差が3倍以上あることを考えるとにじさんじ側からすれば芳しい結果ではないかもしれません.
VTuber事務所共通フォロワーユーザを得る
さきほどそれぞれの事務所のユニークユーザー数が取れ,setオブジェクトを用意できたのであとは積集合を計算するだけです.
結果,353,515ユーザが共通であることがわかりました.
つまり,差集合を計算することで事務所固有のファン数が推定されます.
にじさんじは485,631,ホロライブは247,272です.
固有ファンの割合がにじさんじは57.9%,ホロライブは41.15%ということですね.
所属ライバー数からなる認知の広がりやすさや広報の宣伝能力の差などもあるのかもしれませんがにじさんじのほうが固有ファンが多く,特定ライバーが好きな人が多い可能性が高いことが今回明らかになりました.
また,半数近いユーザは両方のライバーをフォローしており,複数の事務所ライバーを知っている,フォローしていることからVTuberに対する理解が深いユーザであることが推察され,このユーザ層に対してアプローチをかけることで各々の事務所は効果的な結果を得られることが期待されます.
また,固有ファンのユーザに対する分析をすすめることで事務所(=所属するライバー)にファンが求めていることが明らかになり,他の事務所と差別化を図ることや以降の新生ライバーの属性付与の参考になると考えられます.
さいごに
今回は前回集めた辞書とTwitter API(followers/ids)を使用してライバーのフォロワーのidを収集し,事務所ごとに統合することで事務所ごとのユニークユーザー数を明らかにしました.
また,それらの積集合を取ることで固有ファンの存在や共通で知っているユーザ数がかなり大きいことがわかりました.
今回いい感じのデータを取れたのでまた使い回したいと思います.