ビッグデータ解析で『TikTok』現象を丸裸にしてみた!

私はTikTokが大好きだ。今まで、TikTok数千人以上のファンを獲得するまでやりこんだり、小中学生に混じって有名Tiktokerさん(成瀬さん)の握手会・撮影会に参加してみたり、流行の最先端にいる数々のTiktokerさんの憧れの的であるDJ社長・レペゼン地球のライブにも潜入したり、渋谷ハロウィーンTikTok現象を自分の目で確認したりと、様々な角度からTikTokの最新情報を独自に収集し、誰よりも深くTikTokを理解できるよう努めてきた。しかし残念ながら、これらの事柄はすべて私のバイアスのかかった主観的な体験談に過ぎない。

そこで今回の記事では、大量のサンプル数に基づくビッグデータ解析を行い、『TikTok』現象を定量的な観点から丸裸にすることにチャレンジしてみた。具体的には人類の集合知と呼ばれるWikipediaデータWikipedia Page View Statistics)、インターネットビジネスの王様であるネット広告に関するデータGoogle Keyword Planner)、そして検索エンジンにおけるユーザーの検索パターンに関するデータGoogle Trends)を取り上げる。

実は、これから紹介するものは、ビッグデータ解析と大げさにアピールする必要がないほどEASYで誰でも取り組めるもの。必要なものは入門レベルのプログラミングスキル、エクセルでポチポチとクリックしてグラフを作成するスキル、出てきた結果を解釈する力のみ。TikTok以外のあらゆる対象について同じような分析を行うことができてしまうはずだ。ぜひ、自分の興味のある対象に置き換えて、自分でも試してみてほしい。

Wikipediaページアクセス数動向の分析

まずはWikipediaWikipediaには、世の中のデータサイエンティストのために提供しているAPI(アプリケーション・プログラミング・インターフェース)が用意されている。それを用いることで、無料でかつ簡易に、Wikipediaの各ページのアクセス数などを始めとする様々なデータを取得することができる。今回、プログラミング言語Pythonを通してこの機能を利用し、各国の『TikTok』のページのデータを取得した。

ちなみに、コードは以下のような感じで、Pythonを使ったことあれば、誰でも簡単にデータを取得できる。

(実装において、こちらのQiitaの記事を参考にさせていただきました。ありがとうございました:wikipedia の api をつかって、記事のアクセスを見る - Qiita

#!/usr/bin/env python
# -*- encoding:utf-8 -*-
import requests, json, urllib
import json
import urllib

t1='{x_type}/{x_lang}.wikipedia/all-access/all-agents/{x_article}/daily/{ymd_from}/{ymd_to}'
x_type='https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article'

lang_query = {}
lang_query['ja'] = 'TikTok'
lang_query['en'] = 'TikTok'
lang_query['fr'] = 'TikTok'
lang_query['ko'] = 'TikTok'
lang_query['ru'] = 'TikTok'
lang_query['zh'] = '抖音短视频'
lang_query['it'] = 'TikTok'
lang_query['de'] = 'TikTok'
lang_query['vi'] = 'TikTok'

ymd_from='2017010100'
ymd_to='2018123100'

for x_lang in lang_query:
	query = lang_query[x_lang]
	print(x_lang, query)
	x_article = urllib.parse.quote(query)
	req = requests.get(t1.format(ymd_from=ymd_from,x_lang=x_lang,x_type=x_type,x_article=x_article,ymd_to=ymd_to))
	for one in json.loads(req.text)['items']:
	    print(one['timestamp'][-2] + "\t" + str(one['views']) )

これを実行すれば、TikTokページのアクセス数が表示されるはずだ。

日本のWikipediaTikTok」ページ

f:id:toricago:20181216173731p:plain

まずは日本のデータを見てみよう。データを日次で図示すると、上のような結果が得られる。日本語の「TikTok」のデータが得られるのが8月中旬からであり、その頃にTikTokのページが作成され、閲覧が可能になりはじめたと考えられる。しかし8月から10月初旬まではほとんどアクセスがなく、一日あたりに5人〜10人ぐらいしかアクセスがない時期が続いた。2018年の一年間の象徴としてTikTokが取り上げられる機会が増えているため、一年間を通してブームを迎えていたような錯覚に陥りがち。しかし、少なくともWikipediaのページが見られるようになったのは、つい最近の話なのである。

そして、10月中旬頃から一気にアクセスが増えている。私は夏頃からTikTokのニュースをほぼすべて読んできたが、確かに10月半ば頃から状況が一変し、一気にニュース量が激増した。その感覚については、これらの記事で紹介したとおり。

ちなみにアクセス数の最大値は11月7日の6123回。これはソフトバンクの決算発表が11月5日に行われ、ビジョンファンドがTikTokを運営するByteDanceに投資することを公式に発表したことと関係している。翌日の11月6日に様々なメディアが報道し、さらに翌日の7日にWikipediaページアクセス数はピークを迎えた。「TikTokって何!?」と感じた日本中のビジネスパーソンWikipediaで情報収集したと考えられる。やはりソフトバンク・ビジョン・ファンドによってビジネス界隈でのTikTok知名度が急上昇したんだな、と思わされる。

このようにWikipediaのデータは、特にビジネス界隈でどのようなレベル感になるのかを分析するのに適している。日本ではWikipediaデータが示すはるか前の春夏から、ティーネージャーやキッズの間でTikTokは爆発的に流行っていた。しかし、ユーザーというのは、TikTokがどんな企業によって提供されており、どんな経営者が、どのような経緯で考えついたビジネスモデルなのか、そういうことはどうでも良いと思っている。なので、Wikipediaは見ない。そんな時間があったら、どうやったらもっとカッケー動画を撮ってTikTokでスターになれるか考えて色々と試行錯誤するでしょ。私の想像に過ぎないが、Wikipediaを見るのは投資家やビジネスパーソンが中心のはずだ。

中国のWikipediaTikTok」は日本と全然違った

Wikipediaは様々な言語のページを提供している。TikTokも例外ではない。そこで、他の言語も見てみよう。例えば、TikTokが産声を上げた国のデータを覗いてみると、日本とは違った傾向が明らかになる。「抖音短视频」(TikTokの中国語版ページ)のページアクセス回数を見てみた。

f:id:toricago:20181216173721p:plain

特徴としては、日本よりも遥かに前からWikipediaページが作成されており、そしてじわじわとアクセス数が伸びている。日本の場合はゼロ付近から一気に2000までジャンプしているのに対して、中国では、ゼロ付近から半年ぐらいの時間をかけて2000付近まで緩やかに上昇している。

ピークを迎えたのは10月7日で、この頃、中国国内でTikTok経由でちょっとした事件が相次いだようだ:

そして、日本で注目されたソフトバンク・ビジョン・ファンドのニュースではあまり反応していないのは面白い。これも憶測になるが、中国ビジネスパーソンの間で、すでにTikTokの存在が知れ渡っており、わざわざWikipediaを見に行かなかったのかもしれない。

日本のページアクセス数の水準を比べると、最近は日本が逆転し、日本のほうが多く閲覧されているのも言及に値する。

英語版が最もアクセスされていた!

中国を除けば、日本は世界に誇るTikTokの先進国である。アメリカではようやく立ち上がってきた段階であり、アメリカのTikTokの記事を読む限りでは、日本の夏頃の記事の内容とレベル感が近く、日本と比べて大幅に遅れている。なので、Wikipediaページ数も少ないだろうと思っていたが、そんなことはなかった。結果はこちら。
f:id:toricago:20181216173739p:plain
ピークでは2万回を越えているので、ぶっちぎりで多い。ただ、これはアメリカでのアクセスというより、「英語ページ」を求める人が世界各国にいるので、アメリカという国を代表する数値として使うには注意を要する。場合によっては、後から紹介する他のビッグデータを用いるほうが良い可能性もある。

7カ国語の比較をしてみよう

最後に、7カ国語のTikTokページのデータを一つのグラフで表示してみたのがこちら。イタリア語、ドイツ語、ロシア語、ベトナム語を入れてみたが、日中米には及ばない様子がわかる。

f:id:toricago:20181216173754p:plain

ネット広告データからわかるTikTok

次にネット広告のデータを見ていこう。ネット広告の中でも検索連動広告を出す広告会社向けに提供されているGoogle Keyword Plannerを利用した。これにより、「TikTok」を検索するユーザーを対象に広告を出したい場合に、他にどういうキーワードを出せば効果が高いかがわかるようになるサービスだ。

まず調べたのが【日本語&日本】。月に1000回を超え、TikTokを検索する人が興味を持ちやすいと計算されたビッグキーワードがこちら:

tik tok / tictoc / tok / lien / tik tok 歌詞 / tiktok ダンス

上位2件はスペルミスをした例になっている。TikTokはまだ見慣れない文字列であり、スペルミスの検索数も相当多いことが伺える。他は「歌詞」や「ダンス」など、順当な結果に。

次に、月に1000回を下回るが、TikTokと検索する人が興味を持ちやすいと検索されたスモールキーワードがこちら:

iine / lian / tiktok kesha / kesha tiktok / youtube tik tok / tik tok youtube / tiktok cd / tik tok アルバム / line group / lineapps / tik tok tok / nightcore tik tok / t ik / glee tik tok / tik tok nightcore / line id app / 2pm tik tok / tick up / tik toki / kit tok

LINE関連ワードが目立ち始めるのと、歌手のKeshaさんとTikTokの関係についてのワードも出てくる。Keshaさんは「TiK ToK」という曲があるが、それがTikTok内でも実は流行っているという深い関連がある。

一方、【英語&アメリカ】では、月に1000回を超え、TikTokを検索する人が興味を持ちやすいと計算されたビッグキーワードがこちら:

messenger / tik tok / like / kesha / kesha tik tok / lien / tick tock / kesha songs / tik tok lyrics / line app / tik tok app / tik tok musically / tok / tik tok song / lunatik / tick tock clock / lime app / tick tock watch / lian / like for like / kesha tik tok lyrics / wake up in the morning feeling like p diddy / tik tok video / tick tock tick tock / line messenger / tik tok download / tik tok online / the party don t start til i walk in / tik tak / titok / tik tok korea / tok tok / rock song / tictoc

月に100回〜1000回の水準であり、TikTokと検索する人が興味を持ちやすいと検索されたスモールキーワードがこちら:

tik tok tik tok / tik tok singer / brush my teeth with a bottle of jack / kesha wake up in the morning / tick tock on the clock / tik top / ok t / tok tik / iine / kesha bottle of jack / line group / tik tok of oz / linae / tik tik tok / tik tok parody / tiki tok / tick tock by kesha / tick tock book / tick tock tick tock song / ti k / tic toc kesha / track tik / tik tok musically video / tik tok karaoke / tiktoks / kesha tick tock / glee tik tok / tok stock / don t stop make it pop / wake up in the morning feeling like p diddy lyrics / party don t start til i walk in / tik tok dance / youtube tik tok / tik tok chords / tik tok youtube / download tik tok / tick tock meaning / clock tick tock / tick tock on the clock lyrics / simpsons tik tok / tik talk / line id app / tik tok game / tik tok song lyrics / tic toc diner / kesha wake up in the morning lyrics / tikatok / tic toc or tick tock / tiki liki / tick up / tik tok portland / tik tok restaurant / tik tok toe / tik to / tic toc reggae / tic toc menu / tuk tok / who sings tik tok / kesha hits / toc tok / rocks on / tick tock sound / tic toc clothing / tick tock time / kesha hit songs / tic tik / tick tock jewelers / how to tik tok / tick tock man / dj tik tok / don t stop make it pop lyrics

英語版では日本よりもKeshaさんによる「TiK ToK」関連のワードが相当数混ざり込んでいて、それ以外の傾向が掴みづらくなっている印象を受ける。

検索エンジンデータ解析

ググレカス」というスラングに代表される通り、インターネット上の最強の武器は「検索」だ。検索データを通して、人々が何に関心を持ち、それが時系列でどのように変遷してきたのかを捉えることができる。そしてGoogleの場合は、そのデータが無料で公開されている。データはGoogle Trendsというサービスから得ることができる。サイトから得ることもできるし、PythonであればGoogle Trendsからデータを取得するライブラリも出ているのでオススメだ。

キーワード時系列分析(日本語編)

f:id:toricago:20181219225156p:plain
まず調べたのが日本における「TikTok」。Wikipediaの場合と同様に上昇トレンドを確認することができるものの、そのタイミングだったり、スピードというのは全然違うのが面白い。検索データの場合であれば、春頃から緩やかに上昇しており、今年の8月から12月ぐらいは横ばい傾向にある。これはアプリの盛り上がり方とある程度一致している。つまり、検索データの場合は、より消費者(TikTokユーザー)動向を表しているとも言えるかもしれない(繰り返しになるが、Wikipediaは詳しい背景情報を求めるビジネスや投資目的寄りではないだろうか)。

キーワード時系列分析(英語編)

f:id:toricago:20181219225218p:plain
英語かつ米国の場合のTikTokの時系列データを見ると、日本とはかなり異なる雰囲気になっている。7月頃まではほとんど検索されていないが、そこから急激に上昇している。やはり米国では「最近になって立ち上がってきた」というメディアの報道と整合的な結果を得ることができた。(ちなみにGoogle Trendsは100が最大となるように指数化されているので、日本と米国でどちらが多いかはこのグラフだけからは判別できない。)

関連キーワード分析(日本語編)

Google Trendsでは、同時に調べられやすいキーワードも教えてくれるので便利。例えば日本語でTikTokと合わせて検索されやるいキーワードは、

tiktok 動画 / tiktok 保存 / tiktok ダンス / tik / tik tok / ひなた / tiktok ひなた / ティック トック / tiktok 歌詞 / tiktok 広告 / tiktok うざい / tiktok アプリ / tiktok インスタ / tiktok 人気 / tiktok パンツ / tiktok jk / tiktok cm / tiktok youtube / tiktok アカウント / tiktok かわいい / tiktok 可愛い / ひなた ちゃん tiktok / tiktok おっぱい / tiktok 韓国 / tiktok 意味

「保存」「動画」「広告」など予想通りのキーワードもあれば、「ひなたちゃん」「ひなた」のようにTikTokerに注目したものもある。さらには「パンツ」「おっぱい」と言った下品なキーワードまであるのが面白い。

そして、12月現在の急上昇中のキーワードも見てみよう。

tiktok パンツ / tiktok jk / ひなた ちゃん tiktok / tiktok おっぱい / tiktok 著作 権 / 面白い tiktok / tiktok 会社 / tiktok 検索 / tiktok 保存 できない / tiktok まとめ / め組 の ひと tiktok / tiktok ランキング / perfume tiktok / tiktok jc / tiktok 小学生 / tiktok め組 の ひと / マリナ / め組 の ひと / 芸能人 tiktok / tiktok マリナ / tiktok 撮り 方 / tiktok id / ダイナミック 壁紙 / tiktok エリカ / tiktok ダイナミック 壁紙

「ダイナミック壁紙」というのはTikTokの中で流行っている壁紙系スタイル。自分でもダイナミック壁紙風の動画を作ってみたい人が方法を検索しているのかもしれない。「エリカ」「マリナ」の姉妹TikTokerが最近はメディアでの露出を急増させており、検索でも急上昇しているのは納得感がある。

関連キーワード分析(英語編)

英語でも同じものをチェックしてみよう。TikTokと合わせて検索されやるいキーワードは、

tik tok / tiktok app / tiktok girl / what is tiktok / musically / tiktok musically / tiktok videos / tiktok video / tiktok meme / hit or miss tiktok / tiktok girls / tik tok girl / hit or miss / tiktok shutting down / tiktok ad / tiktok login / tiktok twitter / reddit tiktok / tiktok memes / tik tok app / tiktok fans / snapchat / sexy tiktok / tiktok cringe / nude tiktok

日本と異なる傾向としては、snapchatやmusical.ly関連のキーワードが入っていることで、どちらも日本では流行らなかったので納得感がある。そして、12月現在の急上昇中のキーワードは、

tiktok app / tiktok girl / what is tiktok / musically / tiktok musically / tiktok videos / tiktok meme / hit or miss tiktok / tiktok girls / tik tok girl / hit or miss / tiktok shutting down / tiktok ad / tiktok login / tiktok twitter / reddit tiktok / tiktok memes / tik tok app / tiktok fans / snapchat / sexy tiktok / tiktok cringe / nude tiktok / tiktok ads / thebudday tiktok

日本では「おっぱい」や「パンツ」と出ていたものが、米国では「sexy」や「nude」と出ていて、万国共通の傾向を見出すことができる。「tiktok girl」や似たようなものが多く出ているのはなぜだろうか。少しぐぐってみたがわからず。もしかしたら女性TikTokerのことをTikTok Girlと呼ぶのかもしれない。

終わりに

TikTokに関連するいくつかのデータを見てきたが、本当に面白いビッグデータは、指数関数的に増加している「TikTokの動画データ」それ自体であることは間違いない。ただしByteDance外部の人間にはその宝の山にアクセスすることはできない。今後ByteDanceエンジニアや研究者の皆さんより、TikTokの最強に面白いビッグデータをフル活用し、最先端のAIテクノロジーに基づく新たなユーザー体験が提供されると期待している。楽しみだ。