【最終更新日】2019/2/12
今回は、イッテQの視聴率(ビデオリサーチ調べ,関東)をPythonを用いて予測してみようと思います。Python3、Jupyter Notebookを使用しています。

◯なぜイッテQ??
なぜイッテQを選んだかというと、
・常に高視聴率をキープしている
・通常放送が多く、データが取りやすいこと
・私自身、放送開始以来イッテQは見逃したことがほぼなく、視聴率も毎週チェックしているため、自分自身でも予測がしやすい
ことがあげられます。

◯参考にしたもの
TV朝日の視聴率推移をSARIMAモデルで予測してみる
→プログラミングはほぼこちらを参考にしました。エラーも出るため、多少の係数は変更し実行しました。

◯予測手法

今回は、SARIMAモデルと呼ばれる手法を用いて予測します。SARIMAモデルは、季節の要素やトレンドまで考慮に入れて予測します。視聴率はトレンドや季節に左右されることが多いため、有効な予測手段と言えます。

現在実用化されている視聴率予測には、電通のSHAREST_RTというものがあるようです。これは、過去の視聴率データ、番組ジャンル、出演者情報、ネット上のコンテンツ閲覧傾向が教師データになっているとのこと(参考)。今後は天候情報(雨の日のほうが在宅率が高く、高視聴率になりやすい)などを追加していき、精度向上を進めていくようです。

今回作成したプログラミングでは、過去の視聴率データのみを使用し、トレンド分析、将来予測をしていることになります。

◯手順
視聴率データは、ネットに転がっているのでそれらを集約しデータとしました。ちなみに、SP番組として「DASH・イッテQ交換留学」は本データに含めています。それ以外の特番(改編期の「DASHでイッテQ〜」や他の番組(DASHや行列)のSP)は抜いています。2017/1/8から、2019/1/27までのデータを入れています。

Screen Shot 2019-02-03 at 23.37.08

まず、データをプロットしてグラフ化してみます。
Screen Shot 2019-02-03 at 23.46.40

上がり下がりはあるものの、14%-22%の間を2年以上維持し続けているのはすごいです。
次に、Dickey-Fuller Testを行います。
Screen Shot 2019-02-03 at 23.56.41

赤色の線が移動平均を表しますが、あのイッテQ祭り疑惑以降(11月)、右肩下がりとなっていました。ゆるやかに下っています。

◯イッテQ!のトレンドと季節傾向
次が一番見ものの、トレンドと季節の傾向です。
Screen Shot 2019-02-03 at 23.59.18
トレンドは、2017年以降、緩やかに下っているのがわかります。祭り疑惑以降はさらに下がっています。これは、祭り疑惑の影響もありますが、大河ドラマとポツンと一軒家の視聴率好調もあったためと思われます。
季節の傾向では、4月と7月あたりで視聴率が下がる傾向にあるようです。一番組だけの視聴率ではなかなか季節感は読み取れないですね。日テレ全体のプライム視聴率で行えば、いつ上がり、いつ下がるのがよくわかるかもしれません。

◯予測結果
次に、SARIMAモデルで最適なパラメータを探し、モデルを作成。自己相関もほぼ問題ないことを確認し、予測を行いました。2018年から2019/2/10までを予測しました。以下がその結果とグラフです。
date
2018-01-07    16.963744
2018-01-28    19.132542
2018-02-04    17.856055
2018-02-11    19.639591
2018-02-18    17.340289
2018-02-25    18.048732
2018-03-04    19.975576
2018-03-11    17.000314
2018-03-18    18.424799
2018-03-25    17.869369
2018-04-08    18.322304
2018-04-22    18.440152
2018-05-06    16.409622
2018-05-13    19.879696
2018-05-20    18.933183
2018-05-27    17.889478
2018-06-03    19.500522
2018-06-10    18.424953
2018-06-17    18.186823
2018-06-24    20.271624
2018-07-01    17.813833
2018-07-08    17.901988
2018-07-15    20.061493
2018-07-22    16.831968
2018-07-29    19.877457
2018-08-05    19.444249
2018-08-12    17.486616
2018-08-19    19.855096
2018-09-02    17.239085
2018-09-09    18.154401
2018-09-16    17.930630
2018-09-23    19.115889
2018-10-21    17.219615
2018-10-28    17.962994
2018-11-04    18.526846
2018-11-11    17.181914
2018-11-18    18.285873
2018-12-02    16.342554
2018-12-09    17.279184
2018-12-16    16.623024
2018-12-23    17.008872
2019-01-06    16.385361
2019-01-20    16.347549
2019-01-27    18.579713
2019-02-03    16.610514
2019-02-10    16.777451
Screen Shot 2019-02-04 at 0.17.13
赤が予測値です。正確な数値は出ないものの、上がり下がりのおおまかな予測はできていることがわかります。そこまではずれは出ていません。一番差が顕著なのは、2018/12/2のとき。予測値は16.3%ですが、実際は14.0%でした。2.3%の誤差がありました。このときは、裏にM−1グランプリがあり、M-1が17.8%を獲得したのが影響しています。ただ、2017のときはイッテQ17.5%、M-1が15.4%でしたから、2018は16.3%が妥当と判断したのかもしれません。

◯AI vs 人間〜視聴率予測で正確なのはどっち?〜
これからは、実際に未来のデータを予測し、このプログラミング(AI)の予測が勝つのか、人間(イッテQスタッフ並に番組をチェックしてきた私)のどちらが勝つのかを検証していきます。

【検証1回目】2019/2/3
(AIの予測)16.6%
(私の予測)18.8%
(根拠)裏番組が基本先週と同じで、フジが新たな番組を始めるだけ。寒中水泳で多少はUPの可能性。ちなみに、過去2月第1週は、22.5%(2017), 20.2%(2018)と20%超えです。
【結果】18.4% 
AIの誤差1.8%、人間の誤差0.4%で人間の勝利

【検証2回目】2019/2/10
(AIの予測)17.5%
再度、最新の2/3の値をデータ入力した結果、AIの予測は以下のようになりました。
2019-02-10    17.512501
2019-02-17    17.278077
以前の予測値よりも、約1%程度UPし、17.5%という予測結果になりました。トレンドが少し上がってきていると判断したのでしょう。

(私の予測)18.2%

【結果】17.2%
AIの誤差0.3%、人間の誤差1.0%で、AIの勝利


まとめ
人間とAIの予測は互角の争いでした。AIの予測も十分に信頼できる値といえそうです。