【最終更新日】2019/2/12
今回は、イッテQの視聴率(ビデオリサーチ調べ,関東)をPythonを用いて予測してみようと思います。Python3、Jupyter Notebookを使用しています。
◯なぜイッテQ??
なぜイッテQを選んだかというと、
・常に高視聴率をキープしている
・通常放送が多く、データが取りやすいこと
・私自身、放送開始以来イッテQは見逃したことがほぼなく、視聴率も毎週チェックしているため、自分自身でも予測がしやすい
ことがあげられます。
◯参考にしたもの
TV朝日の視聴率推移をSARIMAモデルで予測してみる
→プログラミングはほぼこちらを参考にしました。エラーも出るため、多少の係数は変更し実行しました。
◯予測手法
今回は、SARIMAモデルと呼ばれる手法を用いて予測します。SARIMAモデルは、季節の要素やトレンドまで考慮に入れて予測します。視聴率はトレンドや季節に左右されることが多いため、有効な予測手段と言えます。
現在実用化されている視聴率予測には、電通のSHAREST_RTというものがあるようです。これは、過去の視聴率データ、番組ジャンル、出演者情報、ネット上のコンテンツ閲覧傾向が教師データになっているとのこと(参考)。今後は天候情報(雨の日のほうが在宅率が高く、高視聴率になりやすい)などを追加していき、精度向上を進めていくようです。
今回作成したプログラミングでは、過去の視聴率データのみを使用し、トレンド分析、将来予測をしていることになります。
◯手順
視聴率データは、ネットに転がっているのでそれらを集約しデータとしました。ちなみに、SP番組として「DASH・イッテQ交換留学」は本データに含めています。それ以外の特番(改編期の「DASHでイッテQ〜」や他の番組(DASHや行列)のSP)は抜いています。2017/1/8から、2019/1/27までのデータを入れています。

まず、データをプロットしてグラフ化してみます。

上がり下がりはあるものの、14%-22%の間を2年以上維持し続けているのはすごいです。
次に、Dickey-Fuller Testを行います。

赤色の線が移動平均を表しますが、あのイッテQ祭り疑惑以降(11月)、右肩下がりとなっていました。ゆるやかに下っています。
◯イッテQ!のトレンドと季節傾向
次が一番見ものの、トレンドと季節の傾向です。

トレンドは、2017年以降、緩やかに下っているのがわかります。祭り疑惑以降はさらに下がっています。これは、祭り疑惑の影響もありますが、大河ドラマとポツンと一軒家の視聴率好調もあったためと思われます。
季節の傾向では、4月と7月あたりで視聴率が下がる傾向にあるようです。一番組だけの視聴率ではなかなか季節感は読み取れないですね。日テレ全体のプライム視聴率で行えば、いつ上がり、いつ下がるのがよくわかるかもしれません。
◯予測結果
次に、SARIMAモデルで最適なパラメータを探し、モデルを作成。自己相関もほぼ問題ないことを確認し、予測を行いました。2018年から2019/2/10までを予測しました。以下がその結果とグラフです。

赤が予測値です。正確な数値は出ないものの、上がり下がりのおおまかな予測はできていることがわかります。そこまではずれは出ていません。一番差が顕著なのは、2018/12/2のとき。予測値は16.3%ですが、実際は14.0%でした。2.3%の誤差がありました。このときは、裏にM−1グランプリがあり、M-1が17.8%を獲得したのが影響しています。ただ、2017のときはイッテQ17.5%、M-1が15.4%でしたから、2018は16.3%が妥当と判断したのかもしれません。
◯AI vs 人間〜視聴率予測で正確なのはどっち?〜
これからは、実際に未来のデータを予測し、このプログラミング(AI)の予測が勝つのか、人間(イッテQスタッフ並に番組をチェックしてきた私)のどちらが勝つのかを検証していきます。
【検証1回目】2019/2/3
(AIの予測)16.6%
(私の予測)18.8%
(根拠)裏番組が基本先週と同じで、フジが新たな番組を始めるだけ。寒中水泳で多少はUPの可能性。ちなみに、過去2月第1週は、22.5%(2017), 20.2%(2018)と20%超えです。
【結果】18.4%
AIの誤差1.8%、人間の誤差0.4%で人間の勝利!
【検証2回目】2019/2/10
(AIの予測)17.5%
再度、最新の2/3の値をデータ入力した結果、AIの予測は以下のようになりました。
(私の予測)18.2%
【結果】17.2%
AIの誤差0.3%、人間の誤差1.0%で、AIの勝利!
◯まとめ
人間とAIの予測は互角の争いでした。AIの予測も十分に信頼できる値といえそうです。
今回は、イッテQの視聴率(ビデオリサーチ調べ,関東)をPythonを用いて予測してみようと思います。Python3、Jupyter Notebookを使用しています。
◯なぜイッテQ??
なぜイッテQを選んだかというと、
・常に高視聴率をキープしている
・通常放送が多く、データが取りやすいこと
・私自身、放送開始以来イッテQは見逃したことがほぼなく、視聴率も毎週チェックしているため、自分自身でも予測がしやすい
ことがあげられます。
◯参考にしたもの
TV朝日の視聴率推移をSARIMAモデルで予測してみる
→プログラミングはほぼこちらを参考にしました。エラーも出るため、多少の係数は変更し実行しました。
◯予測手法
今回は、SARIMAモデルと呼ばれる手法を用いて予測します。SARIMAモデルは、季節の要素やトレンドまで考慮に入れて予測します。視聴率はトレンドや季節に左右されることが多いため、有効な予測手段と言えます。
現在実用化されている視聴率予測には、電通のSHAREST_RTというものがあるようです。これは、過去の視聴率データ、番組ジャンル、出演者情報、ネット上のコンテンツ閲覧傾向が教師データになっているとのこと(参考)。今後は天候情報(雨の日のほうが在宅率が高く、高視聴率になりやすい)などを追加していき、精度向上を進めていくようです。
今回作成したプログラミングでは、過去の視聴率データのみを使用し、トレンド分析、将来予測をしていることになります。
◯手順
視聴率データは、ネットに転がっているのでそれらを集約しデータとしました。ちなみに、SP番組として「DASH・イッテQ交換留学」は本データに含めています。それ以外の特番(改編期の「DASHでイッテQ〜」や他の番組(DASHや行列)のSP)は抜いています。2017/1/8から、2019/1/27までのデータを入れています。

まず、データをプロットしてグラフ化してみます。

上がり下がりはあるものの、14%-22%の間を2年以上維持し続けているのはすごいです。
次に、Dickey-Fuller Testを行います。

赤色の線が移動平均を表しますが、あのイッテQ祭り疑惑以降(11月)、右肩下がりとなっていました。ゆるやかに下っています。
◯イッテQ!のトレンドと季節傾向
次が一番見ものの、トレンドと季節の傾向です。

トレンドは、2017年以降、緩やかに下っているのがわかります。祭り疑惑以降はさらに下がっています。これは、祭り疑惑の影響もありますが、大河ドラマとポツンと一軒家の視聴率好調もあったためと思われます。
季節の傾向では、4月と7月あたりで視聴率が下がる傾向にあるようです。一番組だけの視聴率ではなかなか季節感は読み取れないですね。日テレ全体のプライム視聴率で行えば、いつ上がり、いつ下がるのがよくわかるかもしれません。
◯予測結果
次に、SARIMAモデルで最適なパラメータを探し、モデルを作成。自己相関もほぼ問題ないことを確認し、予測を行いました。2018年から2019/2/10までを予測しました。以下がその結果とグラフです。
date 2018-01-07 16.963744 2018-01-28 19.132542 2018-02-04 17.856055 2018-02-11 19.639591 2018-02-18 17.340289 2018-02-25 18.048732 2018-03-04 19.975576 2018-03-11 17.000314 2018-03-18 18.424799 2018-03-25 17.869369 2018-04-08 18.322304 2018-04-22 18.440152 2018-05-06 16.409622 2018-05-13 19.879696 2018-05-20 18.933183 2018-05-27 17.889478 2018-06-03 19.500522 2018-06-10 18.424953 2018-06-17 18.186823 2018-06-24 20.271624 2018-07-01 17.813833 2018-07-08 17.901988 2018-07-15 20.061493 2018-07-22 16.831968 2018-07-29 19.877457 2018-08-05 19.444249 2018-08-12 17.486616 2018-08-19 19.855096 2018-09-02 17.239085 2018-09-09 18.154401 2018-09-16 17.930630 2018-09-23 19.115889 2018-10-21 17.219615 2018-10-28 17.962994 2018-11-04 18.526846 2018-11-11 17.181914 2018-11-18 18.285873 2018-12-02 16.342554 2018-12-09 17.279184 2018-12-16 16.623024 2018-12-23 17.008872 2019-01-06 16.385361 2019-01-20 16.347549 2019-01-27 18.579713 2019-02-03 16.610514 2019-02-10 16.777451

赤が予測値です。正確な数値は出ないものの、上がり下がりのおおまかな予測はできていることがわかります。そこまではずれは出ていません。一番差が顕著なのは、2018/12/2のとき。予測値は16.3%ですが、実際は14.0%でした。2.3%の誤差がありました。このときは、裏にM−1グランプリがあり、M-1が17.8%を獲得したのが影響しています。ただ、2017のときはイッテQ17.5%、M-1が15.4%でしたから、2018は16.3%が妥当と判断したのかもしれません。
◯AI vs 人間〜視聴率予測で正確なのはどっち?〜
これからは、実際に未来のデータを予測し、このプログラミング(AI)の予測が勝つのか、人間(イッテQスタッフ並に番組をチェックしてきた私)のどちらが勝つのかを検証していきます。
【検証1回目】2019/2/3
(AIの予測)16.6%
(私の予測)18.8%
(根拠)裏番組が基本先週と同じで、フジが新たな番組を始めるだけ。寒中水泳で多少はUPの可能性。ちなみに、過去2月第1週は、22.5%(2017), 20.2%(2018)と20%超えです。
【結果】18.4%
AIの誤差1.8%、人間の誤差0.4%で人間の勝利!
【検証2回目】2019/2/10
(AIの予測)17.5%
再度、最新の2/3の値をデータ入力した結果、AIの予測は以下のようになりました。
2019-02-10 17.512501 2019-02-17 17.278077以前の予測値よりも、約1%程度UPし、17.5%という予測結果になりました。トレンドが少し上がってきていると判断したのでしょう。
(私の予測)18.2%
【結果】17.2%
AIの誤差0.3%、人間の誤差1.0%で、AIの勝利!
◯まとめ
人間とAIの予測は互角の争いでした。AIの予測も十分に信頼できる値といえそうです。
Sponsored Link
コメント