covid19感染拡大兆候分析(東京)

今回はcovid19の感染拡大兆候を見つけることはできるのか?という趣旨で分析を行いました。

※このブログの内容は個人の意見・見解となります。また、記事の内容の正確性については保証いたしません。本ブログの目的は分析結果をアウトプットしていくことによる自身のデータ分析力向上を主としています。誤りや違うアプローチの方が良いという事も多分にあると思います。後学のため、「もっとこうしたらいい」や誤りを見つけた場合はコメント欄などでお知らせいただけると有難いです。

今回、covid19の分析を行うにあたり使用したデータは下記のURLから取得したものになります。

分析するにあたり設定した問題設定、評価軸、要因、使用したデータは以下になります。

  • 問題設定:covid19の感染拡大兆候は何か
  • 評価軸:正確性、利便性、納得感
  • 要因: 正確性_感染拡大前の兆候(感染者増減率推移、検査陽性率、人流増減、周期性の有無) 利便性_毎日データの取得が可能 納得感_公的機関が公開しているデータの使用 
  • データ:東京都の陽性率 130001_tokyo_covid19_tests_conducted.csv、全国の主要地区・歓楽街歓楽街の人出 humanFlow_zenkoku.csv、新規陽性者数 newly_confirmed_cases_daily .csv
  • github(今回使用したpythonのコード:covid19.jpynb)https://github.com/ryosuke-yakura/covid19/tree/main/datatable
  • 第1波ピーク 2020年04月中旬
  • 第2波ピーク  2020年08月上旬
  • 第3波ピーク  2021年01月上旬
  • 第4派ピーク  2021年03月下旬
  • 第5波ピーク  2021年08月下旬
  • 第6波ピーク  2022年02月上旬
  • 第7波ピーク  2022年8月現在

では、早速データを見ていきます。

まずは、新規陽性者数の推移です。

新規陽性者数推移(縦軸:陽性者数 横軸:日付)

2022年に入り、爆発的に陽性者数が増えています。これを見ると第1波から第5波までの感染者数が可愛く見えてくるほどです。2022年に入ってからは2021年の1日当たり最大陽性者数5,000人を超えている日の方がほとんどのように見受けられます。また、第7波でが新規陽性者数の増加するスピードが他の流行時と比較して早い傾向にありそうです。

次は、新規陽性者数の増減率です。

新規陽性者数増減率(縦軸:増減率 横軸:日付)

増減率は一番高い値で2020年に記録した5倍になりますが、これは感染者数が少ないため増加した際に大きな値が出てしまったものと考えられます。第6波前には急激な増加傾向が見てとれますが、それ以外の時期では増減率に大きな変化がないように見えます。増加傾向が見られた後には感染拡大が発生する可能性はありそうです。

次は、陽性率を見ていきます。

陽性率(縦軸:陽性率 横軸:日付)左から第4波、第5波、第6波、第7波ピークの前後1ヶ月(第7波を除く)

陽性率は波を追うごとに上がっており、第7波では50%に達した日もある。第6波ではオミクロン株、第7波ではBA5が流行しているため株による影響が大きいと考えられる。また、第4波を除き、第5波から第7波ではピーク前に陽性率が上がり、 ピークアウトする際には陽性率が低下している。 そのため、陽性率は感染症の拡大に大きな影響を与えていると考えられる。

続いて東京の主要地区・歓楽街歓楽街の人出(15時)になります。

主要地点の人出(15時)(縦軸:※人出の比率 横軸:日付)
※2019年一年間におけるピーク値を基準(1.0)とした場合の比率

人出を見ると、感染拡大の時期までは人出が増えていき、感染拡大後に急激に減少している。制限が解除されても感染者数が増えてくると自主的に移動を自粛しているように見受けられる。

最後に、周期性があるか自己相関係数を使用して確認をする。

コレログラム(縦軸:自己相関係数 横軸:日付)

周期性がある場合には波型の推移となるが今回は波型には見えないため、周期性は無さそうと判断する。

まとめ

今回、covid19のオープンデータを元に感染拡大の兆候として利用可能な因子をは陽性率、新規陽性者数の増減率、周期性の有無、人出が 関係すると仮説立て検証を行った。結果、人出及び陽性率の増加が兆候として一定の効果を持っていると考えられる。 一方、ウイルスの株が感染拡大の要因として大きいと考えられる。 また、covid19は周期性はなく、突如感染者数が増加するといったインフルエンザなどとは異なる性質があることがデータより確認できる。 そのため、感染者数拡大はオープンデータから正確に判断することが難しいが、ウイルス株の流行状況や特性と組み合わせることで感染拡大の兆候を見つけることができると考える。

このような形で分析した結果を今後は週に1回(目標)ペースで掲載していきたいと考えている。データ分析のキャリアを歩み始めたのですが、データの解釈、分析力が低いと感じ今回、このような形でアウトプットをしていくことにしたため、ぜひ、アドバイスやご指摘をいただけると幸いです。