[前回記事]で、新型コロナウイルスの流行における季節の変わり目の影響に着目したところ、前週との気温差と新規陽性者数の時系列挙動(日間隔)に緊密な関連性があることが判明しました。この記事ではさらに詳しく、気象とコロナ流行との関連性について分析していきたいと思います。
◇
前回記事で示した通り、各時点の日最低気温(7日移動平均)とその前週の日最低気温(7日移動平均)との差をとった時系列曲線(以下「気温差」と呼ぶ)と新規陽性者数の時系列曲線(7日移動平均)を比較すると、気温差が最低(ボトム)になるタイミングと新規陽性者が増加するタイミングがよく対応します。
図-1は、2020年1月~2021年1月までの東京都における気温差(気象庁発表)と新規陽性者の増減(東京都発表データの中央7日移動平均)をプロットしたものです。新型コロナウイルスの場合、感染から報告まで10日~1週間程度のタイムラグがあることが一般に知られていますので、気温差については便宜的に10日のラグを加えてプロット(実際の観測日よりも10日後にプロット)しています。
図を見ると、前週と比較して顕著に気温が低下した時期がいくつか存在し、季節に関係なく、その最低点と感染が増加する点が非常によく対応しています。
この関連性をより本質的に検討するため、気温差と実効再生産数を同時にプロットしたものが図-2と図-3です。
図-2 前週との気温差と実効再生産数(発症ベース:第0波&第1波)
図-2は、東京都のいわゆる第0波と第1波の実効再生産数(発症ベース)の変動(専門会議発表)と気温差の変動を同時にプロットしたものです。発症ベースであるため実効再生産数と気温差のデータ間にタイムラグはありません。本図を見ると気温差のボトムと実効再生産数のピークの位置が非常によく一致していることがわかります。
図-3 前週との気温差と実効再生産数(報告ベース:第2波&第3波)
図-3は、東京都のいわゆる第2波と第3波の実効再生産数(報告ベース)の変動と気温差の変動を同時にプロットしたものです。実効再生産数は東京都発表データから簡易式により求めました。また、報告ベースであるため、気温差については便宜的に20日のタイムラグを加えてプロット(実際の観測日よりも20日後にプロット)しています。本図を見ても気温差のボトム(気温低下量が2度以上のもの)と実効再生産数のピークの位置が非常によく一致していることがわかります。
以上のことから次のような【経験則 empirical law】が導かれます。
(1) 季節に関わりなく前週との気温差が低下すると発症ベースの実効再生産数が増加する
(2) 逆に前週との気温差が増加すると発症ベースの実効再生産数が低下する
(3) 報告ベースの実効再生産数は気温の低下後から20日程度のラグを伴って増加する
このような観点からすれば、実効再生産数の増加は、国民の気の緩みのせいでも菅政権の経済優先政策のせいでもありません。勿論、渋谷のスクランブル交差点の通行人のせいでもなく、GoToキャンペーン参加者のせいでもなく、商店街や百貨店の買い物客のせいでもなく、レストランの会食客のせいでもなく、満員電車の通勤客のせいでもなく、年末年始の帰省者のせいでもなく、初詣の参拝者のせいでもなく、箱根駅伝沿道の観客のせいでもなく、ディズニーランド入場者のせいでもなく、鎌倉の行楽客のせいでもありません。実効再生産数の増加は、20日前の気象条件によって予めプログラミングされているのです。
新規陽性者数が増えるたびに定量的根拠なく国民や政権のせいにしてブチ切れ続けている玉川徹氏や岡田晴恵氏などのワイドショーのコメンテーター・舛添氏や東国原氏などの文化人・医師会・医クラ・ヤフコメ尾張守は日本社会を徒に混乱させている迷惑行為を国民や政権に謝罪して下さい。
◇
さて、実効再生産数のピークの増減のタイミングは気温差の増減のタイミングとはよく対応しましたが、気温差から実効再生産数の絶対量を予測するのは簡単ではありません(図-4)。
図-4 気温差と実効再生産数の関係(第2波&第3波:ラグ=20日)
ここで、時系列データの多変量統計モデルである【多変量自己回帰モデル=VARモデル Vector Autoregression model】[文献]を用いて各種気象データから実効再生産数を回帰してみたいと思います。
なお、本当に申し訳ないのですが、以下はかなり専門的な議論になります。重要なことなので書くだけ書いておきます。特別な方以外は、最後の結論をお読みいただければと思います。
目的変数である実効再生産数(報告ベース)を記述する操作変数(説明変数)として、図-5に示すような前週との気温差、前週との気圧差、最低湿度(中央7日移動平均)、最大風速(中央7日移動平均)を用います。
これらの変数を選定した理由としては、前週との気温差と前週との気圧差は、自律神経を乱して人間の免疫力を低下させる要因、最低湿度はウイルスの増殖力・感染力を活発にする要因、最大風速はウイルスの移流拡散現象に影響を与える要因と考えられるからです。
図-6はこれらの変数の【相互相関 cross-correlation】を取ったものです。行列の対角成分は自分自身との相関である【自己相関 auto-correlation】を意味します(Rt:実効再生産数、dT:気温差、dP:気圧差、Mois:最低湿度、Wind:最大風速)。
この図を見ると、気温差と気圧差の自己相関には約2週間の周期が認められ、気温差と気圧差の相互相関には1週間程度の位相差があることがわかります。
また、図-7に示す【ピリオドグラム periodogram】のパワースペクトル密度から実効再生産数には約2週間の卓越周期があることがわかります(1/14日の位置にピークが存在する)。
これらのデータをペアリングすることで、多変量時系列のデータセットを構成します。ペアリングにあたっては、報告日から7日前までの気象は報告ベースの陽性者の増減に影響を与えていないと仮定し、実効再生産数と気象データに7日のラグを設定しました。
VARモデルの回帰にあたっては、統計数理研究所が開発したコードであるTIMSACを用いました。操作変数のすべての組み合わせにおいて、データをペアリングし、実効再生産数の回帰にあたってどのような操作変数の組み合わせで何日過去までのデータを計算に組み入れるのが最も尤もらしいかを【情報量規準 information criterion】のFPEC(m)を基に判定しました。
その結果、意外にも気温差は回帰の変数としては最尤とは言えず、気圧差と最低湿度による回帰が最尤であることが判明しました。基本的に同様の周期特性を持つ気温差と気圧差では気圧差がより適合し、また夏と冬の長期トレンドを持つ湿度が長周期成分と適合したものと考えられます。
図-8はVARモデルによる回帰結果です。長~中周期の挙動を非情によく回帰できていると言えます。一方短周期成分についてはやや誤差が認められます。
図-9は回帰結果と実測結果との比較です。
決定係数は0.9282と高い値を取り、現象メカニズムを考察する上では十分な数値ですが、精緻な予測をするためにはやや不十分と言えます。Google予測と比較すれば、短期予測は高い予測精度が期待できると考えますが、中期予測では同程度のパフォーマンスしか期待できません。というのも、図-10に示す【相対パワー寄与率 relative power contribution】を見る限り、実効再生産数の自己回帰の寄与が高いため、ラグが増えるたびに予測値に誤差が累積していくことが考えられるからです。
コロナ感染の要因分析については、別の機会に分析したいと思いますが、自律神経を乱して抵抗力を低下させる気圧差とウイルスの感染力を増大させる最低湿度が、実効再生産数の絶対量の説明変数として推定されていることは物理的にも解釈しやすいと言えます。また、気圧差と気温差は因果関係を有するので、今回の回帰結果をもって気温差が感染の要因になっていないとは言えません。このあたりを今後ツめたいと思っています。
◇
以上、結論として、気象データを用いることによって、実効再生産数の精緻な予測は困難であっても、約2週間の周期を持つ増減のタイミングについては、気温差を用いて約20日前から概ね推定可能であることが判明しました。
コロナ感染の流行のトリガーは、気象のせいであり、国民の気の緩みのせいではありません。政府にできる感染拡大防止対策としては、気温が大きく低下するタイミングを国民に周知して「気をつける」よう注意喚起することであると考えます。あまりにも「当前」な対策ですが、国家緊急権が規定されていない自由と民主主義の日本においてはこれに尽きます。