緊急事態宣言が都道府県ごとに解除される中、ハッキリ言ってピントがズレているのは、専門家会議が感染者の【空間分布 spatial distribution】を定量的に把握することなく、都道府県ごとの感染者数の時間変動のみを参考にブレイン・ストーミングによって緊急事態の解除の可否を検討していることです。
緊急事態の空間的な解除を見極めるにあたって、本当に重要なことは、特定地域の感染率の空間分布の挙動が時間の経過とともにどのように変化しているかという【時空間挙動 spatio-temporal behaviors】を把握することです。また、同一都道府県内においても歴然とした【不均質性 heterogeneity】が存在し、都道府県という行政区分で一括りに規制している現在の状況は極めて非効率であると考えられます。
そもそも、感染者数の時間変動に加えて空間変動を把握することは、感染のリスク対応を行う上でも極めて重要です。しかしながら、専門家会議は残念なことに空間変動についてはこれまでに定量的に議論してきませんでした。
新型コロナウィルスの時空間における感染状況を把握するにあたって、専門家会議は各都道府県における新規感染者や死亡者の時系列データを見比べることで「東京では感染が拡大している」「千葉では感染が収まったきた」といったような認識をしばしば表明しています。これは特定の空間断面における時間変動をもって、時空間の挙動を把握する試みです。
しかしながら、専門家会議は各時間断面における新規感染者や死亡者の空間分布データを見比べることで感染状況を把握するには至っていません。おそらくこれは、特定の場所でしか得られていない空間データから面としての空間分布を推定することに対する数学的なスキルを疫学分野が十分に持ち合わせていないためと考えられます。
現在、インターネットで公開されている新型コロナ関連の貴重な空間情報としては、新規感染者の居住地の役所の位置に感染の累積数を円状にプロットした[ジャッグジャパン]のマップがあります。ただ、残念なことに、このマップもデータが得られていない箇所に対してデータの値を厳密に予測するものではありません。
さて、そんな状況において、めちゃくちゃたまたまなのですが、実は私にはちょっとだけ【空間統計学 spatial statistics】の知識とスキルがあります。何を隠そう、特定の空間地点におけるデータから、データが得られていない任意の地点のデータを確率統計学的に推定するという浮世離れした計算が結構得意なんです(笑)。そこで、この記事では、現代の空間統計学の先端的な手法を駆使することで、一週間間隔で新型コロナ感染マップを作成し、その時空間挙動をイメージングしてみたいと思います。
推定の対象
この記事でイメージングの対象とするのは、近畿の2府6県(大阪府・京都府・兵庫県・奈良県・三重県・滋賀県・和歌山県・福井県)の新規感染者の空間分布です。近畿を分析対象としたのは、近畿の自治体は、東京都とは異なり、感染初期から感染者の居住市町村(京都府・和歌山県は保健所の管区)を時系列に沿って発表しているため、ある程度の推定精度での空間統計分析が可能であるからです。
なお、新型コロナウィルスの感染は、感染者のすべての行動範囲で発生しており、必ずしもその居住市町村で発生しているわけではありません。しかしながら、感染者の行動範囲が居住市町村の位置に依存するのも確かであり、感染の伝播メカニズムを考える上では、一つの有力な参考情報になるものと考えられます。
推定の手法
この記事においては、空間統計学のメインストリーム分野である【Geostatistics】におけるもっとも論理的に洗練された空間推定手法である【Sequential Gaussian Simulation】を用いて、新型コロナウィルス感染初期から現在に至る各時間断面において、データが得られていない空間箇所の感染率を推定したいと思います。
なお、GeostatisticsおよびSequential Gaussian Simulationについては、この記事での説明を省略します。興味のある方は次の文献をお読みください。
[Geostatisticsの基礎]
[Geostatistical Simulationの基礎]
[Sequential Gaussian Simulationの簡単な説明]
[Sequential Gaussian Simulationの解析コード]
[Sequential Gaussian Simulationの解析コードの説明]
[Sequential Gaussian Simulationの適用例(築地市場の土壌汚染)]
推定の手順
感染率の推定の手順は次の通りです
(1) データの入手
近畿の2府6県(大阪府・京都府・兵庫県・奈良県・三重県・滋賀県・和歌山県・福井県)について公式websiteから、すべての感染事例について、発表日時と居住市町村の情報(京都府と和歌山県は保健所管区)を入手する(全172か所)。調査中の事例及び市町村不明の場合には県庁所在地を居住市町村と仮定する。
(2) データセットの作成
3月11日~17日、3月18日~24日、3月25日~31日、4月1日~7日、4月8日~14日、4月15日~21日、4月22日~28日、4月29日~5月5日の8週ごとに居住市町村の事例を計数し、人口データを基に各ケースで10万人あたりの感染者数(つまり感染率)を算出する。これにより、各期間ごとに居住市町村の役場の位置と10万人あたりの感染者数を対応させたデータセットを作成する(下図はその一例。座標の単位はkm)。
作成したデータセットを用いて、対象領域の【空間的相関性 spatial correlation】を予め評価した上で、Sequential Gaussian Simulationを行う。シミュレーションは各期間ごとに100ケース行い(異なる100種類の乱数列を用いる)、対象地域に設定した2km間隔のメッシュの交点(約2万箇所)で10万人あたりの感染者数を予測する。最後に各位置で100ケースの平均をとることで、その位置の期待値とする。
なお、今回の推定方法は、シミュレーションと言っても、突拍子もなく「42万人の感染死亡者」を予測した疫学のSIRモデルのシミュレーションとは異なり(笑)、上図に示したような多数の実測データを厳密に補間する統計シミュレーションです。また、推定誤差分散やリスク評価マップも同時に得たのですが、今回は欲張らずに推定値マップだけを紹介したいと思います。
各時期における感染者の空間分布
退屈な説明が長くなりましたが、ここからは結果として得られた推定値マップを時系列順に概観して行きたいと思います。まずは、クラスター対策班が中国からの第一波を抑制した後に欧州からの帰国者の感染が顕在化した頃の推定値マップです。
さて、3月末になると、大阪市や京都中部でやや感染率が高くなります。
年度末を通過すると大阪の感染域は東方に伸長して行きます。
緊急事態宣言が出た後、阪神地方にメガクラスターが発生します。東は奈良まで繋がっています。また、京都市のウィルスは大津方面に侵攻して行きます。
この時期には全国規模でもピークを迎えることになります。
さらに翌週も感染は拡がり、京都・大阪・神戸のクラスターが一体化しました。
そして翌週になると、クラスターの連続性が途切れ、ドラスティックに近畿地方の感染率が低下します。
GWに突入すると京都のクラスターはさらにデカップリングを見せ、奈良も大阪のクラスターから抜けました。
さて、次の一連の図は、各機関ごとに実測値の点間の距離に対するバラツキの大きさをプロットした【variogram】と呼ばれるグラフです。
メガクラスターが発生した4月8日から4月21日の期間にバラツキが全体に低下し、近傍の点ほどバラツキが小さくなっています。このことは、感染拡大期に点間の値が類似して連続性が高くなったことを示しています。この空間特性は感染拡大縮小の一つの指標として有効です。
感染者の累積数の空間分布
次の図は1月末から5月12日までに報告された感染者の累積数の空間分布を示したものです。
提言
私がこの記事に関するすべての情報収集から計算作業にかけた時間は約20時間です。データ整理を一度済ませれば、更新にはそんなに時間がかかりません。
日本政府は、空間統計学の専門家に依頼して、日本全国を対象としたこの手のマップをデイリーに更新すべきです。今後の感染制御に大いに役立つのは勿論のこと、国民に対する注意喚起としても有効です。少なくとも、空間の不均質性が高い感染症の時空間挙動を効果的に把握するには、空間断面における時間変動の議論よりも、この記事で行ったような時間断面における空間変動の議論が重要であることは自明です。
編集部より:この記事は「マスメディア報道のメソドロジー」2020年5月19日の記事を転載させていただきました。オリジナル原稿をお読みになりたい方はマスメディア報道のメソドロジーをご覧ください。