東京で何が起きていたのか/コロナ感染率の空間分布

藤原 かずえ

[先日記事]では【地球統計シミュレーション geostatistical simulation】により関西地方における新型コロナの期間感染率の【空間分布 spatial distribution】をイメージングしましたが、今回は同様の方法で、東京を中心とする関東地方における新型コロナの期間感染率の空間分布をイメージングしてみたいと思います。

関東地方における期間感染率の空間分布については、東京都が新規感染者の居住地市区町村を感染症例ごとに発表していないため、一度は推定をあきらめていましたが、日々更新されてしまう東京都の各市区町村における累計値を、東京都あきる野市が、4月1日からすべてストックして[公式website]で公開していることを知り、4月1日以降について、推定に必要となる時空間データを得ることができました。

以下、簡単に推定の方法を説明した上でイメージングの結果を紹介したいと思います。

推定の対象

この記事でイメージングの対象とするのは、東京を中心とする関東平野における期間感染率の空間分布です。感染者の居住地をベースとして感染率の推定値マップを作成するすることで、新型コロナの感染メカニズムの傾向を分析してみたいと思います。

ここで、新型コロナウィルスの感染は、感染者のすべての行動範囲で発生するものであり、必ずしもその居住市区町村で発生したと決めつけることはできません。今回の推定は、あくまでも感染者の居住市区町村における感染率がある程度感染プロセスを反映しているという仮定の下で、感染事象の空間変動の傾向を分析しようとするものです。勿論、感染者の行動範囲が居住市区町村の位置に依存することは確かであり、感染の伝播メカニズムを考える上では、一つの有力な参考情報になるものと考えられます。

推定の手法

推定手法は、前回同様、空間統計学のメインストリームである【地球統計学 geostatistics】における最もパワフルな空間推定手法である【sequential Gaussian simulation】です。この手法は、【空間的相関性 spatial correlation】(簡単に言えば、位置が近ければデータの値が似たような値を示し、位置が遠ければ無関係になるといったような一般的な空間の性質)を予め把握した上で、その性質に従うような乱数を使ったシミュレーションによって、データが得られていない空間箇所のデータを推定するものです。この手法は、地球統計学の通常の推定手法よりも空間的相関性の再現性が高いため、高精度で空間分布を推定することができます。興味のある方は次の専門書をお読みください。

[Geostatistics: Modeling Spatial Uncertainty]
[Geostatistical Simulation: Models and Algorithms]

推定の手順

感染率の空間分布の推定の手順は次の通りです

(1) データの入手
関東各県及び東京都あきる野市の公式websiteから、すべての新型コロナ感染事例について、発表日時と居住市区町村の情報を入手する。調査中の事例及び市区町村不明の場合には県庁所在地を居住市区町村と仮定する。なお、東京都については、感染症患者公表数の大幅な修正分を説明なしに加えた発表が複数回にわたり実施されているが、その日のデータ値については前後の値から線形補間して求め、超過分については過去データに比例配分して調整した。

(2) データセットの作成
3月18日~24日、3月25日~31日、4月1日~7日、4月8日~14日、4月15日~21日、4月22日~28日、4月29日~5月5日、5月6日~5月12日、5月13日~5月19日の9週ごとに居住市区町村の感染事例を計数し、人口データを基に期間ごとの10万人あたりの新規感染者数、つまり期間感染率を算出する。このデータに、居住する市区町村の役場あるいは居住する[保健所管轄区域](近接した複数の市町村から構成される)の保健所の位置を対応させたデータセットを作成する(下図はその一例。座標の単位はkm)。なお、領域境界部における推定精度向上のため、隣接する山梨県・静岡県・長野県の市町村もデータセットに加えた。

なお、3月18日~24日および3月25日~31日の区間における東京都の市区町村データは存在しないので、入手可能な東京都全体の期間感染率を都庁位置に割り当てた。

(3) シミュレーション
作成したデータセットを用いて、対象領域の空間的相関性を【ヴァリオグラム variogram】と呼ばれる統計量によって予め評価した上で、Sequential Gaussian Simulationを行う。シミュレーションは期間ごとに100ケース行い(異なる100種類の乱数列を用いる)、対象地域に設定した2km間隔のメッシュの交点(約1万箇所)で10万人あたりの期間感染率を予測する。最後に各箇所で100ケースの平均をとることで、その位置の期待値とする。

関東における期間感染率の空間分布

ここからは結果として得られた期間感染率の推定値マップ(確定日ベース)を時系列順に示した上で、分布性状について概観して行きたいと思います。なお、参考のため、最初に政府発表の確定日ベースならびに発症日ベースの感染者数の時間変動のヒストグラム(全国)を示しておきます。

(1) 3月18日~24日

この週においては、クラスター対策班が中国からの第一波を抑制した(19日専門家会議による「一定程度持ちこたえている」との見解)ことから国民の間にやや安心感が広がりました。「気の緩み」と呼ばれた3連休は20日~22日です。その一方で、欧州からの感染リスクが顕在化し、政府は19日から欧州など38カ国に入国制限をかけました。

東京五輪延期のムードが高まり、正式に延期が発表されたのは24日です。小池都知事は23日の会見で「ロックダウン」「オーバーシュート」という横文字を使って感染爆発の危機を訴えました。また、海外在住の出羽守は一斉に「東京は2週間後、ニューヨークになる」などと大騒ぎしました。


推定値マップを見ると、茨城県南部や神奈川県西部などの感染率が高い地域がいくつか認められますが、その多くは人口密度が比較的低い地域です。また感染率が高い部分と低い部分がはっきりと別れているのが特徴です。このような分布性状からこの時期の感染の主たるメカニズムは、人々の移動を介したウィルスの【移流現象 advection】によるものと考えられます。

(2) 3月25日~31日

年度末であるこの週に大きな話題となったのが、人気コメディアンの志村けんさんが29日に新型コロナ肺炎で亡くなったことです。この頃から自衛隊が空港検疫に参加するようになり、31日には大量の感染者を隔離しました。これにより日本政府は、偏微分方程式でいえば、感染現象の【ノイマン境界条件 Neumann boundary condition】をほぼゼロに固定したと考えられます。以降は閉じた系における【初期値問題 initial value problem】となります。後に判明しますが、この年度末の期間に発症日ベースでの新規感染者数がピークアウトすることになります。


推定値マップを見ると、東京の都心部に突如大きなクラスターが発生したのがわかります。また、千葉県の香取では障害者福祉施設で大規模な集団感染が確認され、成田を中心とする大きな範囲のクラスターが発生しています。なお、この頃から、感染率が高い部分の周縁部で感染率が低い部分との中間的な感染率を呈する部分が拡がり始めました。これは地元で活動する人々を介したウィルスの【拡散現象 diffusion】と考えられます。

(3) 4月1日~7日

この週に大きな話題となったのが、3日に「8割おじさん」こと西浦博氏が、接触8割削減を国民に要請したことが挙げられます。そしてこの期間の終わりの7日に政府は緊急事態を宣言しました。


推定値マップを見ると、感染の拡散が進み、関東平野下流部一帯にメガクラスターが出現しました。このようにクラスターが拡散して一体化するメカニズムは、実際に関西でも認められています[記事]

(4) 4月8日~14日

この週においては、国民の接触率の低減度合は4割程度にとどまっていました。西浦氏の計算によれば、4割の削減では新規感染者数は減らないとのことでしたが、発症日ベースの新規感染者数は着実に低下していました。


確定日ベースで新規感染者数がピークアウトしたのもこの期間です。推定値マップを見ると、秩父-奥多摩-富士-箱根と連なる高地を除いて、関東中南部を一体化する(空間統計学的な意味での)メガクラスターが発生しています。クラスターの中心は人口が密集する東京23区といわゆる京浜・京葉地域であり、多くの新規感染者が発生しました。都心-千葉県香取、都心-茨城県坂東、都心-埼玉県所沢、都心-神奈川県鎌倉を結ぶ線状構造も認められます。

また、群馬県の伊勢崎から富岡あたりにも比較的連続したクラスターが存在します。このような線状構造の形成は、特定の経路で移動する人々を介したウィルスの【分散現象 dispersion】と考えられます。ちなみに、これまで述べてきたように、ウィルスが人々を介して移流・拡散・分散するのは、物理学でいう典型的な【物質輸送現象 mass transport】であり、感染症の物理モデルに考慮すべき内容であると考えます。

(5) 4月15日~21日

この週に大きな話題となったのが、15日に西浦氏が「何もしなければ42万人が死亡する」という試算を公表し、8割削減を強調したことでした。しかしながら実際には、感染爆発どころか、確定日ベースの感染者数がピークアウトしました[グラフ] [説明]


推定値マップを見ると、都心クラスターと他地域のクラスターを始めとして連結していたクラスターの【分断 decoupling】が認められます。

(6) 4月22日~28日

GWを間近に控えたこの頃になると、テレビのワイドショーによるデマや不安を煽る根拠不明の情報が感染爆発しました。[デマ][扇動]【スーパースプレッダー super spreader】も登場し、日本列島は自粛警察が分割統治する【インフォデミック infodemic】状態となりました。

推定値マップを見ると、メガクラスターはドラスティックに縮小し、主要クラスターの分断も進行しているのがわかります。

(7) 4月29日~5月5日

前代未聞の「自粛のGW」においては、皮肉なことに日本のほとんどの主要都市で接触8割減が達成されました。しかしながら、新規感染者数の減少スピードが速まることはなく、接触率が減っても一定でした。これについて専門家会議は「減少のスピードは期待したほどではない」と不満を口にしました。専門会議の言われるままに自粛命令に従った私たち国民に対して専門家会議は無慈悲にも失望を表明したのです(笑)。


クラスターの縮小と分断の傾向はこの週にも継続します。

(8) 5月6日~12日

この週の初めには多くの地域で新規感染者数はほぼゼロになりましたが、緊急事態宣言はGW明けも全国一律で継続されました。しかしながら、驚くべきことに、緊急事態宣言延長に対して国民の80%が「評価」するという[世論調査結果]が出たのです。ワイドショーに不安を扇動された日本では、ゼロリスク信仰が蔓延していたものと考えられます。


推定値マップを見ると、東京湾沿岸のクラスターが分断され、大部分の地域で新規感染者は認められなくなったことがわかります。

(9) 5月13日~19日

推定値マップを見ると、一部の地域を除いてクラスターは崩壊し、東京23区を中心とする都市部で新規感染者は激減しました。

さて、下図は、空間的相関性を表すヴァリオグラムという関数のグラフを時系列順に並べたものです。ヴァリオグラムとは、観測データ間の距離を横軸に、観測データ間の値の非類似度の程度を表す量を縦軸にとってプロットしたものです。

一般に観測データ間の距離が小さいとよく類似した値を示す(非類似度が低い)のですが、距離が大きいと非類似度が高くなり、標準化したデータの分散値(【シル sill】=1)と一致するようになります。ヴァリオグラムにおいてどのくらいの距離まで類似するのかを表すパラメータが【レンジ range】と呼ばれる量です。下図を見ると、GW前後でレンジが非常に小さくなったことがわかります。このことは、人々が遠出しなくなり、近所で感染を発生させていることを示します。





関東における累積感染率の空間分布

感染が初めて報告された1月15日から5月19日までの累積感染率の推定値マップを下図に示します。

本図を見れば、東京23区と川崎を中心に関東平野一円に感染現象が発生したことがわかります。香取で発生した集団感染も東京の感染率とほぼ同じであったことがわかります。いずれにしても、感染域の中心に高感染率の地域があり、感染の拡散現象が広い範囲に認められることがわかります。

ヴァリオグラムを見るとレンジは50km程度となっています。これは都市部における最大通勤距離と概ね一致します。


東京23区における感染率のセクターマップ

ここまでは関東地域における推定値マップを示してきましたが、感染の中心地となった東京23区におけるより詳細な推定値マップを示したいと思います。東京23区の観測データの空間位置は、次の図に示すように、便宜上、区役所の位置とします。

これら東京23区のデータの他に東京23区に隣接する市の空間データも加えてデータセットを作成し、同様の方法でイメージングを行いました。なお、予めお断りしておきますが、マップの南東に位置する3つの人工島(海の森公園と中央防波堤)付近につきましては、データを外挿して推定しているため、推定精度が他の箇所と比べて著しく低くなっています。この周辺地域については無視していただいた方がよろしいかと思います。

さて、推定値マップを時系列順に並べると次の通りです。








また次の図は全期間を通した累積感染率の推定値マップです。


これらの図からわかることとして、東京の感染の中心は新宿区、渋谷区、港区であり、この地域を中心にして概ね同心円状に拡がったということです。またGW明けには、一部を除いてほぼ感染を封じ込めていると言えます。

今は感染がある程度収束している東京都ですが、もしリアルタイムにこのような情報が得られていれば(実際可能)、市民への注意喚起にもなったでしょうし、対策も効果的になったものと考えられます。なぜ東京都がこの程度のマップを作成して市民に周知しなかったのか、大いに疑問です。

提言

本記事では、空間統計学を用いて、関東地方の新型コロナの感染率をイメージングしました。今回示した推定値マップは、あくまで感染者の居住市区町村に関するデータを基に、データの得られていない箇所を数学的に推定したマップに過ぎませんが、感染の空間変動の傾向をある程度反映していることは自明です。またこのような空間変動のマップを時間ごとに作成すれば、感染の【時空間挙動 spatiotemporal behavior】を極めてわかりやすく正しく認識することができるものと考えます。


ところが、専門家会議の新型コロナ対策においては、マップを作成することなく、下図に示すように各都道府県ごとに感染の時間変動のみを分析して対策を検討しているのが現状です。


一見してわかるように、これでは都道府県の境を跨いだクラスターにも対応できませんし、同一都道府県内における感染状況の【不均質性 heterogeneity】にも対応できません。例えば、この記事で示したように、同じ東京都でも東京23区と西東京地域では全く感染状況は異なりますし、東京23区内でも中心部と辺縁部では大きく感染状況が異なります。このような不均質な空間分布を把握することなしに、同一都道府県全域でヤミクモに同じように自粛するリスク対応は極めて非効率です。

日本国民は各個人が高い教養を持っているので、仮にこのような情報を与えられれば、感染の回避を自律的に行うことができるものと考えます。重要なのは、私のような民間人がインターネットからデータを取得してこのようなマップを作るのではなく、公的機関がオーソライズした形で、同種のマップを毎日作成し、国民に明示することであると考えます。


編集部より:この記事は「マスメディア報道のメソドロジー」2020年5月29日の記事を転載させていただきました。オリジナル原稿をお読みになりたい方はマスメディア報道のメソドロジーをご覧ください。