超過死亡における計算方法の問題点

deepblue4you/iStock

先日、Think Vaccine主催の超過死亡に関するシンポジウムが開催され、現在YouTubeで公開されています。3時間42分に及ぶ非常に長い動画ですが、超過死亡に興味がある方は視聴しておいて損はありません。普段アゴラで発言している人も多数参加しています。

このシンポジウムのなかで、小島勢二氏が感染研の超過死亡の計算方法の問題点を指摘しています。「2023年の超過死亡を計算するにあたって、計算の根拠となるデータに2022年のデータを加えることは問題があるのでないか」という指摘です。2022年は超過死亡数が非常に多かったため、そのデータを加えて計算すると、2023年の超過死亡数が不当に少なくなる可能性があります。

超過死亡はインフルエンザの関連死を推定するために開発されました。感染症が流行しなかった時と比べて、どれくらい死亡者が増加したかを把握することが本来の目的です。単純に過去数年のデータより、死亡者の増加を推定することが目的ではありません。

この問題は感染研も把握しているようであり、鈴木基氏はアドバイザリーボード(p94)で次のように解説しています。少々長い解説ですが、重要な解説ですので全文を引用しておきます。

  • パンデミック3年目を迎え、パンデミック発生後に収集されたデータをどのように取り扱うかを検討中である。その理由は、超過死亡数のベースラインを算出する際に、パンデミック期間(2020年以降)のデータを含めるか含めないかの判断は、純粋に統計学的な判断として一義的に定まるものではない側面を持つためである。
  • 具体的には、新型コロナをエンデミック(一定期間で繰り返される流行)として捉えた場合には、2020年以降のデータを含める方がより解析として整合的であると考えられる。一方、それをパンデミック(世界的大流行)として捉えた場合には、2020年以降のデータを含めない方が、より解析として整合的であると考えられる。この二つの違いは観点の違いによるものであり、さらに、今後の感染動態に依存して判断の妥当性が左右される部分もあるため、少なくとも現時点で科学的にどちらか一方が正しいというものではないことに留意が必要である。
  • 米国疾病対策予防センター(CDC)は、2020年2月以降のデータを含めず、新型コロナをパンデミックとして扱っている(以下これを「CDC方法」と呼ぶ)。世界保健機関の算出方法も同様である。
  • 一方、日本の本厚生労働省超過死亡研究班では、5年間のベースライン計算の中に2020年以降のデータを含め(例えば2022年の1月や2月の超過死亡算出に対して)、統計解析的には現状がエンデミックに向かっていることを含蓄している(もちろんベースライン期間の超過・過小判定に対してはその影響の補正を行なっている)。
  • 2020年以降のデータを含めるか含めないかの差は、現時点(2022年2月まで)の超過死亡数の算出結果に極端な解釈の違いを与えるほどではない(右表、次ページ図参照)。これはベースラインは5年分の長期なデータに基づいて行われるためである。
  • 右表は、CDCや世界保健機関、他超過死亡評価の国際的な枠組みとの比較目的で、CDC方法で超過死亡数を算出した場合。
  • パンデミック3年目以降の超過死亡数算出からは、2020年以降のデータがベースラインの計算に使用されるデータのおよそ半分を占めるようになるため、これらのデータが数学的に与える影響は大きくなると想定される。

最後の文が重要です。感染研も早急にCDC方式に変更するべきと、私は考えます。

超過死亡を単純平均値で推定することの問題点も指摘しておきます。この問題は以前のnoteの論考でも指摘しました。その時に使用したグラフを流用します。

OurWorld inDataでは2つのグラフが呈示されています。

まず、Human Mortality Database、およびWorld Mortality Datasetの数値を使用した超過死亡のグラフです。2020年は超過死亡がマイナスであることを示しています。

次に、過去5年間の死亡者数の平均を超過死亡としたグラフです。2020年は超過死亡がプラスであることを示しています。

超過死亡の計算方法が異なると結果が逆になってしまうことが有り得るのです。後者のグラフで2020年の超過死亡がプラスとなる理由は、日本の少子高齢化に伴う死亡者の自然増が計算において考慮されていないからと考えられます。