ベイズ推定によるドーピングの弁護

日本の有名テニス選手が薬物検査の結果陽性と判断されました。
この検査では、ドーピングをしている場合は95%の確率で陽性反応が出ます。
また、ドーピングをしていない場合にも2%の確率で陽性反応が出ます。
この選手がドーピングをした確率はいくつでしょう?

なお、極めて精度の高い情報分析機関の調査にると「日本選手がドーピングをしている確率は一般的に1000分の1程度である」となっています。

この問題は、昨今流行りの「ベイズ推定」を用いてテニス選手をいかに弁護するかという問題です。

おそらくあなたは、「陽性反応が出ているのだから、95%の確率でドーピングをしているはずだ」と考えたのではないでしょうか? 私も「ベイズ推定」を学習する前は同じように考えました。

「ベイズ推定」では次のように考えます。

まず、日本人選手全体の中でドーピングを「している選手」と「していない選手」の事前分布を考えます。分析期間の調査結果を信頼すれば、「している選手1人」に対し「していない選手999人」となります。それぞれの確率は、0.001と0.999に分けられます。

これはご理解いただけますよね。
日本選手という大枠の中で、ドーピングに手を染めている選手は1000人に1人という精度の高い調査結果に基づいて二つに分類しただけのことです。

次に、ドーピングを「している選手」が検査で「陽性反応」となる確率を考えると、95%で陽性反応が出る訳ですから、0.001×0.95で、0.00095となります。パーセントに直すと0.095%なのです。
「じゃあ、この選手がドーピングをしている確率は0.1%もないのか?そんなバカな!」と早合点しないで下さいね。

陽性反応が出たという結果については、もうひとつの場合があります。
ドーピングを「していない選手」が検査で「陽性反応」となる場合です。

そこで、ドーピングを「していない選手」が検査で「陽性反応」となる確率を考えます。先の精度の高い調査結果から日本人選手のうちドーピングをしていない選手の確率は0.999でした。

また、検査の精度については、ドーピングをしていない場合にも2%で陽性反応が出ることになっていましたよね(最初の設問に書かれています)。
すると、この選手がドーピングを「していない選手」であり「陽性反応」が出る場合は、0.999×0.02となります。パーセントに直すと、1.998%です。

陽性反応という事実は動かないので、問題はドーピングを「していた」場合と「していない」場合の割合で決せられます。

前述のように、ドーピングを「している選手」が検査で「陽性反応」となる確率は0.095%でした。そして、ドーピングを「していない選手」が検査で「陽性反応」となる確率は1.998%でした。
「していた」場合が0.095%で「していない」場合が1.998%となり、いずれかしかありません。残りは「陰性反応」という結果が出る場合だけです。

「していた」場合と「していない」場合の比率は、0.095対1.998になります。したがって、陽性反応が出る全ての場合は、0.095+1.998=2.093となります。

陽性反応が出る全ての場合のうち、ドーピングを「していた」のは0.095ですから、0.095÷2.093が、陽性反応が出た場合にこの選手がドーピングをしていた確率です。
パーセントにすると約4.5%となります。

「陽性反応が出たのにドーピングをやっていた確率が4.5%というのは常識的じゃない!」と思われるでしょう。なんだか、ごまかされたような気分になってしまいますよね。

この結果が意外に思われるのは、「日本選手がドーピングをしている確率は一般的に1000分の1程度である」という前提(事前確率)を設けているからなのです。

もし調査結果などまったくなく、とりあえず「五分五分にしよう」ということで、事前確率を50%とすれば「陽性反応が出た」場合に「選手がドーピングをしていた」確率はウンと上がるはずです。

しかし、それでも当初予想していた95%より低い数値になるはずです。
本稿の計算を参考にして、是非ご自身でトライしてみて下さいね。
「ベイズ推定」のイメージがつかめるはずです。

なお、本設問は「数理法務のすすめ」(草野耕一著 有斐閣)P24を参考にしました。
解説は一般の方々に平易に理解できるよう私が作成したものです。

荘司 雅彦
幻冬舎
2016-05-28

編集部より:このブログは弁護士、荘司雅彦氏のブログ「荘司雅彦の最終弁論」2017年1月26日の記事を転載させていただきました。オリジナル原稿をお読みになりたい方は荘司氏のブログをご覧ください。