さらに改善が必要なオープンデータ戦略

官民データ活用推進基本法の施行以来、行政データの公開(オープンデータ)戦略はいっそう推進されている。しかし、先日の情報通信政策フォーラム(ICPF)セミナーでは、まだ多くの課題があるとの指摘がでた。

内閣官房データカタログサイトより

ICPFでは、健康医療介護分野でのオープンデータ活用について、鴨川威氏に講演いただいた。鴨川氏は、横浜市の二つの部局が独立して公表した区民健康意識調査の結果と高齢化・介護系統計を組み合わせて、市内各区の特徴を分析した。そして、健康でないと自覚している人の割合が高くても、それは高齢化率や要介護率とは必ずしも相関しないなど、区ごとに異なる特徴を明らかにした。

しかし、この程度の分析では地域密着型健康医療介護サービスの提供には不十分だと、鴨川氏は主張した。地域包括支援センターが小学校区単位で設置されているように、的確にサービスを提供するには町丁目単位での分析が不可欠だというのだ。

行政が町丁目単位でのデータの公開をためらう理由の一つは個人情報保護である。町丁目単位で疾病分布を公開したら、難病患者が特定される懸念がある。しかし、データをマスキングしたり、疾病カテゴリーを統合したりすれば対処できるのだから、個人情報保護への過剰な配慮は不適切である。粗い粒度での公開はオープンデータの価値を損ねると行政は自覚してほしい。

同様の分析を他の自治体で行おうとしても、データ項目が違うので容易ではない。確かにそうだ。一方が「要支援1」から「要介護5」を分計しているのに、他方がまとめてしか公表していないとしたら、両自治体の比較はできない。あるデータセットでは「虎ノ門三丁目」、他では「虎の門3丁目」、別のものでは「虎ノ門3」と表記するといったばらつきもある。データ表記の標準化が行政データ公開の前提になる。そもそも、異なる部局間でデータを統合して利用するといった内部業務にも、データ表記方法の標準化は求められる。

セミナーでは統計データの信頼性も議論された。統計データの大半はサンプル調査に基づいている。それゆえ、サンプルバイアスが信頼性を下げる。たとえば、膨大なページ数の回答を紙に記入するように求めたら、協力する国民の数は減り、回答を集計しても国民を代表する結果にはならないかもしれない。

スマホやパソコンを活用したオンライン回答型の統計調査に移行すること、マイナンバーを活用すれば取得できる情報にわざわざ回答を求めるのは避けること、といった意見がセミナーで多く出た。特に、企業版のマイナンバー(法人番号)については公開されており、行政機関を越えての紐づけも何ら問題ではないので、上手に活用すれば統計調査のいくつかは不要になるかもしれないとの指摘もあった。

オープンデータ戦略には行政の透明性を高め、説明責任の一部を果たす価値があるが、さらに改善が必要である。