自治体はビッグデータを使いこなせ:官民データ活用推進

gremlin/iStock

官民データ活用推進基本法が2016年12月7日に公布・施行されました。

基本的施策としては、

  • 行政手続に係るオンライン利用の原則化・民間事業者等の手続に係るオンライン利用の促進(10条)
  • 国・地方公共団体・事業者による自ら保有する官民データの活用の推進等、関連する制度の見直し(コンテンツ流通円滑化を含む)(11条)
  • 官民データの円滑な流通を促進するため、データ流通における個人の関与の仕組みの構築等(12条)
  • 地理的な制約、年齢その他の要因に基づく情報通信技術の利用機会又は活用に係る格差の是正(14条)
  • 情報システムに係る規格の整備、互換性の確保、業務の見直し、官民の情報システムの連携を図るための基盤の整備(サービスプラットフォーム)(15条)
  • 国及び地方公共団体の施策の整合性の確保(19条)
  • その他、マイナンバーカードの利用(13条)、研究開発の推進等(16条)、人材の育成及び確保(17条)、教育及び学習振興、普及啓発等(18条)

が挙げられている。

同法は様々な目的がありますが、私が最も注目するのは11条の「国・地方公共団体・事業者による自ら保有する官民データの活用の推進」です。

これは官民のデータを組み合わせて生み出すことができるビッグデータを活用しようというものであります。

無論、個人情報は匿名化することが前提で悪用はできません。

民間事例ですがビッグデータ等から得られた成功事例を3つ挙げます。

【事例1】おでんと気温変化

一つ目として、有名ですが、コンビニのおでんと気象データを取り上げます。

コンビニで、おでんが店頭に並ぶ時期は徐々に早くなり、現在ではお盆を過ぎた頃からとするのが通例となっております。

これは気温の低下とおでんの売り上げに相関関係があったためです。

例えば気温が15℃を下回り寒いから食べたいと思うのではなく、気温の低下が、おでんを食べたくなるフラグだったというわけです。

【事例2】マクドナルドのフィレオフィッシュ

私自身も新中野の朝マックでアルバイトをした実体験ですが、雨天時にフィレオフィッシュの売り上げが上がることは従業員であれば周知の事実です。

2017年にテレビ番組の「水曜日のダウンタウン」でも取り上げられたそうですが、マクドナルドとしては科学的な根拠はわからないということです。

しかし事実は存在しており、普段よりもストックを多めにすることはオペレーション上重要なポイントでありました。

【事例3】桜の開花予想

2月1日以降の日最高気温の合計が600℃に達すると開花とするという「600℃の法則」を気象会社は使っております。

気象が植物に与える生理現象との関係性は解明できておりませんが、これが世に浸透している理論であり、これによる開花予測のずれは大きくても3日間だということです。

開花の時期の目安がわかる 東京の桜「600℃の法則」とは
九州や四国でソメイヨシノの開花が始まり、いよいよ桜の開花前線が進み始めました。東京でも早ければ明日にも桜が開花する予想です。今回は、単純な計算で開花の時期の目安がわかる「600℃の法則」をご紹介します。

ビッグデータを分析し、統計上、相関関係が高いものを抽出できれば、科学的根拠の有無に関係なくとも売り上げ向上、レジャー準備に必要な情報などを生み出すことができ、経済効果を生み出すことができます。

自治体が持つデータからも政策立案に有効なデータをみつけられるのではないかと期待しております。

ところで、相関とは何を示すのか、総務省統計局HPの内容を借用すると、

2つの変量がどの様な関係性を持っているかを分析する方法の一つに、相関係数によって比例的な関係性を数値で示す方法があります。

相関係数は-1から1までの値を取り、以下のような特徴を持ちます。

  1. 正の相関が強いと相関係数が1に近づく
  2. 負の相関が強いと相関係数が-1に近づく
  3. 相関係数が1又は-1のときは完全相関という
  4. 相関係数が0の付近は相関がないといえる

となっております。

簡単に言えば、点群が何やら、線の形に近ければ、相関関係が高いということです。

相関関係を調べる上で、一番シンプルなものとして、中学校の数学で習う一次関数があります。

Y=A×X+B

下図は私の過去の記事で中野区の年齢・生活保護費の関係です。

お先真っ暗、自治体財政の将来推計:中野サンプラザ建て替え要因
>>>前回の記事「なぜ中野サンプラザを建て替える必要があるか?」はこちら なぜサンプラザは建て替える必要があるのか② 少子高齢化は、我々に厳しい現実を突きつけることは国の試算から誰もが認識している。 しか...

ここで、上記式のBをゼロと仮定しているため、

Y=A×X

としました。

黄色の線で示される80歳以上の人口と生活保護費の関係は、ほかの年齢よりも相関係数R2が高いことがわかります。

この関係性を用いて、国の研究所が推定した人口予測値Xを与え、生活保護費Yの概算ができるという仮説を立て、将来のシミュレーションをしました。

自治体、中野区は情報の宝の山となる多種多様のデータを所持しておりますが、各所管でデータを管理しているため、分析は困難です。

ビッグデータを作成し、分析をするための環境整備には以下のことが必要です。

まず自治体のルールとして、官民データ活用推進基本法では、特別区を含む市町村は「市町村官民データ活用推進計画」の策定が努力義務とされています。

中野区では第2次中野区地域情報化推進計画を当該計画として位置づけており、これから指針や計画を検討することになっておりますが、官民データ活用を推進するためのルールの基盤はできております。

次に自治体がもつデータの整理です。

以下の表は縦割り行政の結果できたデータリストの概要です。

自治体によってこのリストは異なりますが、人口が多いほど、分割数が多い傾向とのことです。

各所管が個々に所持するデータに横串を刺すためにはとんでもない胆力が必要なはずでした。

しかし国は地方公共団体情報システムの標準化に関する法律に基づき、地方公共団体の基幹業務システムの統一・標準化に取り組むように各自治体に指示、令和7年度末までに、ガバメントクラウドを活用した標準準拠システムへの移行を目指すことになりました。

つまり全国でデータフォーマットを統一するということです。

ちなみに上表の1・2期というのは国が標準仕様書を発出する順番です。

システム(ベンダ)ごとにバラバラであったデータフォーマットが一本化されるこの取り組みの延長線上にビッグデータの作成を綿密に計画することが重要だと考えます。

ビッグデータ作成・活用することでEBPM(エビデンス・ベースト・ポリシー・メイキング。 証拠に基づく政策立案)に資する自治体運営ができます。

例えば、公益社団法人香川県歯科医師会HPに掲載されている香川県「歯と健康と医療費に関する実態調査」よると、歯の健康が保てている方、歯科健診受診頻度の高い方の医療費が低いことが示されております。

歯数、歯周病程度、歯科受診頻度などがXで、医療費がYとなります。

Xの値をどのようにコントロールするかが政策の肝となるわけです。

このような情報が自治体のビッグデータから得られると考えます。