10月19日に投稿した「立憲民主党の支持率上昇中。選挙予想をしたいと思ったら」は、アゴラおよび、転載先のYAHOOニュースにおいても、投票日当日までランキングインしていた。それなりの数の方に読まれたのだろう。
今回の票の読みにくさ。とりわけ、立憲民主党の票は計算がしにくかったので、アゴラの記事がなんらかの情報収集先になっていたものと推測している。
データーマイニングとは
データマイニングについて聞かれたので、お答えしておきたい。データベースに蓄積されたデータの中から価値のある情報を引き出し、隠れた関連性を見いだす手法になる。単純なデータ分析で核心を見出すことは難しい。
米国では、選挙にデータマイニングを使用することは一般的である。2012年オバマ陣営がIT分析チーム「THE CAVE」を活用しここで得られた情報が、再選の大きな原動力になったといわれている。SNS、有権者データ、世論調査結果などを統合した上で、予想分析をおこなった。この頃から、ビッグデータの活用方法が話題になる。
前回の記事で私は次のような内容を提示した。
立候補者数78名を考えると、そこまでは(60±10議席)届かないことが考えられる。さらに、立憲民主党は全ブロックに比例単独候補が立候補していない。投票数次第では、議席が割り当てられるであろうブロックもあり、議席がムダになる可能性もある。
これに対して、「デマである」ことを指摘された。「AERA dot」は本件には関係ないが、この記事に書かれていることが参考になるので以下に紹介したい。
大躍進の枝野立憲民主党「比例で候補者不足がおきる」という噂はデマ?
--ここから--
各メディアの情勢調査では、立憲民主で候補者不足がおこることが確実な選挙区はない。
先述した全員当選の可能性がある北陸信越、東海、四国ブロックでも、現在の比例予測議席の最大数を確保し、さらに1~2議席上積みしなければ候補者不足はおこらない。北海道では6つの小選挙区ですべて勝利すれば可能性があるが、与党候補者に劣勢の選挙区も複数あり、全勝は容易ではない。
小選挙区との重複立候補者が多い北関東、東京、南関東をはじめ、その他のブロックでも候補者不足となる可能性は低い。
--ここまで--
とくに、各社の調査情勢を引用して、「各メディアの情勢調査では、立憲民主で候補者不足がおこることが確実な選挙区はない」とはっきりと書かれている。
しかし結果はどうだったか。比例区の東海ブロックで立憲民主党の比例名簿の候補が足りなくなり、本来獲得できた議席を自民党に譲渡する結果となっている。「立民から自民に1議席 比例東海、候補者足りず」(中日新聞)。
データ分析で見えてくるもの
これを予想することは決して難しくはない。シンタックスというプログラムがある。これを規則に則って作成しておけば複雑な分析やデータ加工ができる。私は、限られたデータの入力しかおこなっていない。今回は選挙プランナーと称されている方の外れが目立った。
なお、分析をする際に、SPSSとClementineを使用していると前回の記事で申し上げた。当初は独立した会社の社名だったが、2009年にIBMにより買収されている。基本ソフトの「Base」で29万円だから安くはない。次年度以降も更新料がかかるみたいなので、研究所や専門機関でないと購入しにくいかも知れない。
私の場合は、個人で購入したソフトを完全な分析用として稼動させている。ネットにもつないでいない。古いバージョンの購入方法は分からないので、メーカーに問い合わせるか調べてもらいたい。なお、古いバージョンのモデルでも問題なく作業はできる。アウトプットデータは論文等にも使用できる(実際に使用している)。
このような分析業務は、個人のノウハウに起因するところが大きいが、関心のある方はご自身でやられみるといいだろう。私がSPSSを購入したきっかけは、人事データ(適性検査)の分析だった。コンピテンシーがブームになった時、部門や役職に応じて傾向があることに気がついた。そこになにが見えるか分析をしたかったのである。
例えば、「達成志向」が異様に高い組織があったとする。これを「達成志向が高くてイキイキしていますね」と解釈していはいけない。「共感力」なども調べてみる。もし共感力が低ければ、「達成志向が高く、共感力が低い」ことになる。共感力が低ければ「周囲との人間関係が阻害されている可能性がある」とプロファイリングすることができる。
「達成意欲が異様に高い」「人間関係が阻害されている」の2つの現象を掛け合わせると、どのような組織がイメージできるだろうか。「達成意欲が異様に高い=高いノルマを背負わされて無理やりやらされている、」「人間関係が阻害されている=自己中心的で他に気がまわらない。自分のことで精一杯」。このような仮説が立てられる。
仮説で導き出された要件を組み合わせれば組織の状況が浮かび上がってくる。「やらされ感が強く、業務上のストレスで疲弊している。メンバー同士が協調性をもちお互いを気遣う様子もない」。分析方法や、解釈の方法はかなり難解だが、人事データ(適性検査)を分析すると、組織の傾向や阻害要因、育成のポイントが見えてくる場合がある。
今回のように、選挙分析等も可能になる。なお、私は個別にお答えはしない。ノウハウを無償でお教えすることもしない。私に依頼するより、ご自身で覚えてしまったほうが早いと思われるので、この際、分析ソフトを購入するのも一考だろう。
尾藤克之
コラムニスト
<第3回>アゴラ出版道場開催のお知らせ
ネットから著者デビュー!第3回「アゴラ出版道場」11月4日開講。お待たせいたしました。商業出版を目指す著者志望者を対象にした第3回「アゴラ出版道場」を、11月4日から開講します(12月16日まで隔週土曜、全4回)。申込み〆切は10月27日の正午です。
お問い合わせ先 [email protected]