データサイエンス「超」入門

著 者:松本健太郎
出版社:毎日新聞出版
出版日:2018年9月30日 発行
評 価:☆☆☆(説明)

 世にある様々なデータについての読み方と、データに相対する姿勢を考えさせる本。

 著者は「データサイエンティスト」。本書のテーマは「データの読み方」。著者の説明では、「データを読む」とは、「データの特徴を理解して、背景に隠されている事象に想い馳せて、データに違和感を覚え、時には現場に足を運び、データが何を表現しているかを読み解く作業」。

 本書のテーマをもう少し掘り下げる。それは「00.」とナンバリングされた章(つまり第0章)のタイトル「バイアスだらけの私にリテラシーを」に表されている。私たちは「客観的な事実より自分が信じたい内容を信じようとする」。これを「認知バイアス」という。この認知バイアスの罠に陥らないような「データの読み方」、これが本書のテーマだ。

 認知バイアスによる弊害は数多い。例えば「津波が来てもここまではさすがに来ないだろう」という前提で運営されていた原発の事故。「起きたら嫌なことは起きないだろう」という思い込みの積み重ねが原因の一つだ。事故になれば大惨事が予想されるだけに「起きない」と信じたい。それを信じてはいけなかったのだ。

 このあと、世間で言われる様々な言説を、データを使って検証。「なぜネットと新聞・テレビで、内閣支持率がこんなにちがうのか」「アベノミクスで景気は良くなったのか」「経済大国・日本はなぜ貧困大国とも言われるのか」「人手不足なのにどうして給料は増えないのか」「若者の○○離れは正しいのか」など。

 特に「アベノミクスで景気は良くなったのか」のGDPに関する考察は、とても興味深かった。GDPは「具体的な数字を計算したものではない」。日本のGDPは「なぜその数字になったのか検証できない」。GDPは「生活の質とは何ら関係ない」。GDPに代わるもの開発されていないので、これを指標にするしかないのだけれど、GDPがこういうものだと知っておく必要はある。

 最後に。私は冒頭に書いた「データを読む」の著者の説明の中で、「データに違和感を覚え」の部分に注目した。例えば、アベノミクスの成果もデータで示されているけれど、そのデータはそう読むのが正しいのか?実感と違う、という違和感。本書のテーマから言えば「違和感」と「データ」なら「データ」を信じるべきかもしれない。

 しかし「認知バイアス」は「データの読み方」にも及ぶだろうし(つまり、データを都合よく読む)、都合のいいデータだけを集めて「正しさを証明」することも可能だ。いや、そういうことはよく行われる。「データ」と「違和感」は無限ループする恐れがある。本書で著者が挙げる「データの読み方の誤りを示すためのデータ」も、この読み方で正しいのか...。これは、疲れる。

 人気ブログランキング「本・読書」ページへ
 にほんブログ村「書評・レビュー」ページへ
 (たくさんの感想や書評のブログ記事が集まっています。)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です