より良い予測の提示と、より良い解決方法の構想のために ――ネイト・シルバー(2013)『シグナル&ノイズ ――天才データアナリストの「予測学」』(訳)川添節子、日経BP

バーニング
Apr 12, 2023

--

私たちはシグナルを探そうとしてノイズを集めている」と本書の帯に書かれているが、邦訳が500ページを超えるほどの分厚い本ではあるものの本書が主眼としていることはこの帯のフレーズに象徴されている。ちなみに本書を知ったのは光文社未来ライブラリーから出ている『誰もが嘘をついている』という本がきっかけだが、こちらも併せて読むと膨大なデータがいかに活用されうるのかをユニークに理解することができて面白い。

当時はおりしもビッグデータという言葉が話題に上りつつあった時期で(もう10年前になってしまうのかとも思うが)、最近だとデータサイエンスとかEBPMと言った言葉に置き換わってきたものの、大量のデータから価値のある情報を得たいというニーズは研究の分野に限らず、ビジネスや政策の分野でも一般化してきている。とはいえそれは容易ではない、なぜならば、というのが本書の切り口である。

まず序章の部分でシルバーは予測と解決方法が本書の中心テーマと述べた後に、本書の狙いを簡潔に要約している。引用しよう。

皆さんのなかには、私がこれまで述べてきたことを不快に思う人もいるだろう。これから指摘することにも、おそらく不快感を抱くだろう。それは、人間が完全に客観的な予測をすることはない、常にその人の主観が反映される、ということだ。
しかし、私は、客観的な真実など存在しない、といった虚無的な見方はしていない。むしろ、客観的な真実を信じて追究する姿勢が、よりよい予測には不可欠であると言いたい。そのうえで、客観的な真実の理解が不十分であることを認識すべきだと思っている。
予測は、主観的事実と客観的事実をつなぐものであるという点で重要だ。 哲学者のカール・ポパーがこの考え方をとっている。 ポパーによれば、仮説は反証可能でなければ科学的とはいえない。つまり、仮説は現実の世界で、 予測という手段を利用して検証されるのである。(p.17)

ポパーが提示した反証可能性の考え方については、それだけが科学的かどうかを決める要素にはならない(他にも科学が科学たりえる要素がある)との見方が現代では優勢だが、それでも反証可能性の意義が失われたわけではない。

使い方によっては、何が正しい(妥当性が高い)のか、何が誤っているかを見極めるのに有効である。シルバーの言う「客観的な真実を信じて追究する姿勢が、よりよい予測には不可欠である」はポパー主義者として正しいだけではなく、より良い予測がよりよい社会の設計につながるはずだ、というビジョンを提示しているとも言える。

とはいえ大きな現象を予測するのは難しい。そのため本書は住宅バブルが引き起こした金融危機(サブプライムローン問題とリーマンショック)や天気予報、地震、はたまたテロに至るまで、社会に与えるインパクトの大きい現象へ着目する一方、野球やチェス、ポーカーなど、より特定の現象あるいは競技を取り上げた「予測学」の実例を提示していく。

本編は全部で13章あり、それぞれに異なるトピックを取り上げているが、第3章「マネーボール」がもっとも力を入れて書いているように見えるのはシルバーがもともと野球オタクであり、それを職業にもしてしまった人だからと言ってよいだろう。ここではまさにマイケル・ルイスの『マネー・ボール』との出会いも書かれているが、それ以前に少年時代から野球雑誌のデータを基にオリジナルの統計を作っていたというエピソードに野球オタクっぷりが表れている。

また、野球がなぜデータ分析による予測に向いているかについてのシンプルな回答として、「世界でもっとも豊富なデータセット」(p.87)の存在を挙げている。本書はスタットキャスト(2015年にMLB全球場で導入されたデータ解析ツール)以前の本だが、スタットキャストのような仕組みが導入されるだろうという著者の予測も提示しているのが面白い(p.112)。

『マネー・ボール』の影響はアスレチックス以外にも波及し、結果的にどの球団もデータ分析に傾倒していくことですべての球団がマネーボール球団になっていることを指摘しているが(リーマンショックによる不況の影響もあるようだ)、同時にスカウトの存在を無視しているわけでもない。「統計データとスカウト、あるいは定量的情報と定性的情報の境界線はかなりあいまいになってきている」(p.112)からである。スカウト得た情報を定量的に変換することも可能だからだ。

他方で、「選手の性格や私的な事情など、そもそも定量化が困難で、一部の関係者しか知ることのできないような情報の重要性がいっそう高まることになるかもしれない」(p.113)とも述べている。この二つはおそらくつながっている。つまり、定量的なデータはどの球団も同じように収集するし、分析する。しかし対象が分析の対象である野球選手が人間である以上、それでも定量化できない情報、つまり定量的なデータには表れない定性的な情報もある。

例えばどれだけデータ分析が進化しても、大谷翔平をもう一人作り出すことはおそらく難しい。彼が長年積み上げてきた、定量化できない要素(岩手の野球風土、野球に対するマインド、花巻東や日ハムで得た諸経験など)が多すぎるからである。

以上のような理由から、「さまざまなタイプの選手を知りたいという需要は供給をはるかに上回っている」(p.118)ため、「分類してどこかに当てはめるという、私たちが普段おこなっている方法では有益な情報を見逃してしまう」(p.119)とこの章は結論づけている。つまり、『マネー・ボール』はもう終わっているのである、と。

他方でスタットキャストが提示する様々なデータはフライボール革命や極端な守備シフトなど、戦術への着目をより強化させている。メジャーリーグは定期的にルール改定を行うため、一次的に有効な戦術がすぐに廃れることもあるわけだが、そんな風にして野球はこれからもどんどん変わっていくのだろう。その都度「有益な情報」が何かは変わるかもしれないし、変わらないものもあるかもしれない。

ここでは野球の章を取り上げて詳しく触れたが、つまるところ本書が目指すのはより良い予測のためのデータ収集だけでなく、より良い解決方法の構想だ。野球やポーカーはそれらに関心のある人にとっての出来事だが、住宅バブルやテロの脅威などの事象は国境を越えて多くの人に影響を及ぼす。それらの危機に正しく備えてより良い解決方法を構想するために、どのシグナルをキャッチしてどのノイズを排除するかという、本書が最初に提示した出発点に立ち戻る必要がありそうだ。

[2023.4.13]

--

--

バーニング
バーニング

Written by バーニング

90年生まれ。アイコンは@koyomi_matsubaさんデザイン。連絡先:burningsan@gmail.com

No responses yet