2023年01月05日

「統計」もクリティカルに見よ

 昨年の初夏だったか、日経新聞に広告が出ていたこちらの本。著者は現役の英 FT 紙シニアコラムニストで、BBC ラジオ番組のプレゼンターでもある人。「統計にダマされるな」的なご本かと思いきや、『データ探偵(The Data Detective : Ten Easy Rules to Make Sense of Statistics)』という原書名が暗示するように、統計のウソを暴くことより、統計とはそもそもどんなもので、どのように扱えばよいかを 10 の方法として提示し、論じた本になります。

 たとえば「とっさの感情には注意する」、「俯瞰する」、「背景を知る」……とかはなんか既視感ありあり。「背景を知る」なんて、拙訳書に出てくるクリティカル・シンキングの技術として語られるものですね。なので共通項はかなり多い、という印象がまずあった。「とっさの感情には注意する」では、著者自身の失敗例(グラフの時間軸も確認せずリツイートした話)もさらけだして、その危険性を訴えてます。ほかにもあのフローレンス・ナイチンゲールがじつは「近代統計学の母」的存在でもあったことなどの歴史トリビアも満載で、教えられるところは多い。「公的統計の存在を重視する」では、ギリシャとアルゼンチンそれぞれの公的統計部門のトップが被った妨害工作の事例なんかも暴露されていて、このへんはよくあることですけれども、ジャーナリストたる原著者の腕の冴えが光っている。しかし公的統計の信頼が揺らいじゃったら、それこそわたしたちの生命財産に直結しかねない。そういえばこの国でも、ついせんだって似たような失態があったような …… 。

 ただ、この本を読んでもっとも印象に残ったのは、COVID-19、つまり新型コロナウイルス感染症のパンデミック(世界的大流行)初期の混乱を記述したくだりです。「疫学者、医療統計学者、経済学者といった現代のデータ探偵たち」が、「生死にかかわる判断を手探りで模索する状態」だったが、「数週間が経つ頃には、彼らの捜査と探索のおかげで、ウイルスの主な特徴と、そのウイルスがもたらす疾病の性質について、多少なりと把握した全体像が浮かび上がってきた」。
無症状の感染者も多数いることがわかった。…… 若者よりも高齢者において大幅にリスクが高いこともすぐに明白になった。感染致死率の合理的な推定値も出た。…… 特に、イギリス国家統計局などの機関が実施・分析する適切な検査の価値はどれほど大きかったことか。パンデミックという戦争において、統計は、いわばレーダーに相当する存在だった。
…… 正確でシステマティックに収集された数字というものを、ふだんの私たちがどれほど当然視しているか、これ以上にありありと描き出す例はほかに考えつかない。…… 私たちは、「嘘、大嘘、そして統計」などと気軽に口に出し、統計のありがたみを軽んじる。今回のコロナ危機は、統計データが出そろっていないと状況がどれほど混乱するものか、私たちにあらためて思い出させている。
 最近、この手の本でときおりお目にかかるのが、tribalism という単語。この本にも顔を出していて、「同族意識」と訳されています。で、たいていこれはどっちかの陣営(同族)から見た「真実」しか見ないというきわめて偏向した態度を助長し、すんなりケリがつくはずの話も尾ひれがついていっそうややこしくして、対立を先鋭化させたりするのですが、そんな陥穽にはまらないためにも統計、とくに公的機関の発表する統計をないがしろにしてはいけませんよということも強調されています。その最たる実例としてやり玉に挙げられているのが、くだんの放言ばっかかましていた米国前大統領の話。しかし、もっとも信頼に足るはずの公的統計も、このような政治的圧力の前に歪曲されるリスクがどこの国にも起こりうることは、引き合いに出したギリシャとアルゼンチンの教訓で警告しています。

 あと、よく言われることですけれども、この手の本にはたいていダニエル・カーネマンの著作『ファスト&スロー』からなにかしらの引用があったりするものですが、この本ではたとえば「出版バイアス」が、公正な研究成果をゆがめかねないものとして出てきます。たとえば、世間をアっと言わせる、意外性のある論文のほうが出版物として世に出る確率が高い、というのも出版バイアスの一例。そのじつ、真に価値あるデータなり統計は、じつに地味ぃ〜なグラフやチャートのほうだったりする(でもこちらはなかなか出版されない)。またそれとはべつに「速い統計」(拙速な集計データによる統計)と、「遅い統計」という用語も持ち出しているけれども、たとえ信頼できそうな「遅い統計」でも、「個人的な印象のほうを信じるべき場合」は、ゼロではない。世の中の問題すべてが数値化され、見える化されて、表計算シートに転記できるものばかりじゃないから(マスク着用問題なんかがそうかも。呼吸器系に問題があると自覚していれば、統計的に問題なくても予防的に着用するのはごく当たり前の行動でしょう)。

 昨今はやりの AI(人工知能)やアルゴリズムについても、新型インフルエンザの予測に失敗した「Google インフルトレンド」プロジェクトを引き合いに出して警鐘を鳴らしてます。こと統計学に関する本にはほとんど縁がない人間とはいえ、やはり統計と無縁では済まされない時代に生きている者のひとりとして、この本は読むべき1冊だと思ったしだい(数式はいっさい出てこないので、その点はご安心を)。

評価:るんるんるんるんるんるんるんるん

posted by Curragh at 22:45| Comment(1) | TrackBack(0) | 最近読んだ本
この記事へのコメント
Posted by at 2023年02月09日 18:16
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/190054290
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック