美しい花か、花の美しさか

 伊藤公一朗『データ分析の力 因果関係に迫る思考法』(光文社新書)を読む。
 2つのデータの動きに関係性があることを、統計学では「相関関係がある」と呼ぶ。
 しかしながら、XとYに相関関係があることがわかっても、その結果を用いて因果関係があるとは言えない。
 たとえば、広告(X)を増やすとアイスクリーム(Y)の売り上げが増えるというデータがあるとする。このデータから、XとYに因果関係があると言えるだろうか。
 たしかに広告費とアイスクリームの売り上げは比例して増えているのだから、広告の影響はある。
 しかしアイスクリームの売り上げが増えたのは、夏の猛暑のせいかもしれない。そしてその売上金によって広告にかける費用が増えたのかもしれない。猛暑という他の要因(V)が、広告(X)と売り上げ(Y)の両方に影響を与えた可能性もある。
 これをまとめると、次の三つの可能性が考えられる。

 XがYに影響を与えている可能性。
 YがXに影響を与えている可能性。
 Vという第三の要素が、XとYの両方に影響を与えている可能性。

 データ分析者にとって非常にやっかいなのは、この三つの可能性のすべてがデータの動きと整合的であることだ。(38-40頁)
 統計学ではそこからいろんな要因を取り除いて真の因果関係を突き止めるわけだが、文系の頭で考えると、因果関係というのは、仏教とかバタフライ効果を持ち出せば、なんとでも言えるようなところがある。
 小林秀雄の「美しい『花』がある。『花』の美しさという様なものはない」という言葉も、こういう逆説にしびれる人もいるだろうが、まあ、逆の因果関係としてそういう可能性もありますねえ、といったところである。

データ分析の力 因果関係に迫る思考法 (光文社新書)

データ分析の力 因果関係に迫る思考法 (光文社新書)