まえがき
『我々はいま、「データ集約型科学」 (data-intensive science) に向けてアプローチ全体を考え直さなければならない。(略)我々は大量のデータを、解決すべき問題ではなく解決策の一部と見なしている。第四のパラダイムは、科学者たちや科学的探究の他の三つの方法に取って代わろうとしているわけではない。しかし、従来とは異なる一連のスキルが要求される。』
リスト
- 実験: 古代のギリシャと中国で始まる。観察された結果を、超自然的原因ではなく自然的原因によって説明しようとした。
- 理論: 17世紀になると、アイザック・ニュートンをはじめとする科学者たちが、新たな現象の予測を試み、実験によって仮説を検証しようとした。
- 計算とシミュレーション: 20世紀後半に高性能コンピュータが登場すると、連立方程式の数値的な解を大規模かつ緻密に計算することが可能になった。その結果、科学者たちは気候モデリングや銀河の形成など、実験や理論では足を踏み入れることのできない領域を探究できるようになった。
- データ・マイニング: 科学者たちは、より強力なコンピュータを利用することにより、データを出発点として莫大なデータベースから関係性をマイニングするようプログラムに命令する。つまり、コンピュータがデータを調査することによって規則を発見する。
あとがき
まえがきを含めて、トニー・ヘイ『科学の「第4のパラダイム」』(DIAMOND ハーバード・ビジネス・レビュー 2011年11月号 所収、参考文献1)より。
ジョフリー・ウェスト 『スケール 下:生命、都市、経済をめぐる普遍的法則』(早川書房、2020年)を読んでいてこの論文を知りました。
データ・マイニングの「新しさ」を訴えた一人が、WIRED誌の元編集長クリス・アンダーソン。彼が2008年にWIRED誌に載せた「理論の終焉:データ氾濫が科学的手法を廃れさせる」という記事が引用されています。
膨大なデータの新たな有用性は、これらの数値を処理する統計ツールと共に世界を理解するまったく新しい方法をもたらした。相関性が因果関係の座を奪い、科学は理路整然としたモデル、統一理論なしで、あるいは実のところ数学的説明がまったくなくても進展できる。
The new availability of huge amounts of data, along with the statistical tools to crunch these numbers, offers a whole new way of understanding the world. Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all.
邦訳は『スケール 下』から。原文は “The End of Theory: The Data Deluge Makes the Scientific Method Obsolete” (WIRED) より。
「相関性が因果関係の座を奪い(Correlation supersedes causation)」という表現が印象的。
一方でウェスト自身は『ちがいは主に程度問題でしかない』と述べています。
「データ革命」は、長い間使ってきた戦略を活用し有効にするための、非常に大きな可能性を与えてくれた。この意味で、これはパラダイム四・〇というよりは、パラダイム三・一に近い。
参考文献
(1) ヘイ, トニー. “データ集約型科学が人類の危機を救う 科学の 「第 4 のパラダイム」(Feature Articles 最先端のビッグ・アイデア 「破壊的」 経営論).” Diamond ハーバード・ビジネス・レビュー 36.11 (2011): 40-54.
- タイトル: スケール 下:生命、都市、経済をめぐる普遍的法則
- 著者: ジョフリー・ウェスト(著)、山形 浩生(翻訳)、森本 正史(翻訳)
- 出版社: 早川書房
- 出版日: 2020-10-15