2004年3月1日月曜日

26 少ないものと多いもの:シニョール・リップス効果(2004年3月1日)

 このごとを調べるには、調べているものの性質をよく理解しておく必要があります。「何を、当たり前のことをいっているのか」と思われるかもしれませんが、これが、難しい場合もあるのです。そんな話をしましょう。

 こんな調査をしたとしましょう。一般の道路を通る車の調査です。朝の7時から9時までの時間帯をビデオ撮影して、その映像から、どのような車が通ったかを調べるのです。たくさんの車(全部で4,000台とでもしおきましょうか)が、この道路を通ったのをビデオに記録されていました。統計量としては、十分な量でしょう。
 その結果は、乗用車、トラック、バイク、自転車、「その他の車両」の順で多かったとしましょう。「その他の車両」とは、救急車、パトカー、消防車、霊柩車としておきましょう。
 ある人が、このビデオを見ていて、「その他の車両」が気になりました。そして、よくビデオを見てみて、統計をとったところ、つぎのようなことに気が付きました。救急車とパトカーは、7時から9時までの間に、時々通りました。ところが、消防車は、7時から8時までは何度か通ったのに、8時以降は一台もとおりませんでした。逆に、霊柩車は、8時までは通らなかったのが、8時から9時までの間には通りました。
 このような結果から、その人は、「この道路は、消防車は8時まで通り、霊柩車は8時からしか通らない」という説を出しました。あなたはどう思いますか。この説は変だ、と思われる方が多いと思います。
 この説は、上で説明したようなデータに基づいて述べられたものです。どこがおかしいのでしょうか。それは、調べている個々のデータが、一般道を走る車であるという性質を考慮に入れなかったからです。車というものは、特殊なものは台数が少なく、統計的に十分な数を得られないせいでしょう。
 では、どうすればいいのでしょうか。時間帯を限定しているため統計量が少ないのあれば、何日も、たとえば1ヵ月間同じ時間帯の記録をして統計をとれば、十分な数になるでしょう。時間帯を区別してないなら、何時間も、たとえば、48時間記録をとれば、いいのではないでしょうか。このような調査をすれば、たぶん、上のような間違った結論は出ないのではないでしょうか。
 でも、このような調査を実際におこなうとなると、非常に大変です。よっぽどの目的意識がないとできない作業です。もしかすると、思い通りの結果が出ないかもしれません。それに、上で変だと思った説と同じ結果がでるという確率も、ゼロではないのですから。
 ものの性質を考えるべきだということを冒頭で述べましたが、上の例を、次のように展開してみましょう。ビデオテープを地層に、車を化石に置き換えるとどうなるでしょうか。同じような結果を素直に信じてしまいませんか。ものの性質を十分考慮に入れているでしょうか。
 恐竜は、白亜紀の終わり(K-T境界といいます)に絶滅したということを多くの人は、信じています。その絶滅は、K-T境界に向かって、少しずつ種類を減らしていたのでしょうか。それとも、白亜紀の終わりまで生きていて、K-T境界でいっせいに絶滅したのでしょうか。現在は後者だと、多くの研究者は考えています。その原因は、隕石の衝突によるものだとされています。恐竜の隕石による大絶滅は、多くの人が知っていることです。ところが、隕石衝突による絶滅説にいたるまで、ものの性質を考えなければならないという問題が生じたことを知る人はあまりいません。
 恐竜の化石は、どの地域でも、どの時代でもたくさん出るというものではありません。まして、白亜紀の終わりの地層が連続してある地域で恐竜の化石がでるところは限られています。世界でもいくつかの地域でしか見つかりません。恐竜の化石は、最初の例でいうと「特殊車両」なのです。ですから、白亜紀の終わりよりだいぶ前から恐竜の化石がみつかならないとしても、それは、上の「特殊車両」の効果の可能性があります。
 化石における「特殊車両」の効果を、そのようなことを調べたふたりの研究者、シニョールとリップスの名前を取って「シニョール・リップス効果」と呼んでいます。いいかえると、突然の絶滅があったとしても、化石の証拠からは少しずつ絶滅していく(漸進的といいます)ように見えることがある、ということになります。
 それと、もうひとつ重要なことは、「ない(不在)」を証明することの困難さです。特に、頻度の少ない特殊車両や珍しい化石は、ある時間以降「ない」ということを証明することは、論理的には不可能となります。
 もし、存在と不在の関係が方程式化されていれば、「ない」は証明できるかもしれません。確率で表されていたとしても、確率がゼロでなければ、「ない」は証明できないのです。ところが「ない」の否定、つまり「ある(存在)」の証明は非常に簡単です。一個の「ある」という証拠を見つければいいのです。特殊車両、珍しい化石を、一個でも、ある時間以降にみつければ、「ない」という説を否定することができるのです。
 「ない」派がすべきことは、確率的に可能性をできるだけ下げるということしかないのです。たとえば、たくさんある車両や化石で、時間の境界の事件を調べて、その事件の実態を明らかにすれば、特殊車両が通らなくなることや恐竜の絶滅も、同じ事件で説明できるかもしれません。
 白亜紀の終わりに絶滅したもので、たくさん出る化石でそのようなことに、挑戦されたことがありました。恐竜以外にも白亜紀の終わりに絶滅した化石として、アンモナイトがあります。アンモナイトはタコやイカの仲間(頭足類といます)で、古生代のデボン紀にオウムガイの仲間から進化したもので、白亜紀の終わりに絶滅するまで生きていたものです。約3億年間も栄えていたことになります。その間に、1万以上の種が生まれました。ところが、このアンモナイトは、白亜紀の終わりに絶滅するのです。
 アンモナイトの化石は、ヨーロッパの大西洋岸の崖などで、大量の化石が地層からみつかります。アンモナイトの化石がたくさんでるスペインのビズケー湾とそれにつづくフランスの海岸にもよく出ました。その地域を調べていたピーター・D・ウォード(Peter Douglas Ward)は、アンモナイトの研究の一人者でありました。彼の今までの研究をまとめて、最後のアンモナイトは、K-T境界より、10mも下からみつかったと発表しました。つまり、アンモナイトは、K-T境界より前に絶滅していたのです。アンモナイトの化石からは、隕石衝突説が否定されたのです。
 彼の偉いところは、「証拠の不在は、不在の証拠ではない」といっていることです。化石が見つからないからといって、その生物がいなかったとはいえないということを、彼は知っていました。ウォードにとって、化石が「ある」ことにならないかぎり、この研究には終りがないのです。彼は、自分の研究成果を証明することはできませんが、自分の結論の確率を上げることはできます。論理的に「ない」を証明できなくても、確率を上げることによって、研究者を納得させれば、成果となります。また逆に、アンモナイトの化石が時代境界で見つかることは、自分が前に出した結論を否定することになります。どちらにしても、忍耐つよい野外調査が必要になります。彼は、それを続けたのです。10年間、アンモナイトの化石探しの調査をつづけました。
 その結果、1994年に「最後のアンモナイトはK-T境界粘土層の直下で回収された」と報告しました。アンモナイトは、K-T境界まで生きていたのです。彼は、偉大でした。自分の名誉よりも真実を求めることを選んだのです。
 特殊車両にあたる恐竜でも、同じようなことが行われました。確率の低いものは、広範囲を大人数で調査することによって、確率の低いことを補うことができます。そのような調査は各地でなされました。
 その結果、K-T境界の地層の中から恐竜の化石が見つかったのです。インドのデカン高原では、K-T境界の地層の中から、恐竜の卵の化石が発見されています。多分これが最後の恐竜の化石でしょう。また、コロラド州のレートン層では、時代境界の下37cmで、ハドロサウルスの化石が発見されています。これは、K-T境界の2000から3000年前まで恐竜が生息していたことを示しています。中国でも、K-T境界のすぐ近くで、恐竜の化石発が見されています。
 ここまで、各地で調べられると、K-T境界まで恐竜が生きていたのことの確かさがでてきます。そして、多くの研究者も納得するようになってきたのです。
 このように、恐竜の隕石衝突による絶滅説が科学的に根拠をもって語られるようになったのは、ある種の化石が稀なものであるという性質を知った上で、それを努力と知恵で補ってきった結果であるのです。

・統計学・
 統計の勉強をしています。集めたデータの確かさ、不確かさを如何に論理的に理解するかということを知るためです。そして、あわよくば、目では見えない何かを統計から導き出せないか、という下心もあります。
 統計学は、自然科学の基礎として重要です。自然界にある目的のものすべてを調べることは不可能ですから、ある代表的なものをサンプリングします。そのサンプルから全体を「推測」したり、調べているものの中で違いを「検定」することによって「相違」があるかどうかや「関連性」があるかどうかを知ることは重要です。1つや2つの変数なら、直感的に感じ取ることも可能かもしれません。しかし、もし感じ取れたとしても、定量化しないと、人は説得できません。
 また、変数や関連性が多数になってくると、もはや直感には頼れません。多変量解析となります。このような手法を知っているということは、重要な武器となります。
 まずは理屈さえわかれば、今はいろいろなソフトウェアがあるので、それを使えばいいのです。その理屈を知るために勉強をしているのです。
 統計学は一般化、定量化していきます。抽象化の極致として、「推測」、「検定」、「相違」、「関連性」などが数値として示されます。統計が示していることは、あくまでも、数値化された一般的なことです。一般化のときに、個々の個性は剥ぎ取られます。統計の結果は、一般化されたものであって、その結果を個々に当てはめるときは注意が必要です。統計値は、個々を語るためのものではないからです。これは大きな落とし穴です。
 統計をとるための調査、統計処理の結果をどう判断するか、あるいは仮説として提示し、自然で検証すること、そんないちばん大切なことは、やはり研究者自身がすべきことでしょう。それに、心のどこかで、統計よりも自然への直感が大切だろうなという気持ちもありますから。