2018年5月1日火曜日

196 尤度:主観と尤もらしさ

 これまで何度か必要に迫られて統計学を学んできました。どうも科学的プロセスで、因果関係などの論証には、十分に効力発揮できないと思っていました。そんな時、ベイズ統計に出会いました。

 科学では、事実・観察をしたり、あるいはデータを集めて、そこから何らかの仮説を証明するという作業をおこないます。これが科学をおこなうための一般的な論理過程、論理構造であります。仮説検証のためには必要な手続きなのですが、これは帰納法となります。得られたデータから規則性(ここでは法則と呼びましょう)を、帰納法で導き出そうするものです。
 この法則は、一般化されたものに見えますが、枚挙的帰納法と呼ばれ、法則が保証しているのは、データの範囲、集めたデータの限りでは、という「ただし書き」が常に付きます。枚挙的帰納法から得た法則は、自然界には斉一性が働いているという、前提が必要になります。自然の斉一性を正当化するには、帰納的に調べていくしかありません。これは循環論法となっており、証明不能です。
 このような帰納法の弱点は、たったひとつの反例が出てきたら、法則は否定されたことになります。法則を破棄するか、それともその反例に合わせて法則を変更してツギハギ状態の法則にするしかありません。帰納法を常用する自然科学には、ここに弱点、限界があります。つまり、証拠がいくら増えても、正しさを保証することも、証明することもできないのです。
 百歩譲って、いろいろな法則が成立しているとしましょう。もし法則が適用可能なら、○○という条件では、□□が起こる、ということです。法則の適用範囲(○○)を調べることも可能でしょう。もし適用できない範囲がわかれば、法則の適用限界を把握することにもなります。このような使い方は演繹法となります。演繹法をうまく使うことで、まだ得られていないデータや、まだ起こっていない現象などを予測することができます。あるいは、出てきたデータが、なぜそのような値をもっているのか、その由来を知ることができます。
 演繹法にも問題があります。当たり前のことですが、法則の適用範囲であれば適用でき、それ以外では利用できません。ただそれだけです。演繹からは、新しい法則を見つけ出すことはできないのです。ただ実用するだけで、そこには創造性がないのです。
 「○○という条件では、□□が起こる」という言い方をしたのですが、見方を変えると、○○は原因で□□は結果です。因果関係とも言い換えられます。帰納法は因果関係を見出す方法です。演繹法では、因果関係を利用して原因から結果を、結果から原因を知ろうとしたり、法則の検証したり、拡大解釈を試したり、限界を決めたりすることができます。帰納法は時系列を守って適用されましたが、演繹法は時系列を行ったり来たりできるものです。
 結果から、「未知の法則」を仮定して、原因を探ることをアブダクション(abduction)と呼んでいます。これは演繹法の飛躍的な帰納法の適用ともいえます。ただし、未知の法則は、研究者が根拠もなく仮定するものです。そこには、不確かさや主観が入ってくるので、非常に非科学的、非論理的です。さらに、因果関係の時系列を乱すものでもあります。アブダクションという方法論としてあったしても、論理的はまったくおかしなもので、論理的保証はありません。
 ところが、科学では未知の法則を「作業仮説」として、時々用いています。作業仮説は、研究者の裁量次第、思いつきでも、思い込みでもいいのです。作業仮説はスタートに過ぎないのです。科学の現場では、よく使われていますが、論理的には間違った方法です。ですから、なかなか論文に現れないものとなります。
 アブダクションは、最終的に帰納法によっては法則化はされていくのですが、その過程には、問題があります。ただし、飛躍的創造性を生み出す手法でもあり、セレンディピティ(serendipity)と呼ばれているものです。セレンディピティもアブダクションの一種で、古くから科学者は用いてきました。
 私は、アブダクションにおける、このような主観的な「もっともらしさ」や、なんとなくの「確からしさ」などを追求するための方法論が必要性だと考えていました。このような内容は、以前にもこのエッセイで述べたことありました。なかなか進展もできず、なかなか学問として方法論にならないだろうなと思っていました。
 ところが、ベイズ統計というものの存在を知りました。実は統計学を学んでいる時、ベイズ統計の用語や式はみていました。深くは理解せず、考えていませんでした。ベイズ統計には、尤度(ゆうど、likelihood)と呼ばれるものがあります。尤とは、「尤(もっと)もらしさ」という意味です。尤度とは、観察された結果から、原因がどうであったかを推測するもので、その尤もらしさを表す値のことです。ベイズ統計には、尤度の他にも、事前確率(prior probability)、事後確率(posterior probabilit)、主観確率(Subjective probability)など、それまでの科学や統計学にはない概念が使われています。非常に興味がでてきました。
 ベイズ統計は、実は古くからあり、そして時々必要に迫られて使われてきました。近年、特に21世紀に入ってから注目されている学問分野です。ベイズ統計の基本は、ベイズの定理です。言葉でいうと、
  事後確率は事前確率と尤度の積に比例する、
というものです。事前確率は原因、事後確率は結果、尤度とは尤もらしさです。結果は原因ともっともらしさの積、で求められるということです。考えてみると当たり前です。どんな可能性(尤もらしさ)でも、その確率に応じた、結果の可能性があるはずです。このような考えた利用できるのは、非常に便利です。
 さらに、事前確率が不明の場合は、「理由不十分の原則」で、適当にあるいは主観的に値を入れていいというものです。それで何らかの結果が得られれば、その結果を次の事前確率して計算してしまえば、次の事後確率はよりもになります。このような考えを「ベイズ更新」といいます。実験や観察では次々とデータでてきます。それを順次、計算に組み入れていけば、理論の確からしさが確かめられるということです。これは数学的にも、いろいろ証明されてきており、自然科学では非常に有用な方法であるともいます。
 従来の統計学では、主観などはいることはなく、確率も客観確率となります。また、全体を見渡して統計を扱うので、実験の量も組み合わせも、最初に決めれた、一定量、決めた計画どおり進めなければ終われないのです。しかし、ベイズ統計では、気軽にスタートして、計算で満足できる評価がでれば、そこで終わっていいという保証がえられるのでのす。非常にいいものです。もちろんいろいろ批判はあるようですが、実用性は非常に高いようです。
 私は勉強中なので、ベイズ統計の本質は、まだ十分理解できていないかもしれません。しかし、そこに非常に大きな可能性を感じています。なにより、人の考える生理にあった方法論でもあります。あるいはついつい経験的にやってきたことが、確からしいという保証がえられるのです。これから、ベイズ統計に、もう少し深入りしていこうかと思っています。

・勉強中・
ベイズ統計に関する本を読んでいます。
計算方法については、入門書をいくつか読みました。
ベイズ統計の思想や哲学を理解するための本も
いくつか読んでいます。
なかなか難しい哲学なのですが、
そこには今までの科学的論証には足りなかったものが
ありそうな気がしています。

・家族サービスも・
いよいよゴールデンウィークです。
今日は間の平日ですが、私は現在調査中です。
このエッセイは送信予約しています。
道南地方の調査にでいていますが、今日帰宅します。
ゴールデンウィーク後半は
通常通りに仕事をするのですが、
家族サービスも必要でしょうね。