2013年5月1日水曜日

136 信頼度:誤差の背景

 分析データについている誤差には、統計処理以外にいろいろな背景があります。単純にデータのばらつきを表す精度、真の値とのズレを考える確度、さらに総合的な誤差の評価としての再現性があります。正統派な手順を踏んでいれば、誤差は精度のみと考えればいいのですが、もしかすると、そこに落とし穴があるかもしれません。

 数値と感覚には、ズレることがあります。
 いくつかの対象に名称と数値がついて示されていると、数が少ないいと全体像がわかるため、個々の値が吟味をしてしまいます。そして、それぞれの値の大小に注目されます。一方、対象の数が多くなると、飛び抜けて大きものや小さいものには注意をしますが、その他多数は、平均的なものとみてしまいます。つまりは平均値ですまします。そして次に似たデータが与えられたら、前回やそれまでの平均値の大小、つまり変動や変化に注目されていきます。
 抽象的でわかりくい表現だったかもしれませんが、毎日の気温を調べているとしましょう。月ごとに平均を出していきます。月ごとの平均とともに月の最高気温と最低気温も示すとしましょう。以下は架空の話です。
 月ごとの気温をみていきます。月の平均気温ですから、ある月のデータは、その年の別の月の平均気温や前年の同月の平均気温、あるいは観測されたすべての同月の平均気温(平年というのでしょうか)との比較がされていくはずです。
 「今年の4月は寒かったなあ」という印象があったしましょう。昨年や全4月平均とくらべてみれば、本当に寒かったかどうかわかるでしょう。つまり、印象や感覚で捉えたものと、数値による対応がなされ、印象が確かめられることになります。
 もちろん印象や感覚と実際の数値が、一致しないこともあるでしょう。
 例えば、寒く思えた4月も、平年と今年の4月の最後の1週間が、平年よりかなり寒かったのですが、4月の中旬まで例年並か、少し暖かいくらいの気温となっていたのです。したがって、月の平均をすると平年並になったというわけです。月の最低気温も平年並みでした。月の最高気温、最低気温は、4月下旬にしてばすごく寒かったのですが、4月上旬ではよくある最低気温だったのです。
 上で述べたように、人の感じたものと数値のズレは起こりえます。4月末の1週間は確かに寒い日だったのですが、つい最近のことなので強く記憶に残ったのでしょう。さらに、その記憶が4月全体の印象まで影響したことになります。そのため、感覚と実際のデータにズレが生じたことになります。
 別の見方も可能です。感覚は正しかったのですが、数値処理が感覚を反映していないため、起こったずれともみなせます。月平均ではなく、週平均を見たら、4月最後の週の平均をみれば、例年よりかなり低かったかもしれません。今年の4月末の1週間は、観測史上もっとも寒い年となることもあるでしょう。それを、4月全体で平均をしたため、寒いことが見えなかったのです。
 数値を出してものごとを議論したり、説明するとき、感覚とずれることがあります。それは上述のように、単純に感覚のずれか、それとも統計の取り方による間違いなのか、本来であれば、はっきりとさせるべきです。そもそも数値データとは、感情を排除して、ただ示され、その値のみが議論されるべき性質のものです。ただし、値の誤差あるいは精度には注意が必要です。
 さて、ここから本題です。
 私は以前、化学分析をしていた時期がありました。古くからある分析で、海外では有名どころの研究室では、分析されていました。ただし昔と比べ格段に精度は向上しています。しかし、日本では、まだだれも精度のよい分析ができていませんでした。それを私はやろうと挑戦したわけです。後発であれば、その分析の精度は、先行の研究室に少なくとも匹敵するものを目指して挑戦するわけです。では達成した精度を、どのように表していくのでしょうか。それが今回のテーマです。
 化学分析やそのデータを見る時、注意すべきは、その誤差です。例えば、次のような2つの値があったとしましょう。
20±20
20±2 (±は誤差の範囲を示しています)
分析して得た値は、どちらも20で同じですが、誤差が違っています。20±20は、40から0の範囲をばらつきが、20±2は22から18の範囲のばらつきがあるといえます。20±2を20と表現することは可能でしょうが、20±20を、20というには抵抗があります。40から0の値、あるいは二桁の前半の値とでもいうべきでしょう。そもそもこのようなデータを、意味を理解できない市民向けには公開すべきではないかもしれません。
 誤差の範囲は、標準偏差に基づいたものを用いることが多いのですが、統計的に信頼できる範囲を示しています。ですから、誤差のついているデータは、その意味をある程度理解しておくべきでしょう。
 数値が提示されると、たとえ誤差がつけられていたとしても、その数値のみが一人歩きしてしまうと、危険なこともあります。先ほどの20±20と20±2の例です。データ提示者も、注意が必要です。少なくとも、原理がわかっている人には、その誤差をチェックできる情報は、示されるべきでしょう。
 私は分析する側だったので、誤差や精度に大いにこだわりました。いかに誤差を小さくするか、ということに精力を傾けていました。誤差が小さくなれば、値の信頼性も高くなり、より微量、より微小なものを分析しても、意味のあるデータを示せることを意味します。
 ある岩石のある成分を装置で分析するとしましょう。その成分を抽出すために、いろいろな化学的手続を踏んで成分を抽出していきます。抽出した成分を装置にかけて分析していきます。装置の分析も、かつては手作業でいろいろ工夫をして、人の「腕」が分析精度を左右していたのですが、今では装置の性能があがり、コンピュータで自動化されているので、だれが分析しても、それなりにいいデータをだすことができるようになっています。
 装置は、誤差を小さくするために、何度も分析を繰り返すようにプログラムされています。例えば、100回の分析をして、そのときの各回の分析のばらつきがプログラムで処理され、誤差となります。統計処理も人手をへることなく自動で出てきます。
 ここに、注意が必要です。いい分析装置で、誤差が小さいとしましょう。そのような繰り返し測定による誤差の程度を、「精度」(precision)といいます。「精度」は小さいほど分析データはいいものとなります。ただし、分析データが、真の値を示しているという保証はありません。
 装置にクセがあり、いつもある程度の偏りがあるかもしれません。そのような偏りのチェックのために、標準試料を用います。標準試料にもいろいろなものがあるのですが、天然物や合成物、あるいはあらかじめ値がはっきりわかっているもの、不明だが多くの研究者が同じ試料を分析していて値が求められているものなどがあります。いずれにしても、値がわかっている標準試料を用いて、その装置で分析した値と比べるわけです。
 わかっている値と装置の分析値とのずれを、「確度」や「正確度」(accuracy)といいます。わかっている値がでるように、事前に調整作業をしておかなければなりません。そうでないと、その分析装置によるデータは、他の研究者のものと比べることができません。自分一人、間違ったデータを出しているのかもしれません。そんなデータであることが発覚すると、混乱を与えますし、その人の出したデータをだれも信用しないことになります。慎重になるべきです。
 「精度」と「確度」は、わかりにくいかもしれません。自動装置で矢を的(まと)に向けてたくさん打ったとき、高い「精度」とは同じ所(場所は問いません)に集まることで、高い「確度」とは、真ん中に集まることです。高「精度」、高「確度」が理想ですが、調整ができていない装置では、低「精度」で低「確度」や、高性能の装置なら高「精度」で低「確度」という状態になるかもしれません。
 装置の調整の段階で、高「確度」になるように調整されていれば、問題は「精度」だけになります。もちろん「精度」の誤差内に「確度」の誤差が収まっていなければなりません。そうでないと、値の誤差の信頼性は保証されません。
 じつは、もうひとつ、私は、気にしていた誤差に関わるものがありました。それは、再現性(reproductivity)というものでした。再現性には、いろいろな意味合いがありますが、私が気にしていたのは、総合的な誤差のようなものでした。
 岩石を処理して、分析データになるまで、どこに誤差が混入するかは不明です。予期できない後さがあります。偶発的な誤差であれば、繰り返すると出たり出なかったりします。未知の必然的な誤差であれば、毎回測定値にばらつきとして出てきます。
 もちろん再現性における誤差が小さくなるように努力をします。同じ試料、できれば値のわかっている天然の標準試料を、抽出作業から繰り返しおこない、その分析データのばらつきを調べます。すると、分析手順全体の誤差を総合的にみることができます。このようなものを再現性と呼んでいます。
 再現性がよければ、常に同じ状態で分析手順がおこなわれていることになります。実験手順にたいする信頼度が高いことを示しています。再現性も「精度」の誤差内に収まっているべきです。
 「精度」は装置の能力に依存します。研究者はそれ以外の見えない部分(確度と再現性)が、「精度」内におさまるようにして精力注ぐことになります。まさに見えない努力になります。
 確度と再現性は、分析の準備段階でおこなわれるものです。分析する人で、その誤差を小さくできると「腕がいい」ということになります。私の腕も「なかなかのもの!?」でしたが、残念ながら、今は分析はしていません。
 そしてやっと、数値につけられる誤差は、「精度」に関する誤差だけが示されることになります。確度も再現性も精度内にあり、そのデータは示された誤差で、信頼できることを意味します。研究者はそれをする努めがあります。
 最初に述べたように、調整されていて、いい装置であれば、誤差は小さくなり「精度」は高くなります。しかし、上述の確度と再現性が保証されなければ、精度以上の誤差がそちらにあれば、「精度」の信頼性は示されないことになります。
 分析するのも科学者ですが、彼らは良心のもと、そのような調整を経たのち、分析値を公開しているはずです。少なくとも科学者のコミニティでは、その信頼の上で、データを扱うことになります。
 ところが、時代が進み、装置が発展してくると、そのような背景を知らずに、メーカーに「確度」や「再現性」はおまかせで、ただ装置を使って分析をするような世代もいるかもしれません。そうなると、誤差の意味が違ってきます。そんな事態になっていないことを祈りますが。

・信頼・
今回のエッセイで実例をいろいろあげようかと思いましたが、やめました。
地震の発生確率の誤差の扱いは
今回の話題の最っともいい例だったかもしれません。
まあ、その誤差計算に関しては、詳しくないので、
評価すべき立場ではありませんので。
自分の行なってきた化学分析の話にしました。
近年、装置よくなっているので、
分析精度をいちいち吟味する必要もない
完成度の高い装置もあります。
でも、新しい分析などに挑戦し手法を確立する時、
初歩的な分析データの扱いの経験があるかないかは
大きいな差となります。
へんなデータを出すと、データの信頼度だけでなく、
研究者としても信頼も落としかねません。
なにせ研究をしているのは人で、
データを吟味するのも人なのです。
最終的に信頼度は、人に付与されるものかもしれませんね。

・ゴールデンウィーク・
ゴールデンウィークをいかがお過ごしでしょうか。
北海道のゴールデンウィーク前半は荒れ模様で、
気温も低く、出歩く気にならない天気でした。
大学も、月曜日は通常の講義があったので、
ゴールデンウィークという気持ちになりませんでした。
しかし、今日から大学は振替休日で連休になっています。
そして月曜日から講義がスタートします。
ゴールデンウィークの後半が天気がよければいいのですが。