いろいろな仕組み、からくりには、単純さと多様性が行き来しているようです。ここでは、生物の基礎となるDNAからアミノ酸、タンパク質、さまざまな場面で、単純さと多様性が混沌として混在しています。
生命起源について考えています。生物学は専門ではないので、生物の仕組みの基礎から学んでいくことになります。教科書をみると、生物の遺伝情報やタンパク質合成の仕組みや原理は、かなり解明されてきています。ところが、生命の起源に関しては、まだ規則性すらわかっていません。
生物学というひとつの学問においても、分野によっては進展の程度が異なっているようです。研究分野では、創成のころはわかっていることもあまりなく、研究者も少ない状態です。その後、その分野で注目を浴びるようになると、多くの記載データも研究者も集まりだし、大きな分野に成長しています。このような研究分野での進展は、次にような、似たような段階を経ていくように見えます。
まったくの手探りの分野の創成状態(前科学)からはじまります。やがて記載方法が定まり多様性を把握されていき、多様性の中の規則性を見出し、例外を規則性を修正しながらよりいいものにしていく段階(通常科学の開始=パラタイムの成立)になります。ところが、規則性を修正(変則性)しても説明できない例外が見つかる段階(危機)になります。例外が増えていき上位の規則性の修正でも説明できない段階(危機の深刻化=異常科学)になってきます。やがてまったく新しい規則(パラダイム)を見つける段階(科学革命)となります。このような科学の発展過程として、トーマス・クーンが提唱した「科学革命」と呼ばれるものです。
生物学における生物の仕組みでは、基本的な規則性がわかってきているので、通常科学(パラダイム)がはじまっていますが、まだまだ例外が見つかり、規則性を修正している段階に見えます。ところが、生命誕生に関しては、基本法則もまだ見つかっていない、まったく手探りの前科学の段階のように見えます。
生命起源を考えるには、生命の仕組みがどうしてできたのかを考えていくことになります。ここでは、生物が利用する化合物、タンパク質の多様さを生み出す仕組みを考えていきましょう。
タンパク質は、非常に多くの種類があります。大腸菌では4000から5000種が利用され、酵母菌では6000から7000種になるとされています。ヒトでは、2万から2万5000種と推定されています。ところが、地球生命では、20種のアミノ酸から、すべてのタンパク質ができていることがわかっています。
アミノ酸の特徴は、アミノ基(NH2)とカルボキシル基(COOH)を持った有機分子です。アミノ酸は、中心の炭素に結合している多様な側鎖(R基または側鎖基と呼ばれています)をもっています。この側鎖の違いが、アミノ酸の特徴や性質の違いとなります。20種のアミノ酸が、地球生物では利用されています。
アミノ酸が基本単位(モノマー)となり、アミノ酸が連なることで、ポリペプチド鎖(アミノ酸鎖)を形成してタンパク質となります。タンパク質の構造は立体的になり、いろいろな性質を持つようになります。20種のアミノ酸が組み合わさることによって、タンパク質の多様性ができていきます。
アミノ酸は、生物がもっている遺伝情報に基づいて形成されていきます。生物学の基本となる遺伝情報は、デオキシリボ核酸、略してDNAと呼ばれる細胞内の分子に記録されています。
DNAからアミノ酸を経由してタンパク質までの道筋、あるいはタンパク質の多様性を生む原理はわかってきています。ただし、あくまでも原理であり、多くの組み合わせの中から、なぜそのようなアミノ酸やタンパク質が選択されてきたのか、その理由は必ずしもわかっていません。
次に、生物の遺伝情報の記録の方法をみていきましょう。DNAは、アデニン(A)、チミン(T)、グアニン(G)、シトシン(C)の4種塩基(ヌクレオチドと呼ばれています)からできています。ただし、RNAの場合は、チミンの代わりにウラシル(U)が使われています。塩基同士が対になっているのですが、アデニンとチミン(ウラシル)、グアニンとシトシンが常に繋がる仕組みがあります。この仕組みは、情報保存だけでなく、複製や修正に役立ちます。
DNAのATGCの4つの塩基は、2進法で考えると、2桁あれば、00、01、10、11として4つの塩基に対応できます。2進法で2桁は、情報科学では2ビット(bit)と呼ばれて入ります。2ビットで4種の塩基が表現できることになります。このように数学的にDNAを情報と捉えることもできます。
別の見方もできます。4つの塩基がn個並んでいるとすると、その並びの組み合わせは、4のn乗が可能になります。4のn乗を、4^nと表記しましょう。塩基が2個の連なりなら4^2=16通り、3個なら4^3=64通りの組み合わせになります。
実際には、3つの塩基が連なりが基本単位となり、コドン(codon)と呼んでいます。組み合わせは、64通りになります。今ではコドンの意味はわかっています。
コドンがいくつか連なって、アミノ酸ができています。コドンの数は、1つの場合から6個の場合まであり、その組わせにより、多様なアミノ酸がつくれます。1つのコドン(メチオニン、トリプトファン)から、多いものだと6つのコドン(アルギニン、ロイシン、セリン)まであります。
多様性の程度ですが、6つのコドンからなるであれば、3x6=18塩基なので、4^18=687億1947万6736の組み合わせになります。実際には、1個から6個までの選択も含みますので、さらにに多くの組み合わせができます。便宜的にここでは、4^18としておきましょう。塩基は2進数なら、全組み合わせは、36桁、つまり36ビットとなり、現在のパソコンの主流となっているのが32ビットから64ビットのCPUを搭載していますので、パソコンの処理能力の範囲になっています。
ところが、地球生命では、アミノ酸は20種が利用されているだけです。多様な組み合わせが可能なのに、たった20種しか使われていません。単純なもので多様なものができます。その理由は、なぜなかのかはまだわかっていません。生命誕生の過程で、環境の中で「よりすぐり」のものが選ばれたのでしょうか。
このようなアミノ酸とコドンの組み合わせの仕組みは、理解されてきています。コドンの機能として、メチオニン(AUG)は、タンパク質合成の開始を示す「開始コドン」と呼ばれています。また、タンパク質の合成終了は、UAA、UAG、UGAの3つのコドンの連なりが「ストップコドン」となります。この間の情報から、タンパク質の合成が進められます。
その間に情報が生み出す多様性は非常に膨大になることは予想されます。ただし、これは組み合わせ、多様性形成だけの話です。生命体の細胞内では、絶えず、複数のタンパク質の合成しています。細胞では、必要なタンパク質の種類を判断し、その量やタイミング、働く部分など、すべてが調整されているので、非常に複雑なことをおこっていることがわかっています。それを情報処理になぞらえるのは、なかなか難しいものです。
すべての情報は、DNAに記録されているはずです。ヒトのDNAは、2003年には解読されており、30億7984万3747塩基対だとわかっています。遺伝情報をタンパク質の合成とみなすと、最小単位はコドン1つで3塩基対、最大でコドン6個で18塩基対だとすると、遺伝情報は、10億から1億7000万程度、少なくとも1億程度の遺伝情報が記録可能となります。そこで多様な組み合わせがつくれます。
ヒトの遺伝情報は、遺伝子としてDNAの中に書き込まれています。遺伝子を構成する塩基対の数は、数百から数千の塩基対を持つことがあります。もし、1000塩基対だとすると、DNAの中には、317万個の遺伝子を持てることになります。
しかし、DNAには遺伝情報の記録に使われている部分(エクソン)と使われていない部分(イントロン)が大量にあると推定されています。そのうち、イントロンは、スプライシングと呼ばれるプロセスによって利用時には取り除かれるところ、繰り返しになっているリピート配列などもあります。イントロンがヒトのDNAの中で締めている比率は、80〜98%だとされています。300万個の遺伝子の内、60万から6万となります。これでも使用しているタンパク質合成のための遺伝子は十分記録可能です。
ヒトの遺伝子の数は、推定によって変動することがありますが、およそ2万から2万5000と推定されています。ですから、DNAの情報には、タンパク質合成だけでなく、もっと多様な情報が記録されているはずです。
ヒトのDNAには、非常に余裕をもって情報が記録されていることになります。一方、たった20種のアミノ酸から多様なタンパク質が利用可能なのですが、その一部しか使っていないことになります。まだ、DNAの中にもアソビ(イントロン)があり、自然の中で、「よりすぐり」が選ばれたのでしょうか。複雑さの中から単純さへの選択がなされています。
ここでは、タンパク質の多様性の形成のメカニズムだけをみてきました。他にも細胞内にはいろいろな器官や組織もあります。そこでも固有や共通の仕組みが働いています。生命誕生には、それらのうちどれが必要不可欠だったのでしょうか。
生命の仕組みの中には、単純さと多様性が混在しています。多様性から選択、選別される原理は、まだよくわからないことが多いようです。「よりすぐり」ではなく、「とりあえず」だったのかもしれません。単純さと多様性の混沌が、そこにはあるようです。
・生物学と地質学・
生物学は地質学と比べると、
非常の大きな学問分野です。
知識量も、投入資金、動く資本、また従事する人員も
桁が異なっていることでしょう。
学問内に単純さと多様性が混沌としている点は
共通しているようです。
学問の発展段階のパターンも似ているようです。
後進が大きな学問体系を学ぶのは
教科書はいろいろあっていいのですが、
その分裾野が広く、奥行きも深いので
学ぶことも多くなります。
しかし、そこには単純さと多様性が混在しています。
・残された目標・
いよいよサバティカル最後の月となりました。
このひと月の目標は、
野外調査が2回、帰省を1回します。
2冊の本の校正、1冊の本の編集、
そして、論文の執筆をしていきます。
1年間でやることを、半年間に詰め込みました。
なかなか大変ですが、
研究に専念できる最後のチャンスなので
できる範囲で進めていこうと考えています。