<番外篇>
生物学における情報概念
Information Concept in Biology ![]()
西 川 建 (国立遺伝学研究所教授)
分子生物学は生命現象のメカニズムを分子レベルで解明することにより生物学を物理学・化学と連結させたと言われる。しかしその反面、「情報」という物理化学には存在しない概念を導入したことにより、生物学は物理化学とは異質の学問であり、両者の断絶を際立たせたとする、まったく正反対の解釈もある [1]。これは、Bioinformatics の根幹に関わる問題であり、看過するわけにはいかない。以下では、この問題についての私見を述べてみたい。
まず、生物学と物理化学の連続/不連続の問題については、生命体が原子・分子を素材として構成されている以上、生命体はかつて(宇宙史のどこかの時点で)無機的物質世界の中から生じたことは疑うことができない。(たとえ、地球上の生命が「地球外に起源をもつ」としても結論的には同じである。)その意味で、物質世界と生物界は連続しているはずであり、生命現象の中に突然、情報という要素が「無」から生じたとは考えにくい。生命のない物質世界の中に「情報」とは呼べないまでも、その元になるような「萌芽的な」要素がもともとあるに違いない。
私は長年、構造予測をはじめコンピュータ解析によるタンパク質研究に携ってきたが、タンパク質のフォールディング(折り畳み)という現象の中に、生物学における情報とそれに匹敵する物理化学における対応物を見ることができると思っている。そのことを説明するためには、最初にタンパク質の「島モデル」[2]について述べておく必要がある。
![]()
配列空間におけるタンパク質の分布 天然タンパク質はアミノ酸配列の類似性(ホモロジー)に従ってファミリーに分類される。いま、配列の違いに応じて種々のタンパク質がそれぞれ1点にプロットされるような超多次元の「配列空間」を定義して、すべての天然タンパク質をその配列空間内にプロットしたとすると、多数の点からなるタンパク質の分布はファミリーごとにクラスターをなして見えるはずである。Chothia [3]によると、そのようなファミリーの数は全体として1000 個くらいあるという。ファミリーの特徴は、同じファミリー内のメンバーは互いにホモロジーがあり、分子進化的に連結している(同一の起源から分岐する)が、異なるファミリー間ではホモロジーがなく連結しない、したがって配列空間内のクラスターは互いに不連続的な島状の分布をなすことである。そこでクラスターを「島」、それ以外の領域を「海」と呼ぶことにすると、それぞれの島は天然タンパク質のファミリーに対応し、立体構造的に見るとそれぞれユニークな基本構造(フォールド)によって特徴づけられる。一方、海の領域は対応する立体構造をもたない。つまり、海の領域の点はそれぞれ特定のアミノ酸配列に対応するが、それらは一定の構造にフォールドしない(できない)ような ("unfoldable" )配列 [4]を意味する。
このような島モデル[2] はタンパク質のアミノ酸配列と立体構造の関係を一般的に表した、むしろナイーヴな描像であるが、島モデルの視点に立ってみるとタンパク質のいくつかの特性が明確になる。たとえば、分子進化に伴うアミノ酸配列の変化はある島の内部での位置の移動を意味するが、島の内部をいくら動いても基本構造(フォールド)は変らない。また、島どうしは海で隔てられているので、島から島へ移るような変異はほとんど起きず、天然タンパク質は分子進化の過程を通して事実上1つの島に閉じこめられている。現にバクテリアと高等生物の間で相同的なタンパク質が数多く見つかるとう事実は、そのことを裏付けている。天然タンパク質に人為的に変異を導入して変異タンパク質をつくると、形(フォールド)は変らないが、安定性は容易に変化する。不安定になりすぎた変異体は島から海に落ちてしまい、もはや生理的条件下ではフォールドできなくなる。おそらく、海の領域は島よりも広大だと思われる。人工的に設計したタンパク質が容易にフォールドしてくれない事実[5]からも、そのことが示唆される。島と海の境界線は「生理的条件」によって決まる。好熱菌などの環境のように過酷な条件下では「海水面」が上昇し、海が広がり島は小さくなるはずである、等々。
内部情報と外部変数 さて、冒頭で述べた情報概念との関係で注目したいのは、島モデルにおける島から海への転換(transition)という問題である。思考実験として、ある天然タンパク質(島の1点)Aから出発して海へ至る直線を引き、その直線に沿ってアミノ酸配列を変化させると考えて、それぞれの配列をもつポリペプチドを順次人工的に合成したとする。そして、それらのポリペプチドの生理的条件下での振舞いを観測したとすると、ポリペプチド(配列)が島の上にあるときは天然タンパク質Aと同じ形にフォールドし、海の中では unfold した状態を示すはずである(文献2の図2を参照)。また、構造の安定性を表す自由エネルギーΔG(フォールドした状態と unfolded 状態の自由エネルギーの差)で見ると、島から海への移行に伴い、ΔGは正の値から負の値へと連続的に変化し、島と海との境界線上ではΔG=0となる。このような挙動は、通常のタンパク質の温度変性や変性剤添加による変性と本質的に同じだと考えられる。もちろん、以上はあくまでも思考実験であり実際の実験ではないが、各種の変異体タンパク質に関する知見からみても、この結論はまず間違いなく正しい。
熱力学的にいうと、温度や変性剤濃度は「外部変数」であり、外部変数の変化に応じて溶液中のタンパク質は可逆的に変性-再生する。一方、(環境条件は一定に保ったままで)アミノ酸配列という「内部情報」の変化によってもタンパク質は変性-再生という状態変化が引き起こされるとすれば、タンパク質という「系」にとって内部情報と外部変数は同等の「位置関係」にあることを示唆している。私はここに「情報」概念を考える上での大きなヒントがあると考えている。
![]()
遺伝情報と境界条件 次にタンパク質をはなれて、もっと一般的に「系と環境条件」または「系と情報」の関係について考察してみたい。まずもっとも単純な物理学系として力学系を考えると、この場合の環境条件はふつう境界条件と呼ばれる。力学系にとって境界条件は外から偶然に与えられる所与であるが、いったん境界条件(時間的な境界条件である初期条件を含めて)が設定されると古典的な力学系の運命は一意に決まる。その意味で、境界条件は系の状態を左右する要因だといえる。同じことは熱力学系にも認められる。熱力学系の環境条件(外部変数を含む)が設定されれば系の状態は一意的に定まり、環境条件を変更することによって系の状態をコントロールすることができる。また系と環境の関係はもともと相対的であり、系を定義することによって環境は相対的に定まる。したがって、環境条件も系を離れては意味をなさない相対的なものである。
まとめて言うと、環境条件(境界条件)は系との関係性においては相対的であり、その反面では系を制御し規定する力をもっているが、それ自体は客観的であり、操作可能である等々の特性をもっている。ここで、物理学系を生命系に置き換え、環境条件(境界条件)を遺伝情報に置き換えて上の文章を読んでみると、何ら矛盾なく意味が通ることがわかるだろう。おそらく、生物学に特徴的な「情報」は物理学における境界条件と同根のものである。すなわち、情報は客観的、操作可能な「システムにとっての条件」であり、システムを制御しうるが、一方ではシステムを離れては意味をなさない相対的な存在でもある。とはいえ、情報と境界条件は「同等」ではない。おそらく、両者のもっとも大きな違いは、境界条件が系を外部から規定する条件であるのに対し、情報は系の内部で働く条件であるという点であろう。生命体は境界条件を内部に取り込むことに成功したシステムと言ってもよい。システムの内部に(境界)条件を取り込むことによって、ダーウイン型の自然淘汰のサイクルが回転できるようになった。その結果、システムは進化し、それと共に内部(境界)条件も発展して、「遺伝情報」として成立した。遺伝情報は複製(コピー)され、さらに転写、翻訳され、あるいは伝達され、保存(記録)される。これらはまさに情報に特有の特徴であるが、発達した情報形態ではこれらの特徴が前面に出てきて、われわれの目を奪う。そのことが同時に、情報の出自である境界条件との共通性を覆い隠し、両者の関連を見えにくくしている原因だと思われる。
生命体にひとたび「情報」が成立すると、それは生命現象のあらゆる局面に及ぶようになる。遺伝情報によって生じた遺伝子産物は他の遺伝子の発現を制御し、あるいは他から制御される。また細胞は外界からのシグナルを受容し、シグナルを内部制御系に伝達することによってシステム(細胞)の状態を変容させる。多細胞生物にみられる細胞間のシグナル伝達、さらには動物における免疫系や脳・神経系の発達による個体レベルのコントロールなど、生物体はどのレベル、どの局面をみても、基本情報系(遺伝情報系、脳神経系)とそれから派生する情報処理・制御のネットワークで覆われている。まさに生物は、情報という概念なしには語ることはできない存在である。
しかしながら、すでに見たように、情報はもともと境界条件と同根のものだとすると、生命現象を情報という言葉を使わずに無機世界の言葉だけで表現することも可能かもしれない。たとえば、生命体は複雑に入り組んだ内部(境界)条件をもったシステムであり、内部(境界)条件は複雑・微細であるばかりでなく、その空間的な配置は時間的にも刻々と変化する云々、というように。このような表現は、おそらく物理学的世界と生物学的世界の連続性を強調するさいには有効であろう。だが、すでに述べたように、情報は境界条件の発展した形態であり、生命体における情報はもはや境界条件という枠組みではその全容を捉えることはできないまでに達している。その意味で生命世界は単純に無機世界とつながるわけではなく、古くから言われているように、後者とは別のより高次の階層に相当する世界だと言うべきだろう。
![]()
参考文献
1. 渡邊慧「生命と自由」岩波新書、1980.
2. Nishikawa, K. (1993) Island hypothesis. Protein distribution in the sequence space. Viva Origino, 21, 91-102.
3. Chothia, C. (1992) One thousand families for the molecular biologists. Nature, 357, 543-544.
4. Sali, A. et al. (1994) How does a protein fold? Nature, 369,248-251.
5. Isogai, Y. et al. (2000) Redesign of artificial globins. Biochemistry, 39, 5683-5690.
タンパク質の立体構造モデル【編集子注】
この論文は「Bioinformatics」誌(18巻5号、2002年)の巻頭言として、上の日本語から英語に翻訳されて掲載された。著者は西川修の四男である。
(北の旅人編集子、2002.6.9)
(表紙へ戻る)