“DNAの9%”はウイルス由来…大昔に感染したウイルスが、いまや「全人類の体の一部」だった
PHPオンライン衆知 より 210603
宮沢孝幸(京都大学ウイルス・再生医科学研究所准教授)
ヒトのDNAの文字列をすべて解読しようとする「ヒトゲノム・プロジェクト」により、DNAの一部にウイルス由来の塩基配列が含まれていることが判明。いまや全人類の体の一部になっている古代のウイルスとは?
(※本稿は、宮沢孝幸 著『京大 おどろきのウイルス学講義』(PHP新書)を一部抜粋・編集したものです。)
⚫︎アメリカが本気を出し、わずか10年ほどで終わったヒトゲノム・プロジェクト
細胞の核の中にあるDNAは、AGCT(アデニン、グアニン、シトシン、チミン)の塩基の文字列になっており、文字列が2本の鎖の状態で対になっています。文字列は、およそ30億個です。
このDNAの文字列をすべて解読しようという「ヒトゲノム・プロジェクト」構想が1989年に打ち出されました。
当時学部学生だった私は、「そんなの何十年かかるかわからない」と思っていました。当時の私たちの技術では、DNAの配列を1万個解読するのに数週間かかっていましたから。
しかし、アメリカ政府が強い政治的意思を示したため、解読は急速に進んでいきました。
私の学生の頃は、DNAの配列を調べるには、ガラス板に挟まれた大きなゲルに放射線同位元素でラベルをしたサンプルを泳動して、そのゲルを乾燥させて、フィルムに焼き付けて、目視で遺伝子配列を読んでいったものです。
しかし、その後、細い管にサンプルを通して、放射性同位元素を使わずに、自動で読み取る、オートシークエンサーというものが開発されました。この大きな技術革新により、なんと10年ほどで、全ゲノムの解読が終了してしまったのです。
解読されて、研究者たちが驚いたのは、体を作るためのタンパク質をコードする遺伝子の少なさです。
「人間は高等で複雑な生き物だから、体のタンパク質を作るために他の生き物よりも多くの遺伝子が使われているだろう」と思われていましたが、解読してみると、タンパク質合成に使われている部分は、30億塩基対のうち、わずか約1.5%。ショウジョウバエの体に使われている遺伝子情報の数とたいして変わらなかったのです。
ゲノムDNA情報のうち、1.5%さえあれば、人間は体を維持して生きていけるということなのでしょうか。
残りの98.5%はどんな役割を果たしているかよくわからず、「ジャンク情報」と言う研究者もいました。ですが私は、「本当にジャンクなんだろうか。本当は必要なのではないか。進化に関係しているのではないか?」と考えていました。
⚫︎タンパク質合成に使われているのはわずか1.5%、ウイルス由来の配列はその6倍
まず、そのジャンクと言われた98.5%のゲノムDNAの配列にリピートしているものがあります。長い反復配列と短い反復配列がそれです。長い反復配列はLINE(long interspersed nuclear element)、短い反復配列は、SINE(short interspersed nuclear element)と呼ばれています。
LINEはレトロウイルスと同じく逆転写酵素の配列をもっています。LINEは逆転写酵素によってDNAを増殖し、ゲノムでのDNA配列を増やしていくことができるということです。
それに対し、SINEは逆転写酵素の配列をもっていません。ですからSINEだけでDNAの配列を増やしていくことはできないのですが、実はSINEとLINEの相互作用によってゲノムDNAの配列を増やしているのです。
このようにしてゲノムDNAを増やしていける仕組みが、ゲノムDNA自身の中に組み込まれています。最近になって、SINEやLINEが進化に大きく関わっていることも明らかになっています。
また、DNAの中には、古代のレトロウイルスである内在性レトロウイルスの配列が8%入っていることもわかりました。その後研究が進み、現在では9%以上入っていることがわかっています。
私の学生時代(1980年代)から、ヒトの遺伝子情報の中には、レトロウイルスの配列が入っていることはわかっていました。1984年頃には1%くらいは入っているだろうと予想されていたのですが、ゲノムプロジェクトにより8%も入っていることがわかったため、研究者たちは驚いたのです。
30億塩基対の8%がレトロウイルス由来の配列で、人間の体を作っているタンパク質の遺伝情報の5倍以上もの量だったのです。ちなみに、マウスの場合は、レトロウイルスの配列は10%入っています。
大昔に流行したレトロウイルスが、ヒトを含む哺乳類の生殖細胞に感染し、それが子孫に受け継がれて、体の一部になっているわけです。