wakabyの物見遊山

身近な観光、読書、進化学と硬軟とりまぜたブログ

僕の読書ノート「進化で読み解く バイオインフォマティクス入門(長田直樹)」

2023-10-21 07:46:36 | 書評(進化学とその周辺)

 

企業で生物医学系の研究の第一線から離れて5年、今は研究開発の管理業務を担当するようになり、さらにあと1年で定年である。しかしこれからも、研究のフィールドで何か新しいことを見つけてみたいという気持ちはある。そんな状況で一人でもできることは、自然観察のような生態学的研究か、バイオインフォマティクスを使った進化学的研究だろうと考えた。バイオインフォマティクスの分野ならプロでなくても、家のパソコンとネット上の公的データベースを使ってなにか面白いことができそうな気がする。そんな思いつきで、まずは学習を始めるためのとっかかりとして選んだ教科書が本書である。

とりあえず一通り読んでみたが、理解できたのは3分の1程度か。それは言いかえれば、これから何度も読み返す価値が残っていると言うこともできる。様々なバイオインフォマティクスの研究方法の原理説明として、数式がたくさん出てくるが、なかなか理解がおぼつかない。しかし、数式は理解できなくても、コンピューター・プログラムを使うことで、実用的には困らないのかもしれない。だから、あまり数式の理解にこだわらなくてもいいのかもしれない。もちろん理解できるに越したことはないだろうが。

けっこう基本的な用語でもよくわかっていないことが多い。そんな専門用語の説明をあげつらってみた。

・集団遺伝学:種レベルでの遺伝情報の進化を扱う学問分野をよぶ。集団とは、交配を行うことのできる生物の集まりのことであり、生物種に対応する。個体で起こった突然変異は生殖を経て次世代に伝わり、集団の中で数を増やしたり減らしたりする。

・分子進化学:種より上のレベルでの遺伝情報の進化を扱う学問分野をよぶ。種より上のレベルでは、種間の比較を行うことが基本であるので、種内の多様性については目をつぶり、問題を単純化する。

・アレル頻度:アレルとは対立遺伝子のことである。たとえば、ある単数体の集団で、半数の個体においてゲノムのある塩基サイトでの塩基がAであり、もう半数の個体のゲノムでGであった場合、Aの頻度は0.5であると表現し、これをアレル頻度とよぶ。

・ハーディーワインベルグ平衡:「ほかの集団と隔離された十分に大きな集団では、任意交配が行われており、変異が中立であれば、次世代の遺伝子頻度が前の世代の遺伝子頻度と同じになる」というのがハーディ―ワインベルグ法則である。遺伝子型(対立遺伝子の型)の頻度は1世代で平衡に達する。この状態をハーディーワインベルグ平衡とよぶ。集団遺伝学の多くの解析では、個々の遺伝子型(たとえば、AA、AT、TT)の頻度よりも、アレル頻度(たとえば、A、T)を中心に考えることが多く、集団の中にあるアレルの集まりのことを遺伝子プールとよぶ。

・ハプロタイプ:染色体レベルでのアレルの組み合わせをいう。例えば、染色体の二つのサイト、サイト1の遺伝子がa、サイト2の遺伝子がbで、サイト1と2との間に組み換えが起こらなかったとすると、アレルbは常にアレルaと同じ染色体上に存在することになり、ハプロタイプabを持つことになる。

・cic制御変異、trans制御変異:プロモーター配列やエンハンサー配列に起こり、直接遺伝子の発現量を変えるようなゲノム上の変異をcic制御変異よぶ。このcis制御変異によって起こされた発現の違いは、さらに別の遺伝子の発現を変える可能性がある。このように別の遺伝子の発現に対しては間接的にはたらく。間接的に遺伝子の発現量を変えるような変異を、trans制御変異とよぶ。

・NM、XM:ゲノム配列が決定された生物について、転写産物を単位として配列をまとめたのがNCBIのRefSeqデータベースである。RefSeqのデータで、cDNA配列がもとになっている転写産物のアクセッション番号は「NM..」で始まり、ゲノム配列よりコンピュータによる予測によってのみ同定されている遺伝子には「XM..」で始まるアクセッション番号がついている。後者はより不正確な遺伝子配列を含んでいる可能性が高いので、注意が必要である。

・統合TV(現在は、TogoTV):日本語で書かれたデータベースやツールの使い方を紹介するサイトとして、ライフサイエンス統合データベースセンターが提供する統合TVがある。データベースの紹介から簡単なチュートリアルまでそろっているので、興味がある方は触れてみることが薦められている。