放送大学の生物情報学実習で習ってきたことを、復習してみる生物情報学、前回は、DNAシーケンサーの電気泳動して得られた結果から、DNAのシーケンスをきめるところまできました。
今回は、タンパク質の構造の予定でしたが、それよりも、そのあとの遺伝子の配置と機能推測のほうが順番的にいいので、そちらを先にやります。
なお、理解が間違っているところもあるかも・・・・。
■DNAから遺伝子をきめる
昨日は、DNAシーケンサーの電気泳動して得られた結果から、DNAのシーケンスをきめました。
そして、ATCGの並びになりました。
でも、これだけでは、なにができるのか、わかりません。
セントラルドグマによれば、DNAから、メッセンジャーRNAができ、それが、アミノ酸を材料に、タンパク質ができ、このたんぱく質が、どんな働きをするかで、遺伝としてつたわります。
遺伝として伝わるところが遺伝子なので、DNAのうち、メッセンジャーRNAをつくるところとか、ある程度遺伝する機能にかかわるところが、遺伝子となります。
ということで、次の作業は、
(1)DNAから、遺伝子の部分を切り出す。
(2)切り出した遺伝子が、どんな役割をするか推定する
ことまでして、はじめて、DNAに、どんなことが書いてあるかわかります。
そして、実際に、その機能が発言するかどうかを確かめないといけません
(DNAに書いてあっても、その細胞のところで、機能が働くかどうかはわからない。眠っている場合もある)。そこで
(3)その遺伝子の機能が発現するかどうかを確かめる
という作業もひつようになります。
まず、(1)からみていきます。
■(1)DNAから、遺伝子の部分を切り出す
これには、2とおりの方法があります。
・m-RNAを入れる。
そのDNAをあつめて、いっぱいm-RNAもいれると、DNA中のm-RNAの部分は、入れたm-RNAとくっつくことから、どの機能があるかわかります・・・
が、これだと、生物情報科学にならないので、
・コンピューターでもとめる。
DNAは、AGCTの4種類のうち3つの組み合わせ(コドン)によって、作成するタンパク質のもととなるアミノ酸を指定します。このうち、読み取り終了のSTOPコドンがあります。
このSTOPコドンがすぐに起きないように(遺伝子は結構長いので、すぐにSTOPコドンがきたら、それはおかしい)つなげていって、STOPコドンのところで終わりにします。
■(2)切り出した遺伝子が、どんな役割をするか推定する
切り出した遺伝子と、既存の役割のわかっている遺伝子と、類似度を比較することによって、機能を推測します。類似度が高ければ、同じようなことやってるだろうと、推測します。
■これを行うソフトウエア
上記のことを行うソフトウエアとして、fastaやBLASTがある
●fastaの場合
昨日、DNAをつなげるのを、bioeditで行いました。そのとき、*.fasというfasta形式で書きだしました。この*.fasのファイルを入力とします。
そして、fastx34を実行すると、テキトーに切ってくれたあと、指定したDB(引数で指定する)から、似たような遺伝子を見つけてきてくれる。
●BLASTの場合
BLASTを行う前に、まず、Glimmer2を使って、「(1)DNAから、遺伝子の部分を切り出す」。そして、切り出したら、blastを実行して、「(2)切り出した遺伝子が、どんな役割をするか推定する」
基本的に、どちらも、似たようなことをするソフトである。
と、超簡単にせつめいしてみました。
次回は、「(3)その遺伝子の機能が発現するかどうかを確かめる」