2008年2月7日のブログ記事一覧-ウィリアムのいたずらの、まちあるき、たべあるき

生物情報学（２）－DNAから遺伝子をみつけ、機能を推測する

2008-02-07 22:25:46 | Weblog

放送大学の生物情報学実習で習ってきたことを、復習してみる生物情報学、前回は、DNAシーケンサーの電気泳動して得られた結果から、DNAのシーケンスをきめるところまできました。

　今回は、タンパク質の構造の予定でしたが、それよりも、そのあとの遺伝子の配置と機能推測のほうが順番的にいいので、そちらを先にやります。
　なお、理解が間違っているところもあるかも・・・・。

■DNAから遺伝子をきめる

　昨日は、DNAシーケンサーの電気泳動して得られた結果から、DNAのシーケンスをきめました。
　そして、ATCGの並びになりました。

　でも、これだけでは、なにができるのか、わかりません。
　セントラルドグマによれば、DNAから、メッセンジャーRNAができ、それが、アミノ酸を材料に、タンパク質ができ、このたんぱく質が、どんな働きをするかで、遺伝としてつたわります。
　遺伝として伝わるところが遺伝子なので、DNAのうち、メッセンジャーRNAをつくるところとか、ある程度遺伝する機能にかかわるところが、遺伝子となります。

　ということで、次の作業は、

　（１）DNAから、遺伝子の部分を切り出す。
　（２）切り出した遺伝子が、どんな役割をするか推定する

　ことまでして、はじめて、DNAに、どんなことが書いてあるかわかります。

　そして、実際に、その機能が発言するかどうかを確かめないといけません
　（DNAに書いてあっても、その細胞のところで、機能が働くかどうかはわからない。眠っている場合もある）。そこで

　（３）その遺伝子の機能が発現するかどうかを確かめる

　という作業もひつようになります。

　まず、（１）からみていきます。

■（１）DNAから、遺伝子の部分を切り出す

　これには、２とおりの方法があります。

・ｍ－RNAを入れる。
　そのDNAをあつめて、いっぱいm-RNAもいれると、DNA中のm-RNAの部分は、入れたm-RNAとくっつくことから、どの機能があるかわかります・・・

　が、これだと、生物情報科学にならないので、

・コンピューターでもとめる。

　DNAは、AGCTの４種類のうち３つの組み合わせ（コドン）によって、作成するタンパク質のもととなるアミノ酸を指定します。このうち、読み取り終了のSTOPコドンがあります。
　このSTOPコドンがすぐに起きないように（遺伝子は結構長いので、すぐにSTOPコドンがきたら、それはおかしい）つなげていって、STOPコドンのところで終わりにします。

■（２）切り出した遺伝子が、どんな役割をするか推定する

　切り出した遺伝子と、既存の役割のわかっている遺伝子と、類似度を比較することによって、機能を推測します。類似度が高ければ、同じようなことやってるだろうと、推測します。

■これを行うソフトウエア

　上記のことを行うソフトウエアとして、fastaやBLASTがある

●fastaの場合

　昨日、DNAをつなげるのを、bioeditで行いました。そのとき、*.fasというfasta形式で書きだしました。この*.fasのファイルを入力とします。
　そして、fastx34を実行すると、テキトーに切ってくれたあと、指定したDB（引数で指定する）から、似たような遺伝子を見つけてきてくれる。

●BLASTの場合
　BLASTを行う前に、まず、Glimmer2を使って、「（１）DNAから、遺伝子の部分を切り出す」。そして、切り出したら、blastを実行して、「（２）切り出した遺伝子が、どんな役割をするか推定する」

　基本的に、どちらも、似たようなことをするソフトである。

と、超簡単にせつめいしてみました。

次回は、「（３）その遺伝子の機能が発現するかどうかを確かめる」

ランキングに参加中。クリックして応援お願いします！

生物情報学（１）－DNAの配列を決める方法と、そこで使うソフト

2008-02-07 00:47:23 | Weblog

今日、放送大学の生物情報学実習で習ってきたことを、復習してみる
（理解が間違っているところもあるかも・・）

DNAの並び方（シーケンス）は、
　アメリカの場合、NCBI(GenBank)、
　日本はDDBJ
　ヨーロッパはEMBL
でデータベース化されている。
このシーケンスは、どーやって決めるか？という話。

　最近は、Pyrosequence法などもあるらしいけど、今回は、サンガー法について。

　この方法は、まず、調べようとするDNAを１本鎖にします。

　で、そーすると、反対側のDNAを合成するわけですが、このとき、

　　　　・DNA合成酵素である、dATP,dGTP,dCTP,dTTPを一杯入れておきます。
　　　　　→dはデオキシ、dNTPのNがA,G,C,T(アデニン、グアニン、シトシン、チミン）

　　　　・さらに、もうひとつ酸素をとった（デオキシ）ddATP,ddGTP,ddCTP,ddTTPも
　　　　　一杯入れておきます→これをまとめて、ddNTPと書きます。

　そうすると、dNTP（DNA合成酵素）が来ている間は合成をしていますが、ddNTPがくると、そこで、合成はとまります。(ddNTPがあると、酸素が取れているので結合できない）。

　たとえば、３００塩基の一本鎖がたくさんあったとすると、

　　　　　・１番目のみがdNTPで２番目がddNTPで、２番目で止まる
　　　　　・２番目までがdNTPで３番目がddNTPで、３番目で止まる
　　　　　・３番目までがdNTPで４番目がddNTPで、４番目で止まる
　　　　　　　　　：

　とか、いろんなところでとまるものができる。（極論すれば、無限にあり、ランダムに止まるとすると、１塩基でとまるものから、３００塩基で止まるものまですべてのものがあるはず）。

　そして、最後のddNTPは、そのとまったところに対応する、DNAの塩基対（ATCP)に対応しているはずである。で、ここで、ddNTPは蛍光塗料でマークしておく。なので、１番目にとまったものの、止まった箇所のddNTPは、１番目のDNA塩基対に対応しているし、２番目の・・・

ってなかんじで、ddNTPは、そこのDNAに対応していて、１番目から３００番目まで、すべての箇所のddNTPのものがあるはずである。

　さてここで、上記の「いろんなところでとまった」ものを、電気泳動する。

　そーすると、短いものから、長いものまで、順番に並ぶ。

　ってことは、

　１番目でとまったもの、２番目でとまったもの、３番目でとまったもの・・・３００番目でとまったものというようにわかれる。

　このとき、１番目でとまったものは、上記のことにより、１番目のDNAに対応したddNTPで終わっていて（ってことは１番目のDNAの塩基は同じだから、１番目のところはみんな同じddNTPでおわっているはずだ。理論上）、そのddNTPのNが、AかTかCかGかは、ddNTPに蛍光塗料をぬっておいてあるので、その蛍光塗料の量で、どのddNTPが多いかでわかるはずだ。。

　ということで、それぞれの電気泳動でとまったところの、ｄｄNTPの量を出してくれば良い。そのところのddNTPの量がおおいのが、そこに対応する塩基対。

　ここまでの処理を行うのがDNAシーケンサー

　で、そのｄｄNTPの量から、DNAのシーケンスを決めるソフト（っていうか、画面でみれる）ソフトが、Chromas（シェアウエアのソフトって書いてある）

　で、これで、１本分がきまった・・・

　けど、実際には、こーいう塩基配列は、部分部分にきれているので、つなぎ合わせないといけない。この部分部分の塩基配列をつなぎ合わせるソフトが、bioedit（フリーソフト：ChromasみたいなddNTPの各量を表示したりする機能もある）。

　今回の実習は、abiファイルとかいうのができていて（上記のChromasなんかでも使う各量を波で表示するグラフ）、それを、

１．１本目は、File→Openで、
　　２本目からは、File→Inport→Sequence alignment fileで読み込む

２．シーケンスが出てきたら、Back Colored　View　Modeというのにすると、
　　AGCT別々の色になるので見やすい。
　　このモードにするには、シーケンスが並んでいるところの、TCAGとかが４列になっている
　　アイコンのうち、全部背景に色が塗ってあるものをクリックする（ごめん、わかりにくい
　　説明で。いちばん左の南京錠からかぞえて、１１番目。ちなみに、１０番目はすでにON
　　になっている）

３．左端のラベル？（シーケンスが始まる前の部分）を２つ選択。
　　１つめはクリックでOK。２つめは、コントロールキーをおして、クリック

４．これから、どこが一致するか探す。
　　まず、Sequence→Dot plotを選択。ダイアログは、OKで答えていくと、
　　線がひかれた図がでてくる。
　　もし、一致していれば、斜め下とかにむかって、大きく線が出る。それが一致面。
　　そこの一番上のほうをクリックすると、上に座標が出る。X軸がその一致開始点
　　（＝つながるところ）

５．シーケンスにもどって、シーケンスの上のいっぱいアイコンが並んでいるところに、
　　G/Dと書いてあるところがある（南京錠から数えて７つめ）ので、ここをクリックし、
　　２本目をドラッグすると動くから、４のつながるところまで持っていく。

６．できたら、南京錠をクリックすると、はずすまでプロテクトされる。
　　File→Save Asで保存できる。

なお、１本が３プライムから５プライムにしているのに、もう一本が５プライムから３プライムへと、逆方向にしてしまうと、当然一致しない。
　この場合は、Sequence→Nucleic　Acid→Reverse Complementを選ぶと、方向が逆になる。

この、シーケンスを一致させるのを、自動的にやるソフト（contig assembly program）がある。
CAPっていうやつで、起動すると、自動的に適当？にやってくれる。
bioeditの中に入っているのかな？

今回はここまで。
次回はタンパク質のグラフィック表示 RasMol（フリーソフト）について
（本当は今日、ちょとやったけど、中途半端なのと、ここできりがいいので、
　今回はここまで）

ランキングに参加中。クリックして応援お願いします！

記事一覧 | 画像一覧 | フォロワー一覧 | フォトチャンネル一覧

日	月	火	水	木	金	土
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29

アクセス
閲覧	1,403	PV
訪問者	676	IP
トータル
閲覧	34,897,562	PV
訪問者	8,714,873	IP
ランキング
日別	485	位
週別	627	位

	【PR】プロ直伝・dポイントをザクザクためる術
	【PR】安い＆大量の「訳あり商品」がヤバい!
	【コメント募集中】カレーライスで一番好きな具材は？
	訪問者数に応じてdポイント最大1,000pt当たる！
	dポイントが当たる！無料『毎日くじ』

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）

生物情報学（２）－DNAから遺伝子をみつけ、機能を推測する

生物情報学（１）－DNAの配列を決める方法と、そこで使うソフト

カレンダー

ブログランキング

アクセス状況

プロフィール

最新記事

カテゴリー

最新コメント

バックナンバー

ブックマーク

goo blog おすすめ

goo blog お知らせ

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）

生物情報学（２）－DNAから遺伝子をみつけ、機能を推測する

生物情報学（１）－DNAの配列を決める方法と、そこで使うソフト

カレンダー

ログイン

ブログランキング

アクセス状況

プロフィール

最新記事

カテゴリー

最新コメント

バックナンバー

ブックマーク

goo blog おすすめ

goo blog お知らせ