バイオインフォマやってます

バイオインフォ研究で、理解困難ないろいろや、その他のいろいろなど、忘れないでまた前を向くための備忘録ブログ

アセンブリ

2019-12-16 19:47:21 | 日記
プログラミング言語には、コンパイラを利用するものと、インタープリタを利用するものがある。それぞれの言語の例として、コンパイラを使用するものにC, C++, FORTRAN, Javaなどがあげられる。インタープリタ型言語には、Perl, Python, Rubyなどがあげられる。
このコンパイラとインタープリタについて、教科書で説明を探すと、まずそもそもの話しとして、「2進数でプログラムを記述することは困難であるため、人間にとって設計しやすい言語としてアセンブリ言語が開発された」と出て来る。
この「アセンブリ」なのだが、次世代シーケンスでのリードの解析にも登場するので、意味が混同して紛らわしい。
ここで言う「アセンブリ」とは、プログラミング言語での「アセンブリ言語」としてであって、「アセンブリ言語」とは、(以下、ウィキペディアから引用)、コンピュータ、マイクロコントローラ、その他のプログラム可能な機器を動作させるための機械語を人間に分かりやすい形で記述する、代表的な低水準言語である。なお、英語のassemblyとは「組立」という意味である。
なので、次世代シーケンスでのリードの解析での意味とは違いがある。
次世代シーケンスでの「アセンブリ」とは、「配列アセンブル」である。
「配列アセンブル」とは、シークエンサーから得られたリードの集合から、オーバーラップするリードをつないで元の配列を再構成していくプロセスを指す。



アノテーション

2019-12-15 22:06:35 | 日記
「アノテーション」とは、ウィキペディアによれば、「あるデータに対して関連する情報を注釈として付与すること。XML等の記述形式を用いてメタデータをタグ付けする場合が多い。付与したメタデータやたぐを指してアノテーションという場合もある。」と説明されている。
一言で言うと、「データに対する注釈」のことだと簡単に考えていたが、実はそうではないことが分かってきた。現在、Clostridium perfringensという細菌種について、自分の研究室で分離した株の全ゲノム解析を行っているが、その解析結果のシーケンス情報のアノテーションが非常に複雑である。アノテーションを行うにあたっては、細菌のDNAからの遺伝子発現の機構について考えなければならない。細菌のDNAからの遺伝子発現において、以下の特徴がある。
1. 塩基3個で1つのアミノ酸が決まるので、3通りの読み取り枠が存在する。
2. DNAの2本鎖のどちらもセンス鎖となる。つまり、DNA上の遺伝子の走行方向は2通りある。
3. 開始コドンと停止コドンを見つけて、その間の塩基配列がタンパクをコードした遺伝子となる。
これら3つの特徴をふまえて、発現遺伝子をピックアップしていくのが、アノテーションとなる。
ひとまずここまで。


ボルダリング

2019-12-14 23:52:06 | 日記
今日の夕方にスポーツクラブでボルダリングをやった。
先週から始めたので、今日で二回目。
一回目は両腕がものすごい筋肉痛になったが、今日も筋肉痛。
人がやってるのを見ると簡単そうなのだが、自分でやってみるとすごく難しいのは、なんでも同じ。
怪我しないように気をつけて、ぼちぼち頑張る。

図書館に行ってきた

2019-12-14 15:08:15 | 日記
区立の図書館に行ってきた。
いろいろな本がある。
すごく助かる。
趣味で読むエンターテイメントの小説から、
よくわからないプログラミングの解説書から、
野鳥の写真集や図鑑など、
およそ必要な資料はすべてあるね。
歩いて行ける近所にあって、うれしい限りです。

ブログ始めました。

2019-12-14 12:41:00 | 日記
バイオインフォマティクスの勉強をしています。
バイオインフォマティクスと言っても、生物学からインターネット、データ処理やプログラムのアルゴリズム、統計学など、内容が多岐にわたっています。
まだまだ知らないことが多くて、大変だなあと感じています。
そんなことを愚痴りながらブログに書いて、憂さを晴らして、ぼちぼちと勉強を続けていきたいと思います。
よろしくです。