COG(Cluster of Orthologous Group)ってなんだったっけ?と忘れていたので復習。
Science. 1997 Oct 24;278(5338):631-7.
によれば、COGは「オーソログやパラログから構成されるタンパク質(遺伝子)のセット」ということになっていた。
ご存知のように、オーソログは種間の相同な遺伝子で種分化によってバラエティーが生じたのに対して、
パラログは同一ゲノム上の類似した遺伝子でおそらくはどこかの時点で発生した遺伝子重複によって
生じたバラエティーだ。
いずれにせよ、これらは祖先では一個の遺伝子であったはずで、それらが現在では
色んな生物のゲノム上のいろんなところに散らばってしまっているので、それらを整理しなおして
これらは同じものだったのだろうというグループでまとめたのがCOGということになるようだ。
COGを構成している遺伝子は現在でもお互いに同じ機能を持っていたり、
似た機能を持っていたりするらしい。
上の論文の定義では3つ以上の生物種の遺伝子が含まれているものを、そう定義したそうで。
機能未知の遺伝子が別の生物でどうなってるか見れば、機能が推測できたりと
いろいろと便利そうだ。