統合ゲノミクスのためのマイクロアレイ データアナリシス, I.S.Kohane/A.T.Kho/A.J.Butte 星田有人 訳, シュプリンガー・フェアラーク東京, 2004年
(MICROARRAYS FOR AN INTEGRATIVE GENOMICS)
・専門書。ハーバード/MITのバイオインフォマティクストレーニングプログラムの講義テキスト。前出の「わかる!使える!DNAマイクロアレイデータ解析入門」よりも一段深い内容。この分野の研究に携わるのなら必携の書、といったところ。
・「本書では機能ゲノミクスという用語を、「遺伝子や遺伝子群、そして特定の遺伝子間の相互作用に生物学的な機能を対応させるために、ゲノムを解体して検討するすべての試み」という意味で使っている。」p.3
・「ゲノミクスデータから、情報工学、計算科学、生物統計学の手法を用いて何らかの生物学的な知見を得ようとする試みは一般にバイオインフォマティクス(bioinformatics)と呼ばれる。」p.7
・「何万個もの変数に対して、たった数百の方程式しかなければ、数千もの正しい答えが生じてしまうだろう。これがマイクロアレイデータ解析が劣決定問題となってしまう本質的な理由である。」p.10
・「第3の仮定は、閉世界仮説(Closed World Assumption:CWA)である。(中略)受精した卵子が9ヵ月後に完全な人間になるような遺伝的なプログラムに従っているとしたら、コンピュータプログラムも同じ遺伝コードに従い遺伝子にコードされているすべての生理学的なイベントについて決定論的な推定ができるはずであるという考えである。」p.18
・「なぜマイクロアレイか?(中略)連鎖解析や関連解析とは対照的に、マイクロアレイ解析は原理的に、生物学的あるいは臨床的な特徴よりはむしら生体のメカニズムやシステムに関連する遺伝子の転写活性化を直接測定するようにデザインされている。」p.19
・「機能ゲノミクス研究を成功させるために最も重要なことは、まず最初に、研究している生体システムに対する疑問に関連が深い情報を最大限引き出すような遺伝子発現パターンが得られるように実験をデザインすることである。」p.31
・「たとえ何万もの遺伝子の発現レベルを測定したとしても、興味のある生体システムに関与していると信頼性をもっていえる遺伝子は数百しか得られないだろう。一方ですべての統計学的に有意な遺伝子発現変化が生物学的、生理学的システムの有意な変化に結びついているわけではない。」p.45
・「たとえば、異なるアレイ間の比較を行う場合、おのおののプローブセットの感度や特異度は一定ではなく、最終的な総合尺度にはそれらの情報が含まれていないので、各アレイにおいて計算されたLog Avg RatioやAvg Diffどうしを直接比較することには問題があるだろう。」p.74
・「問題は、同一の実験系に対してマイクロアレイの繰り返し実験(replicate experiment)を行ったとしても、mRNAもしくは遺伝子発現量は一致するわけではない、ということである。」p.74
・「オリゴヌクレオチドアレイとcDNAアレイの比較を行っている報告は複数あり、よい相関が得られたというものから、まったく相関がないというものまで、その結果はさまざまである。」p.81
・「よほどの理由でもなければ、異なるプラットフォーム間の比較はするべきではない、ということである。」p.82
・「マイクロアレイにおいては、溶液中の10^5種を超える異なる化合物の微少な量の差を、10^-4m^2以下の微少な領域のハイブリダイゼーションで測定しているわけである。」p.83
・「1つのプローブセット内のすべてのプローブペアのPM-MMの平均はAverage Difference(Avg Diff)と呼ばれ、その遺伝子の発現レベルの絶対値として使われる。」p.117
・「現在、多くの(クラスタリング)解析手法が存在するが、何の仮説もなしにこれらを盲目的に適用するのは絶対に避けるべきである。」p.131
・「どれが臨床的、生物学的に意味のありそうなデータなのかという事前の情報による制限や仮定が存在しないという点が、ゲノミクス研究における探索的アプローチの特徴の一つである。」p.132
・「遺伝子制御ネットワークとは、相互に刺激や抑制しあう遺伝子、遺伝子産物、およびそれらの相互作用のセットである。」p.185
・「現在、オントロジーという用語は、「対象となる研究領域に含まれるすべての概念、およびそれらの間のすべての関係についての形式化された記述」という意味で使われている。」p.196
~~~~~~~
?ヒューリスティックス(heuristics) 理論的に常に正しいことが保証されていないが、多くの場合に有用な経験則や知識。
チェック論文
[1]M.B.Eisen, P.T.Spellman, P.O.Brown, and D.Botstein. Cluster analysis and display of genome-wide edxpression patterns. Proceedings of the National Academy of Sciences of the United States of America, 95(25):14863-8, 1998. [ダウンロード]
[2]B.Y.Reis, A.Butte, and I.S.Kohane. Extracting knowledge from dynamics in gene expression. Journal of biomedical informatics, 34(1):15-27, 2001.
(MICROARRAYS FOR AN INTEGRATIVE GENOMICS)
・専門書。ハーバード/MITのバイオインフォマティクストレーニングプログラムの講義テキスト。前出の「わかる!使える!DNAマイクロアレイデータ解析入門」よりも一段深い内容。この分野の研究に携わるのなら必携の書、といったところ。
・「本書では機能ゲノミクスという用語を、「遺伝子や遺伝子群、そして特定の遺伝子間の相互作用に生物学的な機能を対応させるために、ゲノムを解体して検討するすべての試み」という意味で使っている。」p.3
・「ゲノミクスデータから、情報工学、計算科学、生物統計学の手法を用いて何らかの生物学的な知見を得ようとする試みは一般にバイオインフォマティクス(bioinformatics)と呼ばれる。」p.7
・「何万個もの変数に対して、たった数百の方程式しかなければ、数千もの正しい答えが生じてしまうだろう。これがマイクロアレイデータ解析が劣決定問題となってしまう本質的な理由である。」p.10
・「第3の仮定は、閉世界仮説(Closed World Assumption:CWA)である。(中略)受精した卵子が9ヵ月後に完全な人間になるような遺伝的なプログラムに従っているとしたら、コンピュータプログラムも同じ遺伝コードに従い遺伝子にコードされているすべての生理学的なイベントについて決定論的な推定ができるはずであるという考えである。」p.18
・「なぜマイクロアレイか?(中略)連鎖解析や関連解析とは対照的に、マイクロアレイ解析は原理的に、生物学的あるいは臨床的な特徴よりはむしら生体のメカニズムやシステムに関連する遺伝子の転写活性化を直接測定するようにデザインされている。」p.19
・「機能ゲノミクス研究を成功させるために最も重要なことは、まず最初に、研究している生体システムに対する疑問に関連が深い情報を最大限引き出すような遺伝子発現パターンが得られるように実験をデザインすることである。」p.31
・「たとえ何万もの遺伝子の発現レベルを測定したとしても、興味のある生体システムに関与していると信頼性をもっていえる遺伝子は数百しか得られないだろう。一方ですべての統計学的に有意な遺伝子発現変化が生物学的、生理学的システムの有意な変化に結びついているわけではない。」p.45
・「たとえば、異なるアレイ間の比較を行う場合、おのおののプローブセットの感度や特異度は一定ではなく、最終的な総合尺度にはそれらの情報が含まれていないので、各アレイにおいて計算されたLog Avg RatioやAvg Diffどうしを直接比較することには問題があるだろう。」p.74
・「問題は、同一の実験系に対してマイクロアレイの繰り返し実験(replicate experiment)を行ったとしても、mRNAもしくは遺伝子発現量は一致するわけではない、ということである。」p.74
・「オリゴヌクレオチドアレイとcDNAアレイの比較を行っている報告は複数あり、よい相関が得られたというものから、まったく相関がないというものまで、その結果はさまざまである。」p.81
・「よほどの理由でもなければ、異なるプラットフォーム間の比較はするべきではない、ということである。」p.82
・「マイクロアレイにおいては、溶液中の10^5種を超える異なる化合物の微少な量の差を、10^-4m^2以下の微少な領域のハイブリダイゼーションで測定しているわけである。」p.83
・「1つのプローブセット内のすべてのプローブペアのPM-MMの平均はAverage Difference(Avg Diff)と呼ばれ、その遺伝子の発現レベルの絶対値として使われる。」p.117
・「現在、多くの(クラスタリング)解析手法が存在するが、何の仮説もなしにこれらを盲目的に適用するのは絶対に避けるべきである。」p.131
・「どれが臨床的、生物学的に意味のありそうなデータなのかという事前の情報による制限や仮定が存在しないという点が、ゲノミクス研究における探索的アプローチの特徴の一つである。」p.132
・「遺伝子制御ネットワークとは、相互に刺激や抑制しあう遺伝子、遺伝子産物、およびそれらの相互作用のセットである。」p.185
・「現在、オントロジーという用語は、「対象となる研究領域に含まれるすべての概念、およびそれらの間のすべての関係についての形式化された記述」という意味で使われている。」p.196
~~~~~~~
?ヒューリスティックス(heuristics) 理論的に常に正しいことが保証されていないが、多くの場合に有用な経験則や知識。
チェック論文
[1]M.B.Eisen, P.T.Spellman, P.O.Brown, and D.Botstein. Cluster analysis and display of genome-wide edxpression patterns. Proceedings of the National Academy of Sciences of the United States of America, 95(25):14863-8, 1998. [ダウンロード]
[2]B.Y.Reis, A.Butte, and I.S.Kohane. Extracting knowledge from dynamics in gene expression. Journal of biomedical informatics, 34(1):15-27, 2001.