日刊工業(2017/1/18 05:00)
科学技術振興機構の寺田愛花さきがけ専任研究員と産業技術総合研究所人工知能研究センターの瀬々潤機械学習研究チーム長、東京大学の津田宏治教授らは、がんやアルツハイマー病などの疾患に関連する複数の遺伝子を特定する統計解析手法を開発した。DNA配列の個人差を大規模に調べるゲノムワイド関連解析(GWAS)に適応し、がんに関連する五つの遺伝子変異(SNP)が重なると、がんの発症率が有意に高い組み合わせを見つけた。
従来は一つのSNPと疾患との関連を特定する解析が中心。遺伝子変異の組み合わせがわかると、発症メカニズムの解明や薬の標的になるたんぱく質を見つけやすくなる。
統計手法の一種である「無限次数多重検定法」(LAMP)をGWASの解析用に修正して適用した。出現頻度の低い組み合わせは、誤発見率を変化させないという数理的性質を利用。無為なSNPの組み合わせをアルゴリズムで特定して取り除いた。偽陽性が減り、三つのSNPの組み合わせの検出感度は100万倍に高まった。
がんを対象に607人、1万2758個のSNPを解析したところ、106件のがん関連遺伝子を特定。発がんに五つのSNPが関わる組み合わせを3件、四SNPを1件、三SNPを6件、二SNPを39件、一SNPを57件それぞれみつけた。
またアルツハイマーを対象とする364人、38万157個のSNPのGWASでは、四SNPが発症に関わる組み合わせを特定した。
今回は遺伝子配列の中で、たんぱく質に翻訳される配列(エクソーム)のSNPを解析した。
今後、計算効率を高めて全遺伝情報(ゲノム)解析への適用を目指す。
(2017/1/18 05:00)
SNPsもやっと検出力が有用になってきた。個人の遺伝子解析が普通の時代になると、治療よりも予防が意識される時代が必然的にやってくる。
LAMPLINK: detection of statistically significant SNP combinations from GWAS data
Aika Terada Ryo Yamada Koji Tsuda Jun Sese
Bioinformatics (2016) 32 (22): 3513-3515.
Genome-wide association studies (GWASs) have identified hundreds of loci associated with various complex human traits (Welter et al., 2014). These studies conduct screening of individual single nucleotide polymorphisms (SNPs) using statistical tests to assess the association of each SNP with a phenotype. However, this procedure is known to cause the ‘missing heritability’, namely, a large proportion of heritability remains unexplained by loci identified (Maher, 2008), hence it is increasingly important to evaluate combinatorial effects of SNPs (Wei et al., 2014).
Several types of software have been developed to detect interactions among SNPs related to a phenotype (Purcell et al., 2007; Zhang and Liu, 2007; Calle et al., 2010; Wan et al., 2010; Kam-Thong et al., 2012; Van Lishout et al., 2013). However, few methods can simultaneously overcome two major problems. One is that statistical validity is not performed. Most methods that can enumerate higher-order interactions do not evaluate statistical significance of the results. The other is that a combination size is limited in practical application. Existing statistical techniques such as logistic regression and multifactor dimensionality reduction can be used to find combinatorial effects. When we investigate all combinatorial effects, these techniques have to be applied to all possible combinations, which is too computationally intensive. Both problems need to be overcome if high-order interaction analysis is to be successfully performed.続きは原著へどうぞ。
科学技術振興機構の寺田愛花さきがけ専任研究員と産業技術総合研究所人工知能研究センターの瀬々潤機械学習研究チーム長、東京大学の津田宏治教授らは、がんやアルツハイマー病などの疾患に関連する複数の遺伝子を特定する統計解析手法を開発した。DNA配列の個人差を大規模に調べるゲノムワイド関連解析(GWAS)に適応し、がんに関連する五つの遺伝子変異(SNP)が重なると、がんの発症率が有意に高い組み合わせを見つけた。
従来は一つのSNPと疾患との関連を特定する解析が中心。遺伝子変異の組み合わせがわかると、発症メカニズムの解明や薬の標的になるたんぱく質を見つけやすくなる。
統計手法の一種である「無限次数多重検定法」(LAMP)をGWASの解析用に修正して適用した。出現頻度の低い組み合わせは、誤発見率を変化させないという数理的性質を利用。無為なSNPの組み合わせをアルゴリズムで特定して取り除いた。偽陽性が減り、三つのSNPの組み合わせの検出感度は100万倍に高まった。
がんを対象に607人、1万2758個のSNPを解析したところ、106件のがん関連遺伝子を特定。発がんに五つのSNPが関わる組み合わせを3件、四SNPを1件、三SNPを6件、二SNPを39件、一SNPを57件それぞれみつけた。
またアルツハイマーを対象とする364人、38万157個のSNPのGWASでは、四SNPが発症に関わる組み合わせを特定した。
今回は遺伝子配列の中で、たんぱく質に翻訳される配列(エクソーム)のSNPを解析した。
今後、計算効率を高めて全遺伝情報(ゲノム)解析への適用を目指す。
(2017/1/18 05:00)
SNPsもやっと検出力が有用になってきた。個人の遺伝子解析が普通の時代になると、治療よりも予防が意識される時代が必然的にやってくる。
LAMPLINK: detection of statistically significant SNP combinations from GWAS data
Aika Terada Ryo Yamada Koji Tsuda Jun Sese
Bioinformatics (2016) 32 (22): 3513-3515.
Genome-wide association studies (GWASs) have identified hundreds of loci associated with various complex human traits (Welter et al., 2014). These studies conduct screening of individual single nucleotide polymorphisms (SNPs) using statistical tests to assess the association of each SNP with a phenotype. However, this procedure is known to cause the ‘missing heritability’, namely, a large proportion of heritability remains unexplained by loci identified (Maher, 2008), hence it is increasingly important to evaluate combinatorial effects of SNPs (Wei et al., 2014).
Several types of software have been developed to detect interactions among SNPs related to a phenotype (Purcell et al., 2007; Zhang and Liu, 2007; Calle et al., 2010; Wan et al., 2010; Kam-Thong et al., 2012; Van Lishout et al., 2013). However, few methods can simultaneously overcome two major problems. One is that statistical validity is not performed. Most methods that can enumerate higher-order interactions do not evaluate statistical significance of the results. The other is that a combination size is limited in practical application. Existing statistical techniques such as logistic regression and multifactor dimensionality reduction can be used to find combinatorial effects. When we investigate all combinatorial effects, these techniques have to be applied to all possible combinations, which is too computationally intensive. Both problems need to be overcome if high-order interaction analysis is to be successfully performed.続きは原著へどうぞ。