九州工業大学大学院情報工学研究院の山西芳裕教授らの研究グループは、理化学研究所革新知能統合研究センターのZHAO Qibinユニットリーダーらの研究グループ、田部井靖生ユニットリーダーとの共同研究により、多様なヒト細胞における薬物応答の遺伝子発現パターンを高精度に予測する新たな情報技術を開発した。本研究成果は、2019年7月8日(英国時間)に英国科学誌「Bioinformatics」のオンライン版で公開。
研究の背景と経緯
ヒト細胞の薬物応答を遺伝子レベルで明らかにすることは、創薬における重要課題である。多くの薬物は、疾患で破綻した生体システムを正常な方向に制御することで、疾患の治療に寄与している。薬物によって誘導される細胞の状態は、遺伝子の発現パターンによって特徴付けられる。その細胞状態を反映した薬物応答遺伝子発現データは、薬物の作用メカニズムの解明や薬効の予測などにとって有用であり、さまざまな目的で活用されてきている。
近年、さまざまなヒト細胞における薬物応答遺伝子発現データが測定されるようになってきた。しかし、薬物応答遺伝子発現データの取得には、多大のコストと時間を要するため、すべての薬物やヒト細胞の組み合わせに対して網羅的に観測することは困難である。そのため、薬物応答遺伝子発現データは多くの欠損値や未観測値を含んでおり、創薬現場では網羅的な解析を行う上で障害となっていた。
研究の内容
本研究では、薬物応答遺伝子発現データを、薬物、遺伝子、細胞、時系列からなるテンソル構造と捉え、新規のテンソル分解手法であるTensor-trin weighted optimizationアルゴリズムを用いて、さまざまな細胞における未観測の薬物応答を予測する機械学習手法を開発した。薬物の効能予測に応用し、開発手法が効能予測の性能の向上に大きく寄与することを示した。
まず、薬物、細胞、遺伝子からなる3階のテンソル構造である薬物応答遺伝子発現データにおける未観測値予測性能を評価するため、観測値を人工的に欠損値と見なし、観測値を正しく再現できるか調べた。その結果、提案手法は、従来手法に比べて最大約1.5倍の精度で欠損値を補完することができることを見いだした。また、薬物応答遺伝子発現パターンは時間的にも変化するので、薬物、細胞、遺伝子、時系列からなる4階のテンソルを構築し、同様の性能評価を行った。その結果、提案手法は、特に高階テンソル構造のデータに対する有効性を示した(従来手法に比べて最大約2倍の精度向上)。
次に、欠損値を補完した薬物応答遺伝子発現データを、薬物の効能の予測に応用した。これにより、欠損値が多い細胞ほど、効能予測の性能が大きく向上し、最大約20%性能が向上することを示した。さらに、1483個の薬物を16種類のヒト細胞に添加して得られた薬物応答遺伝子発現データに提案手法を適用し、駆虫薬であるニクロサミドの成人T細胞白血病に対する効能など、さまざまな疾患に効能があると期待される薬物を選び出した。そして、その新しく予測された薬物の効能についての妥当性を、近年の文献や臨床報告で確認することができた。
今後の展開
多様なヒト細胞における薬物応答を予測する新たなアプローチを提示することにより、薬物の作用メカニズム解明や薬効予測、ツール化合物の探索など、創薬現場での医薬品開発の促進が期待される。
今後は、アルゴリズムを改善して予測の信頼性や計算効率を向上させていくとともに、既承認薬だけでなく合成化合物や天然化合物などあらゆる化合物にも解析対象を広げ、さまざまな疾患に対する医薬品候補化合物を探索していく予定である。また、特定の遺伝子を過剰発現またはノックダウンしたときの細胞状態のデータや疾患患者のマルチオミクスデータなど、テンソル構造として解釈することができるさまざまな医薬ビッグデータにも開発手法を適用し、創薬応用や医療応用につなげていく予定である。
◆用語解説
〇薬物応答遺伝子発現データ
薬物の影響により、遺伝子の発現量がどのように変化したのかを示す実数値からなるデータ。
〇テンソル
数値を多次元の配列に配置したもの。例えば、スカラー(1点における数値)は0階のテンソル、ベクトルは1階のテンソル、行列は2階のテンソルとなる。
早朝は雨、路面が濡れていた。朝からは曇り、午後から晴れ。最高気温は25℃と和らぐ暑さとなった。
近所の買い物団地の敷地のお庭には、”シロシタン”が植えられており、実が沢山付いている。秋に、この青い実は赤くなる・・とても綺麗だ。
”シロシタン”は”ベニシタン”の花が白色の枝変わり品種だと言われる。両者の違いは花の色と花の開き方で、”シロシタン”は花色が白色で花は大きく開き、”ベニシタン”は花色が紅色で花は全開せず少し蕾んだ状態である。秋には両者(シロシタン、ベニシタン)とも同じ小さな赤い実となる。・・両者の区別は、分からない。
因みに、バラ科コトネアステル属(シャリントウ属)にも園芸植物が色々ある。その中で良く普及しているのは”ベニシタン”なので、ベニシタンをコトネアスターと呼ぶことがある。
シロシタン(白紫壇)
ベニシタン(紅紫壇)の枝変わり品種
学名:Cotoneaster horizontalis
バラ科コトネアスター属(シャリントウ属)
常緑小低木
関東以北では紅葉・落葉する
枝は地上を水平に這うように伸びる
原産地は中国西部の山岳地帯
日本には大正時代~昭和初期に渡来
開花時期:5月~6月
葉脈に花を開き、秋に枝一面の小果(径5mm程)が赤く熟す
花色は紅色(ベニシタン)、白色(シロシタン)
研究の背景と経緯
ヒト細胞の薬物応答を遺伝子レベルで明らかにすることは、創薬における重要課題である。多くの薬物は、疾患で破綻した生体システムを正常な方向に制御することで、疾患の治療に寄与している。薬物によって誘導される細胞の状態は、遺伝子の発現パターンによって特徴付けられる。その細胞状態を反映した薬物応答遺伝子発現データは、薬物の作用メカニズムの解明や薬効の予測などにとって有用であり、さまざまな目的で活用されてきている。
近年、さまざまなヒト細胞における薬物応答遺伝子発現データが測定されるようになってきた。しかし、薬物応答遺伝子発現データの取得には、多大のコストと時間を要するため、すべての薬物やヒト細胞の組み合わせに対して網羅的に観測することは困難である。そのため、薬物応答遺伝子発現データは多くの欠損値や未観測値を含んでおり、創薬現場では網羅的な解析を行う上で障害となっていた。
研究の内容
本研究では、薬物応答遺伝子発現データを、薬物、遺伝子、細胞、時系列からなるテンソル構造と捉え、新規のテンソル分解手法であるTensor-trin weighted optimizationアルゴリズムを用いて、さまざまな細胞における未観測の薬物応答を予測する機械学習手法を開発した。薬物の効能予測に応用し、開発手法が効能予測の性能の向上に大きく寄与することを示した。
まず、薬物、細胞、遺伝子からなる3階のテンソル構造である薬物応答遺伝子発現データにおける未観測値予測性能を評価するため、観測値を人工的に欠損値と見なし、観測値を正しく再現できるか調べた。その結果、提案手法は、従来手法に比べて最大約1.5倍の精度で欠損値を補完することができることを見いだした。また、薬物応答遺伝子発現パターンは時間的にも変化するので、薬物、細胞、遺伝子、時系列からなる4階のテンソルを構築し、同様の性能評価を行った。その結果、提案手法は、特に高階テンソル構造のデータに対する有効性を示した(従来手法に比べて最大約2倍の精度向上)。
次に、欠損値を補完した薬物応答遺伝子発現データを、薬物の効能の予測に応用した。これにより、欠損値が多い細胞ほど、効能予測の性能が大きく向上し、最大約20%性能が向上することを示した。さらに、1483個の薬物を16種類のヒト細胞に添加して得られた薬物応答遺伝子発現データに提案手法を適用し、駆虫薬であるニクロサミドの成人T細胞白血病に対する効能など、さまざまな疾患に効能があると期待される薬物を選び出した。そして、その新しく予測された薬物の効能についての妥当性を、近年の文献や臨床報告で確認することができた。
今後の展開
多様なヒト細胞における薬物応答を予測する新たなアプローチを提示することにより、薬物の作用メカニズム解明や薬効予測、ツール化合物の探索など、創薬現場での医薬品開発の促進が期待される。
今後は、アルゴリズムを改善して予測の信頼性や計算効率を向上させていくとともに、既承認薬だけでなく合成化合物や天然化合物などあらゆる化合物にも解析対象を広げ、さまざまな疾患に対する医薬品候補化合物を探索していく予定である。また、特定の遺伝子を過剰発現またはノックダウンしたときの細胞状態のデータや疾患患者のマルチオミクスデータなど、テンソル構造として解釈することができるさまざまな医薬ビッグデータにも開発手法を適用し、創薬応用や医療応用につなげていく予定である。
◆用語解説
〇薬物応答遺伝子発現データ
薬物の影響により、遺伝子の発現量がどのように変化したのかを示す実数値からなるデータ。
〇テンソル
数値を多次元の配列に配置したもの。例えば、スカラー(1点における数値)は0階のテンソル、ベクトルは1階のテンソル、行列は2階のテンソルとなる。
早朝は雨、路面が濡れていた。朝からは曇り、午後から晴れ。最高気温は25℃と和らぐ暑さとなった。
近所の買い物団地の敷地のお庭には、”シロシタン”が植えられており、実が沢山付いている。秋に、この青い実は赤くなる・・とても綺麗だ。
”シロシタン”は”ベニシタン”の花が白色の枝変わり品種だと言われる。両者の違いは花の色と花の開き方で、”シロシタン”は花色が白色で花は大きく開き、”ベニシタン”は花色が紅色で花は全開せず少し蕾んだ状態である。秋には両者(シロシタン、ベニシタン)とも同じ小さな赤い実となる。・・両者の区別は、分からない。
因みに、バラ科コトネアステル属(シャリントウ属)にも園芸植物が色々ある。その中で良く普及しているのは”ベニシタン”なので、ベニシタンをコトネアスターと呼ぶことがある。
シロシタン(白紫壇)
ベニシタン(紅紫壇)の枝変わり品種
学名:Cotoneaster horizontalis
バラ科コトネアスター属(シャリントウ属)
常緑小低木
関東以北では紅葉・落葉する
枝は地上を水平に這うように伸びる
原産地は中国西部の山岳地帯
日本には大正時代~昭和初期に渡来
開花時期:5月~6月
葉脈に花を開き、秋に枝一面の小果(径5mm程)が赤く熟す
花色は紅色(ベニシタン)、白色(シロシタン)