産業技術総合研究所人工知能研究センター機械学習研究チーム瀬々潤研究チーム長・椿真史特別研究員は、東京大学生産技術研究所物質・環境系部門溝口照康准教授と共同で、化学物質の分子構造からその物質の物性値を高速、高精度に検証可能な形で予測する手法を開発した(発表2018年9月19日)。
化学物質の物性値を知ることは材料開発において重要である。それには、二つの方法が用いられている。一つは実際にその物質を合成しそれぞれの物性値を測定する、もう一つは化学物質の分子構造をコンピューターに入力し理論計算することである。しかし、どちらもさまざまな設備と専門知識や経験が必要で、長い時間がかかる
膨大な数の化学物質が存在する。アメリカ化学会の化学物質データベースには約3,000万種が登録されている。そのうち大量生産されているものは0.02%に満たない5,000種で、それぞれ世界で毎年1,000トン以上生産されている。化学物質が示すさまざまな物性値を高速・高精度で予測できれば材料開発のスピードを加速させうる。
分子構造は、元素とその位置、つまり3次元立体構造データとして表現される。本研究では、物理化学の分野で用いられている近似式に基づいて、分子中の原子間に、化学結合などの相互作用の「強さの変化」を「バネの伸び縮み」で表すような関数(ポテンシャル)を設定した。そしてその関数を表すニューラルネット(機械学習モデル)を、大規模データで学習させる手法を考案した。この関数は、原子間の相互作用や化学結合の強さに対応するため、学習結果の物理化学的な解釈と検証が可能である。この考案した手法を用いて、13万を越える化合物からなる大規模なデータベースを学習させて、予測の計算時間と精度を評価した。その結果、分子が示すさまざまな物性値を理論計算の1万倍以上の速さで、理論計算と同程度の高精度で予測できることが確認できた。例えば原子化エネルギーについては100分の1秒の時間で誤差0.01 eV(電子ボルト)以下の精度で予測できた。これは、理論計算と同程度の精度を、理論計算の1万倍以上の速さで実現したことになる。
◆理論計算
第一原理計算や格子静力学計算、分子動力学計算などさまざまな手法があり、ここでは原子の種類と配置から電子の波動関数を計算する第一原理計算を用いた。一回の理論計算には、数時間~数十時間の計算時間を要する。
◆機械学習
データから変数間の関数関係や法則性を抽出し、データの分類や予測を可能にするための方法、アルゴリズム。人間の脳神経回路を模したニューラルネットワークや、サポートベクトルマシンなどさまざまな手法がある。
◆ポテンシャル
力の強さの変化を表す関数。ポテンシャル関数を微分したものが力の強さになる。
朝は雨。10時半頃から曇り~晴れ。気温も上昇し、最高気温26℃とか。
ビルの裏口に小さな庭があり、”ゴシキトウガラシ(五色唐辛子)”が植えられており、色とりどりの実が付き、花も咲いている。食用にされるトウガラシと同属であるが、観賞用唐辛子なので食べない。カラフルな実を観賞するもので、最初に緑色の実は赤~黄色・紫など様々な色に変化する。実の形は丸から円錐状のものなどがある。
果実が丸くオレンジ色のフユサンゴと良く似ているが、フユサンゴはソラナム属で、”ゴシキトウガラシ”はトウガラシ属である。
因みに、唐辛子は1542年にポルトガル宣教師がキリシタン大名の大友宗麟に献上したと言われる。観賞用で、足袋に入れて霜焼けよけで利用され、食用としてはかなり後。秀吉の朝鮮征伐の際に加藤清正が朝鮮半島に持ち込んで、朝鮮に伝わり、キムチに使われるようになったと言う。
ゴシキトウガラシ(五色唐辛子)
別名:観賞用唐辛子
ナス科トウガラシ属
原産地は熱帯アメリカ
一年草(多年草・常緑低木だが寒さに弱く、一年草扱い)
開花時期は6月~8月
実の鑑賞期は8月~11月
化学物質の物性値を知ることは材料開発において重要である。それには、二つの方法が用いられている。一つは実際にその物質を合成しそれぞれの物性値を測定する、もう一つは化学物質の分子構造をコンピューターに入力し理論計算することである。しかし、どちらもさまざまな設備と専門知識や経験が必要で、長い時間がかかる
膨大な数の化学物質が存在する。アメリカ化学会の化学物質データベースには約3,000万種が登録されている。そのうち大量生産されているものは0.02%に満たない5,000種で、それぞれ世界で毎年1,000トン以上生産されている。化学物質が示すさまざまな物性値を高速・高精度で予測できれば材料開発のスピードを加速させうる。
分子構造は、元素とその位置、つまり3次元立体構造データとして表現される。本研究では、物理化学の分野で用いられている近似式に基づいて、分子中の原子間に、化学結合などの相互作用の「強さの変化」を「バネの伸び縮み」で表すような関数(ポテンシャル)を設定した。そしてその関数を表すニューラルネット(機械学習モデル)を、大規模データで学習させる手法を考案した。この関数は、原子間の相互作用や化学結合の強さに対応するため、学習結果の物理化学的な解釈と検証が可能である。この考案した手法を用いて、13万を越える化合物からなる大規模なデータベースを学習させて、予測の計算時間と精度を評価した。その結果、分子が示すさまざまな物性値を理論計算の1万倍以上の速さで、理論計算と同程度の高精度で予測できることが確認できた。例えば原子化エネルギーについては100分の1秒の時間で誤差0.01 eV(電子ボルト)以下の精度で予測できた。これは、理論計算と同程度の精度を、理論計算の1万倍以上の速さで実現したことになる。
◆理論計算
第一原理計算や格子静力学計算、分子動力学計算などさまざまな手法があり、ここでは原子の種類と配置から電子の波動関数を計算する第一原理計算を用いた。一回の理論計算には、数時間~数十時間の計算時間を要する。
◆機械学習
データから変数間の関数関係や法則性を抽出し、データの分類や予測を可能にするための方法、アルゴリズム。人間の脳神経回路を模したニューラルネットワークや、サポートベクトルマシンなどさまざまな手法がある。
◆ポテンシャル
力の強さの変化を表す関数。ポテンシャル関数を微分したものが力の強さになる。
朝は雨。10時半頃から曇り~晴れ。気温も上昇し、最高気温26℃とか。
ビルの裏口に小さな庭があり、”ゴシキトウガラシ(五色唐辛子)”が植えられており、色とりどりの実が付き、花も咲いている。食用にされるトウガラシと同属であるが、観賞用唐辛子なので食べない。カラフルな実を観賞するもので、最初に緑色の実は赤~黄色・紫など様々な色に変化する。実の形は丸から円錐状のものなどがある。
果実が丸くオレンジ色のフユサンゴと良く似ているが、フユサンゴはソラナム属で、”ゴシキトウガラシ”はトウガラシ属である。
因みに、唐辛子は1542年にポルトガル宣教師がキリシタン大名の大友宗麟に献上したと言われる。観賞用で、足袋に入れて霜焼けよけで利用され、食用としてはかなり後。秀吉の朝鮮征伐の際に加藤清正が朝鮮半島に持ち込んで、朝鮮に伝わり、キムチに使われるようになったと言う。
ゴシキトウガラシ(五色唐辛子)
別名:観賞用唐辛子
ナス科トウガラシ属
原産地は熱帯アメリカ
一年草(多年草・常緑低木だが寒さに弱く、一年草扱い)
開花時期は6月~8月
実の鑑賞期は8月~11月