早稲田大学の研究グループは,機械学習を使った有機固体の構造相転移スクリーニングに成功した(ニュースリリース)。
構造相転移の発現を事前に予測することができれば,効率的な材料創出が可能となる。しかし,有機固体は単位格子内の原子数が無機材料に比べて多く,計算コストや計算精度の問題から,多数のデータをスクリーニングすることには不向き。そのため,多数の有機固体をスクリーニングし,どの材料が構造相転移を起こすか予測する手法は確立されていなかった。
研究グループは,分子記述子を用いて機械学習を行ない,構造相転移の発現しやすさを予測することを目指した。この問題設定では結晶構造を考慮していないため,結晶多形の区別や構造ダイナミクス解析はできないが,分子記述子を用いることでシンプルな問題設定となり,計算コストは低くなる。このメリットを優先して分子記述子を使った機械学習を実施した。
構造相転移が報告されている有機固体データを文献から独自にまとめ,相転移の報告がないデータはケンブリッジ結晶構造データベースCSDから取得した。構築したデータセットを用いて,構造相転移の発現可能性を予測する機械学習モデルを構築した。
この機械学習モデルに約18万個の分子データを入力すると,構造相転移が発現する確率が高い分子として113個の分子を抽出することが可能となった。このうち,9個の分子については文献および実験で構造相転移の発現を確認することができた。その結果,この手法によるスクリーニングでは,約8.0%の割合で相転移する分子を得ることに成功した。
これは,CSDに含まれる相転移の報告率約0.3%を上回る値であり,機械学習による分子スクリーニングが従来より高い精度で機能したと言えると研究グループは考えている。また,実験で確認した構造相転移は過去に報告がなく,本スクリーニングで新規構造相転移を見出すという成果を挙げることとなった。
さらに,分子記述子を使った回帰分析から,分子構造と転移温度とは関係性があることが分かった。結晶構造の情報がなくても分子構造だけで相転移温度を予測できることは新しい知見と言える。
構造相転移は蓄熱材料,強誘電材料,アクチュエータ材料などで重要な現象であるため,機能性有機固体の分子スクリーニングに有効だと期待できる。また,回帰モデルを使って分子構造から転移温度を予測できるようになり,実施者の好む温度で構造相転移する材料を開発できる可能性もある。
研究グループは,材料・製薬分野に波及効果のある成果として期待されるとしている。