北陸先端科学技術大学院大学(JAIST)の研究グループは,人工知能分野でも使われているオートエンコーダと呼ばれるディープラーニング技術を応用して,多数のピークの中でどのピークが意味を持った変化を示しているかを識別する技術を開発した(ニュースリリース)。
物質がどのような元素をどのような比率で含んでいるかを調べる方法の一つとして,X線を物質に照射して元素を特定するX線回折法がある。物質に角度を変えながらX線を照射して反射されるX線の強度を観測すると,特定の照射角度で反射強度が非常に強くなる様子が観察される(ブラッグ反射)。
そのため,照射角度を横軸,反射強度を縦軸にしたグラフはピークパターンを描く(XRDピークパターン)。ピークは物質を構成する元素に固有の値をとるため,得られたピークパターンは「物質の指紋」のようなもので,このパターン形状から物質が「どのような元素をどのような比率で含んでいるか」を推察できる。
近年,物質に別元素を添加して特性を向上させる,材料チューニングの研究が進められている。添加した元素が,どこにどれくらい導入されたのかを特定するのにX線ピークパターンである「物質の指紋」の変化から読み取る努力が続けられてきたが,その変化はしばしば僅少で,また多数あるピークのうち、どのピークが大きく変化しているのかを人間の目で読み取ることは容易ではない。
オートエンコーダ技術を用いると,画像などの識別対象データの特徴が平面上の点に表現される(特徴量空間中の点)。その点の位置の違いから「特徴の違い」を識別することができる。有名な例として,ディープラーニングによる犬猫の顔識別がある。
研究グループでは,X線ピークパターンを識別できるようニューラルネット内部の数値パラメータを調整することでオートエンコーダを訓練した。その結果,元素の添加比率で変化を示すピークとそうでないピークを自動的に識別したり,そのピーク強度変化高から添加比率を割り出したりすることができるようになった。
ピークの変化は僅少で,これらの識別は人間の目には容易ではないが,ピークパターンを特徴量空間中の点に射影することで自動識別が可能になったとする。
この成果は,対象をX線ピークパターンに限定するものではなく,物質の科学的データをディープラーニングの入力とし,その特徴を抽出する場合の全般に利活用できる技法を提供したという点で大きな意義があるという。
研究グループは,人間の目では見出しづらい法則性を抽出できる枠組みで,データ科学による定理発見を支援する有力なツールとしての活用が期待されるとしている。