理化学研究所(理研)と,リガク応用技術センターの研究グループは,深層学習を用いた画像解析により,X線結晶構造解析においてタンパク質結晶試料を自動的に検出するプログラム「DeepCentering」を開発した(ニュースリリース)。
放射光施設における高輝度X線を利用した結晶構造解析では,結晶センタリングと呼ばれる,ゴニオメーター上にマウントされた結晶をどの方向に回してもX線の光路上に位置させる作業が必要。従来,この作業はビームライン利用者が目視で行なうか,強度を弱めたX線を結晶に照射することで結晶の位置を検出して行なうのが主流だった。
今回,研究グループが開発したプログラムでは,クライオループ(結晶と同程度の大きさ(数十~数百μm)のナイロンもしくはポリイミド製のループで,結晶化母液ごとすくい取って凍結されるタンパク質結晶試料)を認識するための教師データとして,これまでに大型放射光施設「SPring-8」のタンパク質結晶構造解析ビームライン(BL26B2)で取得した約6,000枚のクライオループ画像を利用した。
次に,結晶を認識するための教師データとして,実際のタンパク質結晶画像では外形があいまいな例が数多く含まれるため,単純な多角形の画像を約400枚自動生成して利用した。その結果,学習が効率良く進み,精度の高い検出結果を得ることに成功した。
これまでも画像処理技術を用いた結晶検出プログラムは開発されてきたが,試料観察カメラのコントラストなどが変わると検出精度が低下するなどの問題があった。このプログラムでは,そのような場合でも正確にクライオループや結晶を検出し,これまで開発されてきた画像処理ベースでの結晶検出プログラムの問題を解決したという。
このプログラムと,すでに研究チームが開発しているビームライン制御ソフトウェア,回折データ自動処理プログラム,および自動構造解析プログラムを用いて,データ取得および構造解析の自動化に成功した。
また,このプログラムの機能の一部を利用して,自動センタリングした試料に対し,目視によるセンタリング結果との画像比較による自動位置修正を行なうことで,より高精度な結晶位置決めも可能となるという。この機能は,ビームラインでのメールインデータ収集に利用されている。
今回の開発により,X線照射を必要とすることなく試料検出の自動化が可能となった。研究グループはこれにより,特に放射線損傷の影響を受けやすい試料や室温での自動回折データ収集での活用が期待できるとしている。