理化学研究所(理研)は,大型放射光施設「SPring-8」を活用し,タンパク質のX線結晶構造解析において高い解像度と精度を実現する新たなデータ収集・統合方法を開発した(ニュースリリース)。
SPring-8の放射光ビームラインの一つ,理研ターゲットタンパクビームライン(BL32XU)では,10μm未満の小型結晶でもデータ収集と解析ができる。さらに,X線照射によって結晶が損傷するため,複数の結晶から部分的なデータを収集し統合することで,これまで解析困難だった膜タンパク質の構造解明を実現してきた。
研究グループは,統合する結晶数(データ数)が多いほど構造解析の空間分解能が向上する可能性があることに気付き,そのメカニズムと限界点を解明する調査を行なった。
研究では,3種類のタンパク質の結晶を大量に用いて測定した後,少数の結晶データと多数の結晶データを統合した構造情報を定量的に比較した。その結果,以下の知見を得た。
①分解能向上:より多数の結晶データを統合することで,分解能(電子密度図の解像度)が向上することを確認した。単なる数値の向上だけでなく,細かい実質的な構造情報が増えていることも証明した。
これは,ぼんやりした写真でも同じ画角のものを繰り返し撮像し,その画像を重ねることでより明瞭な画像を得ることができる現象と似ているという。
②構造決定力の改善:統合した結晶数の増加に伴い電子密度図の質が改善され,構造解析(初期構造決定)も容易になった。
③データ精度向上の限界:約8,000個もの結晶データを収集し統合したが,少なくともこの範囲では分解能向上は限界に到達しなかった。特に,非常に観測しづらい微弱な電子密度が統合データ数の増加とともに明瞭に観察できることが分かった。
研究では機械学習を利用して,大量データを結晶間の微妙な構造の違いによってグループ分けした後に統合することの重要性についても検討した。例えば,大量のデータには不良データや異なる構造のものが混じる場合もある。
それらを構造の似たもの同士でグループ分けすることによって検討すべきデータセットを絞り込み,効率的に構造解析を進めることができる。実際,この方法で低品質のデータグループを排除できたという。
これらの結果は,今回発見したデータ収集・統合方法が,大量にデータ収集を行なうことで,より解像度の高いタンパク質の構造解析を実現できることを示しており,どのような結晶にも適用可能と見られるという。
研究グループは,この手法により得られる高精度・高分解能の構造データは,タンパク質構造生命科学を次のステージへ進化させるとしている。