東京大学の研究グループは,単峰性確率分布モデルを細胞の形態学的データへ割り当てる細胞画像解析パイプラインを開発し,実験誤差の見積もりが正確になることで,より詳細な形態解析ができることを実証した(ニュースリリース)。
細胞の形態学的データはゲノムやトランスクリプトーム(細胞中に存在する全てのmRNAの総体)のデータに比べてノイズが大きいとされている。
細胞の顕微鏡画像はデジタル画像に変換後,細胞形態に関する豊富な情報を提供するが,同じ細胞を同じ顕微鏡で観察しても,出力データにはどうしてもある程度のばらつきが生じる。
異なる顕微鏡で同じ細胞を観察すると,細胞の見え方が微妙に違ってしまい出力データが変わってくる。つまり,形態学的データの真の値を求めることが難しい。その結果,形態異常度の検出の感度が低く,詳細な形態解析が困難になっていた。
真の値を推定するためには,まず実験誤差の分布を知ることが必要となる。そこで研究グループは,実験誤差の分布が単峰性の確率分布に従うのであれば,適切な確率分布に当てはめることで理論的に真の値を推定することができることに着目した。
実験では,数百ある形態的特徴のそれぞれに9種類の単峰性の確率分布モデルを割り当てることにより,わずかな形態的変化を正確に検出するためのUNIMO(UNImodal MOrphological data)パイプラインの開発に成功した。
UNIMOでは,まず出力される形態的特徴のそれぞれに対してデータタイプを定義する。同時に詳しい実験ログがある繰り返し実験データセットを用意する。これらを使うことで,出芽酵母の形態的特徴のほとんどが単峰性の確率分布を示すことを初めて示した。
提案したパイプラインを使って出芽酵母の非必須遺伝子破壊株の形態的変化を再解析し,従来のアプローチと比較して圧倒的に多い変異体が検出できることを確認した。さらに,他の統計学的手法と組み合わせて使用することで,細胞機能ネットワークに関するグローバルな知見が得られるようになったという。
定量的な形態学的分析では信頼できる真の値を推定することが研究の究極の目的だが,今回の研究では単峰性の確率分布を割り当てることでこれを実現した。研究グループは,異なる顕微鏡で形態解析する画像解析研究や画像診断にUNIMOを適用することで,信頼性が高いユニバーサルな出力が期待できるとしている。