NICTら,単一光子による意思決定システムの実証に成功

情報通信研究機構(NICT),物質・材料研究機構(NIMS),仏国立科学研究センター(CNRS)及び仏ジョセフ・フーリエ大学は,単一光子を用いて,高効率に意思決定をする全く新しい概念の知的フォトニックシステムを,ダイヤモンド中の窒素欠陥(NV)を単一光子源とし,偏光制御装置,単一光子検出器及び独自のシステムを用いた実験により実証した(ニュースリリース)。

動的に変化する不確実な環境において効率的な意思決定を実現するには,複数の選択肢の中から報酬が得られる確率が最も高いものをできるだけ速く正確に探索しなければならない。このとき,すべての選択肢の報酬確率を正確に見積もるためには,十分な検証が必要になる。

正確さを追求し過ぎると,「探索コスト」がかさみ利益を損ねる。しかし,探索を早急に打ち切り過ぎると,報酬確率の低い選択肢に投資して損をするリスクが高くなる。このような探索の「正確さ」と「速さ」とのトレードオフは,効率的な意思決定を要求される現実社会の課題として「探索と搾取のジレンマ」と呼ばれている。

報酬確率が最も高い選択肢を速く正確に判断することを求められる意思決定問題は,機械学習の分野では「多本腕バンディット問題(Multi-armed Bandit Problem;MAB)」と呼ばれる問題として定式化されている。MABは,情報通信技術における周波数割当ての効率化,ウェブ広告の最適化,コンピュータ囲碁などで使われるモンテカルロ木探索の高速化など,様々な応用と密接に関連している。

したがって,効率的なMABソルバーの開発は,情報通信における新たな重要なコア技術の創成につながる。2009年にNIMSは,「綱引きアルゴリズム」と呼ばれる独自のMAB解探索アルゴリズムを定式化し「綱引き原理」としてまとめた。綱引きアルゴリズムは,従来のデジタル計算機のソフトウェアはもちろん,類似したダイナミクスを持つ様々な物理過程を用いて物理的に直接に実現可能という特長を持っている。

共同研究グループは,2013年にナノ寸法における光と物質の相互作用(近接場光)を利用することによって,綱引きアルゴリズムを物理的に実装してMABの解を探索できることを理論的に示した。2014年には量子ドットと近接場光を利用してMABの解を探索できることを実験的に実証した。そして今回,単一光子を用いた綱引きアルゴリズムの物理的実装を試み,自然界の揺らぎを活用した意思決定問題の解決に,世界で初めて実験的に成功した。

偏光ビームスプリッタ(PBS)に対して45度傾いた偏光を有する単一光子が入射したとする。光子はPBSにより,確率1/2でチャンネル0又はチャンネル1に向かう。このとき,チャンネル0で単一光子が検出されたときには,チャンネル1で単一光子が観測される確率は0となる。このような確率的でありかつ粒子的であるという単一光子の物理的性質を意思決定問題の解決に応用した。

PBSに対してほとんど水平の偏光を有する単一光子が入射したときは,PBSにより,ほとんど1の確率で光子はチャンネル0に向かう。ただし,わずかな確率で,チャンネル1で光子が検出されることもある。同様に,PBSに対してほとんど垂直の偏光を有する単一光子が入射したときは,ほとんど1の確率で光子はチャンネル1に向かうが,わずかな確率でチャンネル0で光子が検出される。

このように,単一光子の行き先は偏光に依存して確率的に異なってくるが,個々のイベントは光の粒子性のため確実に決まる。この研究では,チャンネル0で光子が検出されたら,ただちにスロットマシンLを選ぶ意思が決定されたと見なし,チャンネル1での光子検出を,マシンRを選択する意思の決定と対応付ける。このように単一光子の検出と意思決定を対応させ,綱引きアルゴリズムを単一光子の偏光の制御として実現した。

実験では,単一光子源としてダイヤモンド中の窒素欠陥を用い,偏光子,半波長板,PBS通過後の光子を2チャンネルの単一光子検出器で計測し,時間相関単一光子計数システムにより到着タイミングを検出し,これを意思決定に用いる。そして,選択したスロットマシンからの報酬に基づいて半波長板の回転角を調節し,単一光子の偏光状態を制御する。

2台のスロットマシンのうち報酬確率が高い方を選択する実験では,時間の経過とともに正解率が1に漸近した。その後,環境が不確実に変化することを表現するため,150サイクルごとにスロットマシンの報酬確率を反転させた。この結果,報酬確率の反転直後に正解率は急激に低下するが,時間の経過とともに回復し,やがて1に漸近した。

これは,システムが自律的に環境変化を検知し,正しい意思決定を実現していることを示している。スロットマシンの報酬確率の差がより小さい難易度の高い問題を設定した場合,正解率はやや低下するが,依然として自律的に正しい意思決定を実現した。

今回実証した意思決定機能は,単一光子の物理的性質を利用しており,従来のデジタル計算機上でソフトウェアとして実行されるこれまでの機械学習システムとは全く異なる形態で実装されている。この研究では,量子レベルの光(単一光子)を用いて効率的な意思決定を実現できることを初めて実験的に示した。

研究グループでは今後,フォトニクスを利用することで更なる知的機能が実現され,こうした「知的フォトニックシステム」が情報通信における新たな重要なコア技術となると期待している。

関連記事「東大,光子の非局所性を厳密に実証-物理学の100年論争に決着」「東大,GaN系ナノワイヤ量子ドットで室温での単一光子の発生に成功」「東工大,ゲルマニウム導入し光るダイヤを開発