情報通信研究機構(NICT),埼玉大学,慶應義塾大学は,半導体レーザーから生じる光カオス(レーザーカオス)を用いて,適応速度 1GHzを実現する超高速フォトニクスを応用した強化学習に世界で初めて成功した(ニュースリリース)。
人工知能(AI)を支える機械学習では,画像認識などに用いられる「深層学習」と共に「強化学習」が重要となっている。強化学習は,未知な環境で試行錯誤をしながら学習を行なう方法で,その中心となる課題に,多数のスロットマシンが並んだカジノで,儲けを最大にするにはどのようにするとよいか?という問題がある。
儲けを最大化するには,「当たり台」を見つけるためには「試し打ち」をしなければならない。しかし,過剰な試し打ちは損失になることがあり,当たり台が時々刻々と変わることもあり得る。逆に,早々に試し打ちを打ち切ってしまうと,肝心の当たり台を見逃す可能性もある。
このように,「探索」と「決断」に難しいジレンマが存在する。この問題は「多本腕バンディット問題」として知られ,ワイヤレス通信における周波数の割当て,データセンターでの計算資源の割当て,ロボット制御,Web広告など,非常に重要な応用の基礎になっていることから,熱心な研究が行なわれている。
この問題の解決には,当たり台の探索において,「ランダムに」台を選ぶことが不可欠。例えば,プレイの序盤では「ランダムに」選び,時間の経過とともに,それまでの勝率を参考に選んでいく方法などが知られている。
これらの従来手法では,ランダムに台を選ぶために,コンピューター上で生成した「擬似乱数」を用いている。しかし,擬似乱数は,コンピューター上で計算手順(アルゴリズム)に基づいて作られるため,高速に生成することは難しい。また,乱数の「質」にも限界があり,従来の強化学習の限界を克服する高速な原理と技術が強く望まれている。
今回,半導体レーザーを用いた時に生じる光の「カオス現象」を用いた。半導体レーザーから出射する光を,鏡で反射させてレーザーに戻すと,レーザーの動作が不安定化しカオスが生じる。この現象を積極的に生かして,1兆b/sを超える超高速な物理乱数生成技術などに展開されている。
研究では,このレーザーカオスを用いて,2台のスロットマシンから,「当たり台」(=当たり確率が高い台)を選ぶ問題の超高速な解決を実現した。半導体レーザーから生成したレーザーカオス光を高速にサンプリングし,「閾値」との大小判定のみで意思決定を行なう。ここで,閾値を「過去の戦歴」に基づいて上げ下げすることが重要であり,以前の成果でも用いた「綱引き原理」と呼ばれている独自の方式を応用した。
こうして,カオスから生まれる特長が,「当たり台を速やかに発見する」ことに生かされた結果,適応速度1GHzを実現する超高速フォトニクスを応用した超高速な強化学習が実証された。また,仮想的に生成した高速な擬似乱数(カラーノイズ)に比べても優れた性能を示すことも確認された。
レーザーカオスが強化学習という人工知能分野に貢献できると実証されたことで,様々な展開が期待される。まず,レーザーカオスを用いた方式は,広帯域性という光のメリットを生かしており,従来技術では不可能な高速性が実現できる。また,半導体レーザーなど成熟したフォトニクス技術を用いているため,安定性や集積性に優れたシステムの実現が可能。
応用面では,高速・低レイテンシの実現が強く期待されている,システムのアービトレーション(調停)応用や超高速取引での意思決定としてフィンテックなどへの展開を検討する予定だという。