埼玉大ら，レーザーのカオス的遍歴で強化学習を実証

埼玉大学，金沢大学，東京大学は，マルチモード半導体レーザーにおける縦モード間のカオス的遍歴を用いて，機械学習方式の一つである強化学習における問題例の解決方法を提案し，実験での実証に成功した（ニュースリリース）。

近年，ムーアの法則を打破する情報処理方式を提供するために，光を活用した機械学習に注目が集まっている。その一つとして，強化学習の問題例として知られる，当たり確率が未知の複数台のスロットマシン（選択肢）からの報酬の最大化を目的とした多腕バンディット問題を，光ダイナミクスを活用して解くという研究が行なわれてきた。しかしながら既存研究では，選択肢の数が多い場合に性能が大幅に劣化するという課題があった。

研究では，複数の縦モードを有するマルチモード半導体レーザーにおけるカオス的遍歴現象を利用して，多腕バンディット問題を解く方式を新たに提案した。

カオス的遍歴は脳の自発的機能において重要な役割を担う現象として知られており，この方式に取り入れることで，既存研究で問題となった選択肢が多い場合にも対応でき，従来用いられるソフトウェアのアルゴリズムよりも高効率に意思決定が実現できることを示した。

すなわち，光のカオス的遍歴を利用することで，どんなに選択肢が多くても，既存アルゴリズムよりも少ない試行で，自発的に正しい選択肢を推定できるという。そして，この手法の有効性に関して半導体レーザーを用いた実験で検証し，レーザーにおけるカオス的遍歴を用いて強化学習が実現できることを世界で初めて実証した。

この研究の新規性は，レーザー光のカオス的遍歴を用いて，強化学習の代表的な問題である多腕バンディット問題を解いた点になる。従来はコンピュータ内でソフトウェア的に解く方法が主流だったが，多腕バンディット問題を効率的に解くための光ハードウェアを開発した点に新規性があるとする。

またカオス的遍歴とは，異なる複数のカオス状態間を遷移する現象だが，多腕バンディット問題における探索（当たり確率の高いスロットマシンを見つけること）を行なう際に，カオス的遍歴と呼ばれる物理現象を用いることで，従来法よりも高効率に探索が行なえることを初めて発見した。

この研究で提案した方式は実験的に実装できるため，今後専用デバイスを開発することで，効率的で高速な強化学習用ハードウェアを実現できる可能性を秘めているという。

またこの研究の結果は，レーザーのみならず，脳のダイナミクスとして知られているカオス的遍歴を強化学習に利用できることを示唆しており，研究グループは，自立的に意思決定するAI技術の実現が期待されるとしている。