埼玉大ら,レーザーのカオス的遍歴で強化学習を実証

埼玉大学,金沢大学,東京大学は,マルチモード半導体レーザーにおける縦モード間のカオス的遍歴を用いて,機械学習方式の一つである強化学習における問題例の解決方法を提案し,実験での実証に成功した(ニュースリリース)。

近年,ムーアの法則を打破する情報処理方式を提供するために,光を活用した機械学習に注目が集まっている。その一つとして,強化学習の問題例として知られる,当たり確率が未知の複数台のスロットマシン(選択肢)からの報酬の最大化を目的とした多腕バンディット問題を,光ダイナミクスを活用して解くという研究が行なわれてきた。しかしながら既存研究では,選択肢の数が多い場合に性能が大幅に劣化するという課題があった。

研究では,複数の縦モードを有するマルチモード半導体レーザーにおけるカオス的遍歴現象を利用して,多腕バンディット問題を解く方式を新たに提案した。

カオス的遍歴は脳の自発的機能において重要な役割を担う現象として知られており,この方式に取り入れることで,既存研究で問題となった選択肢が多い場合にも対応でき,従来用いられるソフトウェアのアルゴリズムよりも高効率に意思決定が実現できることを示した。

すなわち,光のカオス的遍歴を利用することで,どんなに選択肢が多くても,既存アルゴリズムよりも少ない試行で,自発的に正しい選択肢を推定できるという。そして,この手法の有効性に関して半導体レーザーを用いた実験で検証し,レーザーにおけるカオス的遍歴を用いて強化学習が実現できることを世界で初めて実証した。

この研究の新規性は,レーザー光のカオス的遍歴を用いて,強化学習の代表的な問題である多腕バンディット問題を解いた点になる。従来はコンピュータ内でソフトウェア的に解く方法が主流だったが,多腕バンディット問題を効率的に解くための光ハードウェアを開発した点に新規性があるとする。

またカオス的遍歴とは,異なる複数のカオス状態間を遷移する現象だが,多腕バンディット問題における探索(当たり確率の高いスロットマシンを見つけること)を行なう際に,カオス的遍歴と呼ばれる物理現象を用いることで,従来法よりも高効率に探索が行なえることを初めて発見した。

この研究で提案した方式は実験的に実装できるため,今後専用デバイスを開発することで,効率的で高速な強化学習用ハードウェアを実現できる可能性を秘めているという。

またこの研究の結果は,レーザーのみならず,脳のダイナミクスとして知られているカオス的遍歴を強化学習に利用できることを示唆しており,研究グループは,自立的に意思決定するAI技術の実現が期待されるとしている。

その他関連ニュース

  • 東大ら,新アルゴリズムで光NNを高速深層学習 2023年01月11日
  • JAIST,ディープラーニングでX線ピークを定量化 2022年12月23日
  • 東工大,機械学習で高分子コーティング膜効率設計 2022年08月22日
  • 日本病理学会ら,胃生検の病理診断支援AIを開発 2022年08月18日
  • 慶大ら,スマホの持ち方をフロントカメラで推定 2022年04月28日
  • 東北大,機械学習でデータ書き込み電力を1/100に 2022年03月25日
  • 東大ら,網膜層厚から緑内障視野を予測 2021年08月18日
  • 理研ら,機械学習により「量子スピン液体」を解明 2021年08月18日