効率的かつ柔軟に行動することは、生物学的および人工的な具現化エージェントにとって極めて重要である。行動は一般的に、習慣的なもの(速いが柔軟性に欠ける)と、目標指向的なもの(柔軟性はあるが遅い)の2種類に分類される。この2つのタイプの行動は、一般的に脳内の2つの異なるシステムによって管理されていると考えられているが、最近の研究では、これらのシステム間のより高度な相互作用が明らかにされつつある。この度発表された研究では、ベイズ的意図変数を組み込んだ変分ベイズ理論を用いた理論的枠組みが導入されている。習慣的行動は、目標を特定することなく感覚的文脈から計算される意図の事前分布に依存する。これとは対照的に、目標指向行動は、変分自由エネルギー最小化によって推定される、目標条件付きの意図の事後分布に依存する。エージェントが相乗的な意図を使用して行動すると仮定して、視覚ベースの感覚運動タスクにおけるシミュレーションを行うと、過去の実験で観察された相互作用の主要な特性を説明するものとなった。この研究は、習慣と目標の神経メカニズムに関する新たな視点を提案し、意思決定における将来の研究に光を当てるものである。
習慣行動と目標指向行動の関係を理解することは、ADHDや強迫性障害、パーキンソン病などの神経疾患の解明につながるため、特に神経科学の分野において重要な意味を持つ。脳に発想を得て開発され現実的な問題を解けることが示されたAIシステムは、人や動物の脳の中で何が起こっているのかを知る上で重要なツールとなり得るという。
プレスリリース
単純さか適応性か ― 強化学習で習慣行動と目標指向行動のバランスを理解する | 沖縄科学技術大学院大学(OIST)