言語規則構造における説明AI
❏ 学習済み深層強化学習モデルの内部挙動を模したファジィ制御器構築への取り組み
概要
深層学習によって獲得されたモデルはブラックボックス化されており、その振る舞いを捉えることができない。本研究では、学習済み深層強化学習モデルの入出力関係から、その振る舞いをファジィ制御器を作成し、そのファジィルールを言語化することで深層強化学習モデルを言葉を通じて理解できるようにする。ファジィ制御器を構築する方針としては、入出力規則の前件部の空間をファジィ変数で分割し、それに合わせて後件部の値を決定する方法と、後件部の値を基準として、前件部の値をクラスタリングすることにより入力空間を分割したものを変数の値として前件部を構築する方法の二つがある。本研究では、その両方を試みることにより、双方における問題点を検討する。具体的な実験として、cart poleを題材にし、Deep Q-Networkにより学習されたモデルから言語規則による制御規則を構築し、その制御規則をもってcart poleを制御することを試みる。
研究スライド
enta-01
enta-02
enta-03
enta-04
enta-05
enta-06
enta-07
enta-08
enta-09
enta-10
enta-11
enta-12
enta-13
enta-14
enta-15
enta-16
enta-17
enta-18
enta-19
enta-20
enta-21
enta-22
enta-23
enta-24
previous arrow
next arrow
圓田 彩乃(Ayano Enta)
圓田 彩乃,小林 一郎「学習済み深層強化学習モデルの内部挙動を模したファジィ制御器構築への取り組み」人工知能学会全国大会(第36回),国立京都国際会館,京都,2022年6月.