unity　ml-agents ボール2つとターゲット1つ　オリジナル学習環境の強化学習AIのトレーニング　Ball original 02

2021/01/23 13:33:02 投稿
再生数：57
マイリスト数：0

報酬を得るためボールが緑色のターゲットを取得し続ける行動を学習します。ボールが緑色のターゲットにたどり着くと報酬が与えられ、ターゲット位置がランダムでリセットされます。一定時間ボールにたどり着けないとマイナス報酬でボール位置も原点にリセットです。原点から一定距離離れると離れている間マイナス報酬がかかります。ボールが赤くなります前回に加えて、同じ行動パターンを持ったボールをもう一つ加えます。前回→ sm38055183

http://www.nicovideo.jp/watch/sm38161545

unity 百
AI 百
強化学習百
ML-Agents 百

unity ml-agents ボール2つとターゲット1つ オリジナル学習環境の強化学習AIのトレーニング Ball original 02

unity　ml-agents ボール2つとターゲット1つ　オリジナル学習環境の強化学習AIのトレーニング　Ball original 02