物理演算のミニ四駆をAIに学習させてみた

物理演算のミニ四駆をAIに学習させてみた

ノートパソコンの限界YouTube版: https://youtu.be/W5mnQhssF8E 補足<Mini053の報酬量について>・途中でコースアウトした場合助走中は、チェックポイントを通過する度に1ポイント、助走が終わったら、チェックポイントを通過する度に2ポイントを報酬量に追加します。また、チェックポイントを通過する度に、前のチェックポイントを通過してから経過した時間によって変化する報酬も追加します。この報酬の量は、まずは速さよりも走行距離を優先したいので少なめにしています。3週目のLCでコースアウトした場合、だいたい80ポイント程度になります。・完走した場合完走できたら、上で説明した報酬を一度リセットし、100ポイント+JCJCを3週したタイムで変化する報酬を与えています。6秒程度で完走したら、だいたい180ポイント程度になります。プログラム風に書くとこんな感じですif (チェックポイントを通過){    if(助走中?){        報酬 += 1    }else{        報酬 += 2    }    報酬 += 時間で変化する少量の報酬}if (完走した){    報酬 = 100    報酬 += 3周のタイムで変化する報酬}<GPUについて> タスクマネージャーが写るシーンで、CPUの使用率は常に100%ですがGPUの使用率はあまり高くない理由です。 AIの学習にはGPUを使っているのですが、UnityがPhysXのGPUアクセラレーションに対応していないため物理演算の処理はCPUを使っています。<3Dモデル>オーバルホームサーキット・td86890・td86893(分離)JCJC・td86129・td86892(分離)<BGM>OtoLogic様,魔王魂様,Uppbeat様,ニコニコモンズ(コンテンツツリーに登録)

http://www.nicovideo.jp/watch/sm43603785