タグ 強化学習 が登録されている動画 : 47 件中 1 - 32 件目
種類:
- タグ
- キーワード
対象:
全力で人工知能に対決を挑んでみた
人工知能 vs. 人間(私)シリーズ第3戦です。
今回はDeep Q-Network(DQN)で人工知能を作成して、対決を挑みました。
全力で人工知能に対決を挑んでみた(理論編)→sm30440714
お借りしたBGM:nm3883751, so28534305
mylist :mylist/52497526
twitter:https://twitter.com/__yoshi__1991
全力で人工知能に対決を挑んでみた(理論編)
「全力で人工知能に対決を挑んでみた」(sm30440449)の理論解説編です。
今回はDeep Q-Network(DQN)に挑戦してみました。
「なるほど、わからん」コメが書かれないように頑張るつもりだったんですが、
丁寧に説明しようとし過ぎて、逆にわかりずらくなってしまったかもしれません。(´・ω・`)
温かい目で見ていただけると助かります。
プログラムの使用言語はC++です。
お借りしたBGM:nm3883751
mylist :mylist/52497526
twitter:https://twitter.com/__yoshi__1991
スーパーマリオブラザーズを学習させてみた(2-1)
今回は強化学習を使ってAIにマリオを学習させてみました。
前回:sm18721450
投稿リスト:mylist/34778666
YouTube版:https://youtu.be/qUjslOnP2jY
Twitter:https://twitter.com/kV4kDOxijDHZa5K
物理演算のミニ四駆をAIに学習させてみた
ノートパソコンの限界
YouTube版:https://youtu.be/W5mnQhssF8E
補足
<Mini053の報酬量について>
・途中でコースアウトした場合
助走中は、チェックポイントを通過する度に1ポイント、助走が終わったら、チェックポイントを通過する度に2ポイントを報酬量に追加します。また、チェックポイントを通過する度に、前のチェックポイントを通過してから経過した時間によって変化する報酬も追加します。この報酬の量は、まずは速さよりも走行距離を優先したいので少なめにしています。
3週目のLCでコースアウトした場合、だいたい80ポイント程度になります。
・完走した場合
完走できたら、上で説明した報酬を一度リセットし、100ポイント+JCJCを3週したタイムで変化する報酬を与えています。
6秒程度で完走したら、だいたい180ポイント程度になります。
プログラム風に書くとこんな感じです
if (チェックポイントを通過){
if(助走中?){
報酬 += 1
}else{
報酬 += 2
}
報酬 += 時間で変化する少量の報酬
}
if (完走した){
報酬 = 100
報酬 += 3周のタイムで変化する報酬
}
<GPUについて>
タスクマネージャーが写るシーンで、CPUの使用率は常に100%ですがGPUの使用率はあまり高くない理由です。
AIの学習にはGPUを使っているのですが、UnityがPhysXのGPUアクセラレーションに対応していないため物理演算の処理はCPUを使っています。
<3Dモデル>
オーバルホームサーキット
・td86890
・td86893(分離)
JCJC
・td86129
・td86892(分離)
<BGM>
OtoLogic様,魔王魂様,Uppbeat様,ニコニコモンズ(コンテンツツリーに登録)
RPGとかでたまにある簡易パズルを解くAI
バスケットボールを学習させるAIでてこずってしまい、全然更新できず申し訳ありませんでした。因みにうちのAIはバスケットボールは学習できませんでした。
今回もかなりてこずったのですが、250万STEPで急激に学習してくれたときは興奮しました。
提供ありがとうございました。感動しました。
unity ml-agents オリジナル学習環境の強化学習AIのトレーニング Ball original 01
報酬を得るためボールが緑色のターゲットを取得し続ける行動を学習します。
ボールが緑色のターゲットにたどり着くと報酬が与えられ、ターゲット位置がランダムでリセットされます。
一定時間ボールにたどり着けないとマイナス報酬でボール位置も原点にリセットです。
原点から一定距離離れると離れている間マイナス報酬がかかります。ボールが赤くなります。
【強化学習】スーパーマリオブラザーズ1-2面をAIに学習させたら凄すぎた【人工知能】
YouTube版
https://www.youtube.com/watch?v=I556uKQNmeE
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【ML-Agents】分身でニンジャロードに挑む猫【強化学習】
今回は動く城のフィオさんに使用許可をいただいたので、ニンジャロードをAIで解いていきたいと思います。
キョンシーズ2 の超強いラスボスを、めんどくさいのでAIにやらせてみる
1987年に発売されたファミコンソフト、幽幻道士の続編キョンシーズ2
レトロゲームよくある難易度の高いゲームでした
攻略本に、ラスボスは強いのでちぼしんのごふが無いと無理と書いてあったような気がします。
そんなボスをAIにやらせてみます
まほうのけんだったかも
間違っていたらごめんなさい
声はCevio AI さとうささら、夏色花梨を使用しております
なぜ、本物の人工知能は作れないのか?
人間のような人工知能は作れない?
▶︎chapter
00:00 1.人工知能とは
01:20 2.プログラム設計手順
02:14 3.人間の思考手順
02:49 4.人間の記憶単位
03:41 5.人間の行動条件
05:19 6.人間の社会性
06:13 7.おわり
背景:Tda式初音ミク・アペンドVer1.10
素材:いらすとや
https://www.irasutoya.com/
BGM:ワスレナグサ
https://www.youtube.com/watch?v=NHfopv9no38
RPGアツマールのゲームプレイを学習するシステム「マールタス」仕組みを解説してみた
Dwango Media Villageが開発したRPGアツマールのゲームプレイ方法を自動的に学習するシステム「マールタス」の紹介です。
マールタスはDeep Q-Learning(Q学習)と呼ばれる機械学習の手法を用いて、人がルールを教えなくても自らゲームを何度もプレイしながら上達します。
今回はすりっぱさんの「1分剣闘士」を学習する様子を観察してみました。
後日、学習のコア部分であるDeep Q-Learningの分散学習実装を公開する予定です!
マールタスの詳しい情報はこちらから
今回題材にしたゲーム: 「1分剣闘士」by すりっぱさん:
BGM: NEW ROMANTIC BOYさん https://commons.nicovideo.jp/material/nc161060
【検証】パンチしか使えない選手とキックしか使えない選手、どっちが強い?【強化学習】
ついこの前までゴールデンウィークだったと思うんですが、もう5月も中盤ですね。そもそも家にいる時間が長いのでいまだに休みボケしてる気がします。
メリハリのある生活を目指して頑張ります。明日から。
twitter
https://twitter.com/Engine_Kazumi
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
センター試験のぶどう君を人工知能に歩かせたら衝撃的に可愛くてワロタwww
youtubeから
https://www.youtube.com/watch?v=IOv49ODd6cw
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
unity ml-agents ボール2つとターゲット1つ オリジナル学習環境の強化学習AIのトレーニング Ball original 02
報酬を得るためボールが緑色のターゲットを取得し続ける行動を学習します。
ボールが緑色のターゲットにたどり着くと報酬が与えられ、ターゲット位置がランダムでリセットされます。
一定時間ボールにたどり着けないとマイナス報酬でボール位置も原点にリセットです。
原点から一定距離離れると離れている間マイナス報酬がかかります。ボールが赤くなります
前回に加えて、同じ行動パターンを持ったボールをもう一つ加えます。
前回→sm38055183
【自動運転】もし行き止まりの道に当たったらAIはUターンを学習できるの?【強化学習】
続きの動画は割とすぐ出るかも?
あとうちのwifiルーターが15年前の化石のようなルーターだったので、最新のやつに交換したんですが、結局全然速くなりませんでしたチクショー
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【自動運転】AIは人がいたら避けるように学習できるのか【強化学習】
二日連続で動画投稿とかかずみにとって快挙過ぎて、もう現世の徳積み終わったわ
私カレーが好きなんですが、カレーを片付けるのが嫌いなんですよね。カレーの鍋とか皿とかを洗うと、スポンジがマッキッキになるじゃないですか。今は割とキッチンペーパーで一回吹いてからスポンジ使って洗うんですが、それでもマッキッキになるんですよね。だからカレーは諸刃の剣なんだよな。
カレー屋さんとかどうしてるのか気になります。なんかいい洗剤あるんですか?
【逃げ側が天才】AI同士の鬼ごっこでワープギミックを追加したら
【YouTube】
https://www.youtube.com/kojpko
【公式LINE】
物理エンジンこーじ:https://lin.ee/GG4tG0n
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
強化学習によりアイテムをそっと差し出してくれるNPCを作ってみた
卒業研究として,マインクラフトに強化学習によりアイテムをそっと差し出してくれる味方Mobを作ってみました.
もともと先輩の研究(sm25829442)で強化学習を搭載して敵を攻撃してくれる味方Mobはあったのですが,今度は攻撃ではなくて必要なアイテムをそっと差し出してくれるようにしました.
ですが,強化学習における学習空間の爆発問題から差し出してくれるアイテムを限定しなければうまく動きませんでした.
アイテムの数を増やすためには,今後タイルコーティングなどを導入しないといけないです.
その他の卒業研究はこちら mylist/42793749
【自動運転】もし信号も交通ルールもなかったらAIはどう運転するの?【強化学習】
参考
Unity ML-Agents 実践ゲームプログラミング
なんか最近めちゃくちゃ回線の速度が遅くて、下りが昨日測ったら2Mbpsでした。ていうか普段でも20Mbpsなんですけど、光回線でこの速度って遅いらしいですね。よくWi-Fiの新規契約のおじさんが来るのもそういう理由なんでしょうか?月一くらいで来ます。大体手ぶらorファイル一つだけだったら大体Wi-Fiおじさんです。シャカシャカしてるジャンパー来てたら確率は90パーセントくらいまで上がります。
Wi-Fiおじさんは結論から言わずに長い話をダラダラして、結局何を言いたいのかわからないまま帰っていきます。きっと玄関あけてお話してくれるだけでもうれしいのかなって勝手に思いながら、いつも契約はせずにバイバイしてます。また来月も来るんだろうな。
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【自作ゲーム】強くなった人工知能にボコボコにされました【物理エンジン】
youtubeから
https://www.youtube.com/watch?v=o2pS4mc2dMQ
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【物理エンジン】もし人工知能にバッティングさせたらどんなスイングになるの?【強化学習】
これはunityの強化学習のツールを使って作っているんですが、報酬の与え方やAgent(学習するもの)にに与える情報の量や選択がとても難しい。公式の出しているサンプルだと順調に学習が進んでいくので、やっぱり洗練されてるなあと思います。
今年は強化学習の動画を出していく方針で行きたいですね。ぱぁ。
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【物理エンジン】強化学習で2足歩行を学習したら奇行種ができた
youtubeから
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【物理エンジン】自作ゲームでAIと勝負したけど大したことなかったわぁ
youtubeから
https://www.youtube.com/watch?v=lhW66m-J8zE
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
マインクラフトの強化学習搭載執事を改良してみた.
卒業研究でマインクラフトに強化学習を搭載した味方Mobを作ってみました.
もともと先輩の研究(sm23221457)で強化学習搭載執事はあったのですが,全部の執事が同じ敵を攻撃してしまっていたので,分散攻撃できるように改良しました.
その他の卒業研究はこちら mylist/42793749
4足歩行をAIに学習させてみた
100万回の学習後、そこには元気に走り回るAIの姿が!
環境:Unity ML-agents
アルゴリズム:強化学習(PPO)
投稿リスト:mylist/34778666
Youtube版:https://youtu.be/IJmdiA0hka8
Twitter:https://twitter.com/kV4kDOxijDHZa5K
ゴールキーパーAI
サッカーのゴールキーパーをAIに学習させました。シュートはプログラムによりランダムでゴールを狙いますが、プログラム同士でズルい事をしかねないので学習終了後に手動でもシュートを打ちました。
【VOICEROID劇場】紲星あかり・結月ゆかりの誕生祝い【A.I.VOICE】
誕生祝いには少し早いですが、あかりちゃん、ゆかりさん、おめでとう!
来月1日は紲星あかり及び結月ゆかりの誕生を祝う日である.そのため,誕生日当日の動画を作成した.紲星あかり及び結月ゆかりの魅力を伝えることができれば幸いである.紲星あかり及び結月ゆかり両名のさらなる活躍を願う.
動画内の行動a1~a3選択の数式の訂正
誤:V(s)= Σ[V(s’) + r] = 数値
正:V(s)= Σ[確率 × {V(s’) + r}] = 数値
AIが描いた絵を3DにしてAIに歩かせた【物理エンジン】
【YouTube】
https://www.youtube.com/kojpko
【公式LINE】
物理エンジンこーじ:https://lin.ee/GG4tG0n
X:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
(補助動画1)スマートフォンで人工生命数十体がリアルタイムに学習可能な深層強化学習技術
デモビデオ so33629687 の補助動画です。
様々な身体形状を人工生命に与えると、それぞれの身体に応じた動かし方を獲得していきます。
研究の詳細はこちらをご覧ください https://dmv.nico/ja/casestudy/rlcreature/