タグ 強化学習 が登録されている動画 : 47 件中 1 - 32 件目
種類:
- タグ
- キーワード
対象:
マインクラフトに強化学習搭載の執事Mobを作ってみた.
卒業研究でマインクラフトに強化学習を搭載した味方Mobを作ってみました.
プレイヤーの周囲の状況に応じて,どの敵を攻撃するかを学習しています.
動画の作り方については慣れてないので,イケてない点についてはご容赦を.
その他の卒業研究はこちら mylist/42793749
マインクラフトの強化学習搭載執事を改良してみた.
卒業研究でマインクラフトに強化学習を搭載した味方Mobを作ってみました.
もともと先輩の研究(sm23221457)で強化学習搭載執事はあったのですが,全部の執事が同じ敵を攻撃してしまっていたので,分散攻撃できるように改良しました.
その他の卒業研究はこちら mylist/42793749
強化学習によりアイテムをそっと差し出してくれるNPCを作ってみた
卒業研究として,マインクラフトに強化学習によりアイテムをそっと差し出してくれる味方Mobを作ってみました.
もともと先輩の研究(sm25829442)で強化学習を搭載して敵を攻撃してくれる味方Mobはあったのですが,今度は攻撃ではなくて必要なアイテムをそっと差し出してくれるようにしました.
ですが,強化学習における学習空間の爆発問題から差し出してくれるアイテムを限定しなければうまく動きませんでした.
アイテムの数を増やすためには,今後タイルコーティングなどを導入しないといけないです.
その他の卒業研究はこちら mylist/42793749
全力で人工知能に対決を挑んでみた
人工知能 vs. 人間(私)シリーズ第3戦です。
今回はDeep Q-Network(DQN)で人工知能を作成して、対決を挑みました。
全力で人工知能に対決を挑んでみた(理論編)→sm30440714
お借りしたBGM:nm3883751, so28534305
mylist :mylist/52497526
twitter:https://twitter.com/__yoshi__1991
全力で人工知能に対決を挑んでみた(理論編)
「全力で人工知能に対決を挑んでみた」(sm30440449)の理論解説編です。
今回はDeep Q-Network(DQN)に挑戦してみました。
「なるほど、わからん」コメが書かれないように頑張るつもりだったんですが、
丁寧に説明しようとし過ぎて、逆にわかりずらくなってしまったかもしれません。(´・ω・`)
温かい目で見ていただけると助かります。
プログラムの使用言語はC++です。
お借りしたBGM:nm3883751
mylist :mylist/52497526
twitter:https://twitter.com/__yoshi__1991
【物理エンジン】自作ゲームでAIと勝負したら強すぎた
強化学習 PPO
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【物理エンジン】強化学習で2足歩行を学習したら奇行種ができた
youtubeから
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
(補助動画2)スマートフォンで人工生命数十体がリアルタイムに学習可能な深層強化学習技術
デモビデオ so33629687 の補助動画です。
強化学習部(Decision-Maker)の実験として、フードの獲得量を最大化するようにエージェントを学習させたものです。
学習したエージェント(青)は,高くて届かないフード(赤)は無視して地面にあるフード(緑)を効率的に取るように行動計画を決めます。
学習しないでルール通りにフードに向かって進むエージェント(黄)は,高くて届かないフード(赤)にトラップされて動けなくなります。
研究の詳細はこちらをご覧ください https://dmv.nico/ja/casestudy/rlcreature/
(補助動画1)スマートフォンで人工生命数十体がリアルタイムに学習可能な深層強化学習技術
デモビデオ so33629687 の補助動画です。
様々な身体形状を人工生命に与えると、それぞれの身体に応じた動かし方を獲得していきます。
研究の詳細はこちらをご覧ください https://dmv.nico/ja/casestudy/rlcreature/
スマートフォンで人工生命数十体がリアルタイムに学習可能な深層強化学習
SIGGRAPH 2018 Studio で発表する論文 “Real-Time Motion Generation for Imaginary Creatures Using Hierarchical Reinforcement Learning” のデモビデオです。
強力な計算機を使わず、スマートフォン上でも、様々な身体形状をもつ数十体の人工生命が、最適な動き方と行動の計画をリアルタイムに学習して実行することができる手法を提案します。
また、このアルゴリズムを誰もがUnity上で利用できるように、オープンソース化し、手元で実行可能なデモアプリケーションを公開しています。
SIGGRAPHの会場では、さらに来場者が複数の生命を配合して新たな身体形状の生命を誕生させ、多様性が広がっていくデモンストレーションを行います。
研究の詳細や、手元で実行可能なデモはこちらをご覧ください
https://dmv.nico/ja/casestudy/rlcreature/
論文はこちら https://dmv.nico/assets/img/casestudy/rlcreature/siggraph2018_rlcreature.pdf
Unity向けOSSはこちら https://github.com/dwango/RLCreature
【AI】Unity ML-Agents(深層強化学習ライブラリ)を使ったカーレース学習
ML-Agentsでカーレース学習テストです。左直線通過時のクセがすごい
学習するたびにいろんなクセで個性が出ます。全てはAIの判断です
ゴールキーパーAI
サッカーのゴールキーパーをAIに学習させました。シュートはプログラムによりランダムでゴールを狙いますが、プログラム同士でズルい事をしかねないので学習終了後に手動でもシュートを打ちました。
RPGとかでたまにある簡易パズルを解くAI
バスケットボールを学習させるAIでてこずってしまい、全然更新できず申し訳ありませんでした。因みにうちのAIはバスケットボールは学習できませんでした。
今回もかなりてこずったのですが、250万STEPで急激に学習してくれたときは興奮しました。
提供ありがとうございました。感動しました。
センター試験のぶどう君を人工知能に歩かせたら衝撃的に可愛くてワロタwww
youtubeから
https://www.youtube.com/watch?v=IOv49ODd6cw
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【ML-Agents】分身でニンジャロードに挑む猫【強化学習】
今回は動く城のフィオさんに使用許可をいただいたので、ニンジャロードをAIで解いていきたいと思います。
【物理エンジン】自作ゲームでAIと勝負したけど大したことなかったわぁ
youtubeから
https://www.youtube.com/watch?v=lhW66m-J8zE
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【自作ゲーム】強くなった人工知能にボコボコにされました【物理エンジン】
youtubeから
https://www.youtube.com/watch?v=o2pS4mc2dMQ
Twitter:https://twitter.com/PhysicsKJ
Twitter ID:@PhysicsKJ
使用ソフト
・Unity(メイン)
・Blender(アニメーション、骨格作成)
・Sculptris(3Dモデリング)
・Tinkercad(3Dモデリング)
・Mixamo(アニメーション)
使用させて頂いた音源
MusMus:http://musmus.main.jp/
Music is VFR:http://musicisvfr.com/
フリー効果音 On-Jin ~音人~:http://on-jin.com
【物理エンジン】もし人工知能にバッティングさせたらどんなスイングになるの?【強化学習】
これはunityの強化学習のツールを使って作っているんですが、報酬の与え方やAgent(学習するもの)にに与える情報の量や選択がとても難しい。公式の出しているサンプルだと順調に学習が進んでいくので、やっぱり洗練されてるなあと思います。
今年は強化学習の動画を出していく方針で行きたいですね。ぱぁ。
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【強化学習】人工知能にチョコを届けてもらおう【バレンタイン】
今回はバレンタインあるあるということで、自分でチョコを渡しに行きたくないから代わりにAIを強化学習してチョコを渡しに行ってもらいました。
なんかふわっとした内容になってますがよろしくお願いします。
【自動運転】もし信号も交通ルールもなかったらAIはどう運転するの?【強化学習】
参考
Unity ML-Agents 実践ゲームプログラミング
なんか最近めちゃくちゃ回線の速度が遅くて、下りが昨日測ったら2Mbpsでした。ていうか普段でも20Mbpsなんですけど、光回線でこの速度って遅いらしいですね。よくWi-Fiの新規契約のおじさんが来るのもそういう理由なんでしょうか?月一くらいで来ます。大体手ぶらorファイル一つだけだったら大体Wi-Fiおじさんです。シャカシャカしてるジャンパー来てたら確率は90パーセントくらいまで上がります。
Wi-Fiおじさんは結論から言わずに長い話をダラダラして、結局何を言いたいのかわからないまま帰っていきます。きっと玄関あけてお話してくれるだけでもうれしいのかなって勝手に思いながら、いつも契約はせずにバイバイしてます。また来月も来るんだろうな。
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【自動運転】もし行き止まりの道に当たったらAIはUターンを学習できるの?【強化学習】
続きの動画は割とすぐ出るかも?
あとうちのwifiルーターが15年前の化石のようなルーターだったので、最新のやつに交換したんですが、結局全然速くなりませんでしたチクショー
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【自動運転】AIは人がいたら避けるように学習できるのか【強化学習】
二日連続で動画投稿とかかずみにとって快挙過ぎて、もう現世の徳積み終わったわ
私カレーが好きなんですが、カレーを片付けるのが嫌いなんですよね。カレーの鍋とか皿とかを洗うと、スポンジがマッキッキになるじゃないですか。今は割とキッチンペーパーで一回吹いてからスポンジ使って洗うんですが、それでもマッキッキになるんですよね。だからカレーは諸刃の剣なんだよな。
カレー屋さんとかどうしてるのか気になります。なんかいい洗剤あるんですか?
【強化学習】格闘技を学んだAIは素人をボコボコに出来るのか【喧嘩AI】
久しぶりの動画です。前回から一か月くらい空いていました。
最近はよく他のvtuberさんの配信を見てることが多くて無限に時間が消えていきます。一般vtuberオタクと化している…
あとは液タブの商品レビューをめっちゃ見てます。かずみは絵を描く習慣とかはなくて、せいぜいモデルを作る時に下絵を描いたりテクスチャを塗るくらい(そもそもモデルも最近はあんまり作ってない)なのですが、めちゃくちゃほしくなってきました。
最近は安いやつなら2~4万くらいで買えるらしいので、割と買えないことはないのかなと思ったり…。でも衝動買いはやっぱりよくないので、もし一か月後も欲しかったら買おうかなと今のところ考えています。
実は3Dプリンターを衝動買いしてしまったのですが、2,3個モノを作って全然使わなくなってしまった…本当にもったいない。いつか動画のネタにしたいと思ってます。
以上最近のエンジンかずみでした。またね。
twitter
https://twitter.com/Engine_Kazumi
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
4足歩行をAIに学習させてみた
100万回の学習後、そこには元気に走り回るAIの姿が!
環境:Unity ML-agents
アルゴリズム:強化学習(PPO)
投稿リスト:mylist/34778666
Youtube版:https://youtu.be/IJmdiA0hka8
Twitter:https://twitter.com/kV4kDOxijDHZa5K
【検証】パンチしか使えない選手とキックしか使えない選手、どっちが強い?【強化学習】
ついこの前までゴールデンウィークだったと思うんですが、もう5月も中盤ですね。そもそも家にいる時間が長いのでいまだに休みボケしてる気がします。
メリハリのある生活を目指して頑張ります。明日から。
twitter
https://twitter.com/Engine_Kazumi
使用音源様
フリーBGM DOVA-SYNDROME 様 https://dova-s.jp/
On-Jin~音人~様 https://on-jin.com/
効果音ラボ様 https://soundeffect-lab.info/
らくとあいす様(Twitter:rakuraku_vtube)よりED曲「おつかずみ」
【Unity,ML-Agents】簡単な設定方法と学習方法
音楽、Music:魔王魂
https://maoudamashii.jokersounds.com/
BGM:bgm_maoudamashii_8bit17.mp3:のどかなみどり (魔王魂)
https://maoudamashii.jokersounds.com/archives/bgm_maoudamashii_8bit17.html
Blog
https://akasatanahama.com/
Twitter
https://twitter.com/fullNam35087976/
Github
https://github.com/shaieaokamodkijiadjfoa/
RPGアツマールのゲームプレイを学習するシステム「マールタス」仕組みを解説してみた
Dwango Media Villageが開発したRPGアツマールのゲームプレイ方法を自動的に学習するシステム「マールタス」の紹介です。
マールタスはDeep Q-Learning(Q学習)と呼ばれる機械学習の手法を用いて、人がルールを教えなくても自らゲームを何度もプレイしながら上達します。
今回はすりっぱさんの「1分剣闘士」を学習する様子を観察してみました。
後日、学習のコア部分であるDeep Q-Learningの分散学習実装を公開する予定です!
マールタスの詳しい情報はこちらから
今回題材にしたゲーム: 「1分剣闘士」by すりっぱさん:
BGM: NEW ROMANTIC BOYさん https://commons.nicovideo.jp/material/nc161060
unity ml-agents オリジナル学習環境の強化学習AIのトレーニング、上手くいかんな―…
オレンジ色の箱を取得し続ける(ようにしたい)
セフィロスに歩き方を学習させてみた【機械学習】【セフィロスファン激怒】
セフィロスファンの方すいません
お借りしました→sm31373741
unity ml-agents オリジナル学習環境の強化学習AIのトレーニング Ball original 01
報酬を得るためボールが緑色のターゲットを取得し続ける行動を学習します。
ボールが緑色のターゲットにたどり着くと報酬が与えられ、ターゲット位置がランダムでリセットされます。
一定時間ボールにたどり着けないとマイナス報酬でボール位置も原点にリセットです。
原点から一定距離離れると離れている間マイナス報酬がかかります。ボールが赤くなります。
[日本語字幕]深層強化学習AIの人間を凌駕するパフォーマンス in グランツーリスモSPORT
YouTubeより。チューリッヒ大学とソニー・ヨーロッパが共同で行った深層強化学習AIの研究です。
研究にはPS4用ゲームソフト、グランツーリスモSPORTが使用されました。
日本語字幕をつけてみましたが、間違っていましたら申し訳ございません…
研究の全容はこちらのPDFに記述されています。(英語)
https://arxiv.org/pdf/2008.07971.pdf
Original Video: https://www.youtube.com/watch?v=Zeyv1bN9v4A
グランツーリスモ・マイリスト: mylist/58252901