タグ BertVITS2 が登録されている動画 : 2 件中 1 - 2 件目
種類:
- タグ
- キーワード
対象:
猫声生成AIによる文章読ミャーげ【Style-Bert-VITS2】
Style-Bert-VITS2に猫の鳴き声を学習させた、多言語対応のテキスト読み上げモデル試作品。無料DLできます→sm44356797
素人なりに説明すると「猫声モデル」と「専用喋り方モデル」を作ってマージした感じで、実は10年以上前に猫音声を買い漁って人力で試作してました。"猫らしさ-人らしさ"を調整可能で、当然ながら人語の喋り声よりは猫語の鳴き声を出力させた方が自然です。
想定通りの挙動を求めて学習元音声を作り続けていたら、猫以外の追加学習音声が全部自作でもそれなりに動くモデルになりました。結果的に「人間の音声」「生成AI音声」「テキスト読み上げソフト音声」などの人間要素が追加学習音声から無くなりましたが、Style-Bert-VITS2のパワーで喋ります。
※原文ママの入力では漢字誤読など発音の問題が出るほか動画編集上の都合もあり、テキスト入力欄は別撮りとなります。猫の顔差分は(恐れ多くも)自分で手作りしました。
感情表現も多言語もできる最新音声AI「Bert-VITS2」の導入方法~使い方【2023.12月版】
中国コミュニティで生まれたらしい最新音声合成技術「Bert-VITS2」の導入方法などを解説します。AIが文章を理解して感情表現を行い、さらに音声の機械学習やクロスリンガル(日本語音源→英語で生成)まで可能というゲームチェンジャー級の性能です。
※ 以前に投稿した「RVC」のレビュー動画は現在の私の考え方とは違った観点で解説していたため動画を削除しました。詳しくはYouTubeコミュニティに書きました。
https://www.youtube.com/channel/UCWiED1Kp1MM532_p7QbhW_g/community
▼EasyBertVits2(Zuntan様)
https://github.com/Zuntan03/EasyBertVits2
▼音声モデル(litagin様)
※ 動画内では「K」の音声を一部使用してます
■サンプル音声
https://huggingface.co/litagin/bert_vits2_okiba/blob/main/examples.md
■ファイル
https://huggingface.co/litagin/bert_vits2_okiba/tree/main/ver2.1
▼Bert-Vits2
https://github.com/fishaudio/Bert-VITS2
▼fish-speech
https://github.com/fishaudio/fish-speech
▼Twitter
https://twitter.com/YuuPro_2022
▼BGM
■DOVA-SYNDROME 様:https://dova-s.jp/
■ポケットサウンド 様:https://pocket-se.info/
