猫声生成AIによる文章読ミャーげ【Style-Bert-VITS2】

猫声生成AIによる文章読ミャーげ【Style-Bert-VITS2】

Style-Bert-VITS2に猫の鳴き声を学習させた、多言語対応の文章読み上げモデル試作品。素人なりに説明すると「猫言語モデル」と「専用喋り方モデル」を作ってマージした感じで、実は10年以上前に猫音声を買い漁って人力で試作してました。"猫らしさ-人らしさ"を調整可能で、当然ながら人言語の喋り声よりは猫言語の鳴き声を出力させた方が自然です。想定通りの挙動を求めて学習元音声を作り続けていたら、猫以外の音声が全部自作でもそれなりに動くモデルになりました。結果的に「人間の肉声」「生成AI音声」「文章読み上げソフト音声」などの人間要素が学習元音声から無くなりましたが、Style-Bert-VITS2のパワーで喋ります。※原文ママの入力では漢字誤読など発音の問題が出るほか動画編集上の都合もあり、テキスト入力欄は別撮りとなります。猫の顔差分は(恐れ多くも)自分で手作りしました。

http://www.nicovideo.jp/watch/sm43368274