【音声合成】もう一度江良ちゃんの声が聞きたかった【リベンジ】

【音声合成】もう一度江良ちゃんの声が聞きたかった【リベンジ】

前回の動画を投稿した時点から割とすぐにmellotronでの検証動画は作成出来てたのですが、純粋に放置していたため遅くなりました。結果としては、最初の1文だけ似たけど、後は全然似ていない感じですね。課題としては、損失値が0.3を切った辺りから下がらなくなり、かなり長期間学習させ続けても0.3~0.26辺りをずっと行ったり来たりして終わらなかったことです(機械学習をやってて初めて遭遇した現象)。今回は、チェックポイントを使用して、学習途中のモデルを使用することにしました。前回と違う点としましては、入力ファイルに私の喋った音声(を1オクターブ上に加工したもの)を与え、それを江良ちゃんの学習モデルで変換をかけた感じになります。元の喋っている入力音声がある分、前回の0から音声を作り出すtacotron2とは違い、まだ何を喋っているかというのはハッキリと分かるようになっていると思います。始めて音声系の機械学習を触ってみましたが、今後また別の機会で触れることがあれば、何かやってみたいと思います。使用楽曲:のんびり過ごしましょ( https://commons.nicovideo.jp/material/nc92845 )

http://www.nicovideo.jp/watch/sm39276833