pythonで音声からの文字起こしと翻訳をしてみよう!

pythonで音声からの文字起こしと翻訳をしてみよう!

今回はpythonを使って音声からの文字起こしと翻訳をしてみようと思います。ついでに、作成した字幕データを使って日本語で動画を聞けるようにしてみたいと思います。追記:VOICEVOXのpythonAPIも使うべきでした...★pythonコード・前半: https://k-dm.work/ja/finance/nlp/mp32srt/ ・後半: https://k-dm.work/ja/finance/nlp/srt2jp/----------------------------- ★参考文献・使用したモデル・openai/whisper: https://github.com/openai/whisper ・staka/fugumt-en-ja: https://huggingface.co/staka/fugumt-en-ja ・ニューラル機械翻訳モデルFuguMT: https://staka.jp/wordpress/?p=413----------------------------- ★お借りしたもの・音声:VOICEVOX ( https://voicevox.hiroshiba.jp/ )・立ち絵:ずんだもん立ち絵素材・坂本アヒルさま( https://seiga.nicovideo.jp/seiga/im10788496 )・動画内で実験のために使用した音声 → Flex LNG Q3 2022 Key Takeaways ( https://www.youtube.com/watch?v=tsU0jebpux0 )★BGM・Flower Field (by FLASH☆BEAT様) https://dova-s.jp/bgm/play13492.html----------------------------- ★免責事項本動画で使用したコードを用いたあらゆる結果について一切の責任は負えません。また、作成された文字起こしデータと翻訳データは正しさが保証されたものではありません。この配信の内容は情報提供と教育のみを目的としたものであり、実際の株の売買を薦めるものではございません。株の売買を行う場合は、事前に必ずご自身で調査をした上で、自己責任でお願い致します。また、翻訳の正しさは保証されておらず、また本コードも動作や出力に関しては一切の責任を負えません。

http://www.nicovideo.jp/watch/sm41498824