パスワードを忘れた? アカウント作成
13491557 submission

Googleの音声合成システムは人間と区別がつかない

タレコミ by Anonymous Coward
あるAnonymous Coward 曰く、
Googleは今月末に合成音声「Tacotron 2」を発表した。人工知能にテキストを読ませてリアルな音声を作り出すためのシステム。TechCrunchによれば、気味が悪いほど本物そっくりの”音声だという。これまでの音声生成プロジェクトWaveNetと初代Tacotronの良いとこ取りをしており、2つのニューラルネットワークで構成されている。テキストをTacotronでスペクトログラムに変換、それをWaveNetに入力、最終的な音声に出力する構成であるようだ。

Googleが生成したサンプルと比較用の人間による音声サンプルがネット上にアップされている。英語だが聞いた範疇ではかなり自然な発音だ。TechCrunchによるとユーザーには文法知識がなくても使えるようだ。ただサンプルを聞くと句読点の位置は重要であるらしい(QUARTZTechCrunchSlashdot)。
この議論は、 ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

身近な人の偉大さは半減する -- あるアレゲ人

読み込み中...