Googleの音声合成システムは人間と区別がつかない
タレコミ by Anonymous Coward
あるAnonymous Coward 曰く、
Googleは今月末に合成音声「Tacotron 2」を発表した。人工知能にテキストを読ませてリアルな音声を作り出すためのシステム。TechCrunchによれば、気味が悪いほど本物そっくりの”音声だという。これまでの音声生成プロジェクトWaveNetと初代Tacotronの良いとこ取りをしており、2つのニューラルネットワークで構成されている。テキストをTacotronでスペクトログラムに変換、それをWaveNetに入力、最終的な音声に出力する構成であるようだ。
Googleが生成したサンプルと比較用の人間による音声サンプルがネット上にアップされている。英語だが聞いた範疇ではかなり自然な発音だ。TechCrunchによるとユーザーには文法知識がなくても使えるようだ。ただサンプルを聞くと句読点の位置は重要であるらしい(QUARTZ、TechCrunch、Slashdot)。
Googleの音声合成システムは人間と区別がつかない More ログイン