AIの歌声に泣かされる三連休

三連休の話をほぼ一週間後の金曜日にいまさら書くのかよとは自分でも思いますが、先の三連休は大してブログも書かず、月末までに片付けておきたかった作業も放置して、虚無になりながらTwitterを眺めていました。

すると、直接のつながりはありませんが何やら音楽界隈がざわついているらしく、RTで流れてきたある話題が目に留まりました。無調声でも自然に歌う「NEUTRINO」(※リンク)なる歌声合成ソフトウェアが無償公開されて、何やらとんでもない出来らしいのです。「東北きりたん」の音声ライブラリを使っていることから通称「AIきりたん」とも。

曲なんか作れないどころか楽譜も読めないので何ら関係ないといえば関係ない出来事ですが、単純に面白そうな技術なので興味は湧きました。


楽譜から発声タイミング、声質、声のかすれ具合などをニューラルネットワークで推定する仕組みだそうで、従来の音声合成ソフトほど「調声」と呼ばれる編集作業に多くの労力やノウハウを必要とせず、無調声でも人間っぽく自然に聞こえるというのです(とはいえ、意図通りに認識されやすいよう工夫した歌詞・楽譜データの作り方など、下準備の腕前は出る様子)。

めったに見なくなったニコニコ動画にログインして、公開数日で投稿された動画を漁ってみると、確かにこれはすごい。ボカロ黎明期から合成音声に耳馴染みのある世代なので、もしまっさらな状態でこのコンテンツに触れたらどう感じるのかは分からないものの、うまくハマる曲では限りなくリアルだと思います。

技術的なことを語るよりも、純粋に「推しに別ジャンルの好きな曲を歌ってもらえる感動を味わえた」ということのほうがNEUTRINOのすごさ、自然さが伝わるかもしれません。

NEUTRINOの公開初日に投稿された「AIきりたんで『キリトリセン』カバー 調声済み」という動画があるのですが、これを聴いたときの衝撃といったら。

キリトリセンとかシリョクケンサとかトリノコシティあたりの40mPの曲は世代ドンピシャでいろいろ思い出深いですし、プリパラおじさんでしたし(※きりたんのCVは真中らぁら役の茜屋日海夏さん)、「話題のなんかすげーソフトを試してみた動画」だということを忘れて違和感なく聴き入ってしまったぐらいの完成度です。こんなのが当たり前になったらどうなっていくのか、楽しみすぎる。


あ、関係ありませんが「VOICEROID+ 東北きりたん EX」を買いました。何に使うかはあまり考えていなかったものの、触ってみるとけっこう簡単ですし、買ってから色々調べてみたら割と自分にとっては使い道が多々ありそうな予感。このブログにもすでに動画用途で少し使っていますし、文章を読み上げてもらって聞き流してチェックに使うというのも意外とメジャーなようで。色々試してみようと思います。

関連記事