レビュー

日本語にも対応したテキスト読み上げモデル「Eleven v3」で実際にGIGAZINEの記事を音声化するとこうなる


AI企業・ElevenLabsの開発するText to Speech(テキスト読み上げ)モデル「Eleven」のバージョン3アルファ版に当たる「Eleven v3(alpha)」が2025年6月6日にリリースされました。Eleven v3(alpha)では、これまで切望されてきた日本語の読み上げが可能になり、さらにこれまでのモデルにはなかった「感情」と「対話」が可能になっています。

イレブンラボから今までにない表現力を持つTTSモデル「Eleven v3 (alpha)」を発表 | Eleven Labs Japan合同会社のプレスリリース
https://prtimes.jp/main/html/rd/p/000000002.000160611.html

Eleven v3の進化点は以下の通り。Eleven v3(Alpha)の公開APIは近日公開予定となっています。

70以上の言語に対応:33言語から70以上の言語へと拡張し、世界の人口カバー率は60%から90%に拡大。日本語や英語はもちろん、グローバルなコンテンツ制作に対応可能。
対話モード:会話の中で自然な話者切り替えが可能。
音声タグのサポート:テキストに「ささやき声」「笑い声」「皮肉な声調」等のトーンの指示や、「群衆の歓声」「ドアのきしむ音」といった効果音の指示を盛り込むことで、読み上げの臨場感をさらに向上。
幅広い感情表現:一つの文章の中で気分の変化やペースの変化が可能。
すべてのユーザーが利用可能:幅広いクリエイターや企業まで利用可能。
ストリーミングサポート(近日提供予定):コールセンターやリアルタイムの会話型エージェント向けに近日中に提供開始予定。

Eleven v3(alpha)は以下から無料で体験が可能です。

Eleven v3 (alpha) — 最も表現力豊かなテキスト読み上げモデル
https://elevenlabs.io/ja/v3


上記のページをスクロールすると、Eleven v3の読み上げをテストできる入力欄があります。読み手の声を選択し、入力欄に読み上げさせたい文章を入力して「PLAY」をクリックすれば、生成された読み上げ音声が再生されます。なお、無料体験は数回生成すると、ElevenLabsのユーザー登録が必要になります。


今回は、GIGAZINEの記事の一部分を入力し、「Alice」というボイスモデルに読んでもらったところが以下のムービー。かなりなめらかに読めている上にイントネーションに無理はなく、かなり自然な発話であることがわかります。読み上げる速度に緩急がわずかについており、言われなければAIが読み上げたものだとはわからないレベル。

日本語に対応したテキスト読み上げモデル「Eleven v3(alpha)」にGIGAZINEの記事を読み上げてもらった - YouTube


無料ユーザーだと、「Ishibashi - Strong Japanese Male Voice」という日本語に特化したボイスモデルを選択可能。読んでもらうと、「Alice」よりもより日本語として自然な印象。「声優やナレーターではない一般男性がとつとつと読み上げている」という印象で、抑揚やテンポにもほとんど違和感がありません。

「Eleven v3(alpha)」で日本語に特化したボイスモデルにGIGAZINEの記事を読み上げてもらったところ - YouTube


ElevenLabsによれば、Eleven v3は正確に日本語を読み上げるのはもちろん、テキストから感情を繊細に読み取り、喜怒哀楽を豊かに表現するだけでなく、例えば「関西弁」と指定すれば自然な関西イントネーションへと自動変換できるとのこと。さらに、「サッカー中継風」といった入力で、背景の声援とともに声を張り上げるような臨場感あふれる読み上げまで可能になったそうです。

なお、ElevenLabsの無料プランは月に合計2万文字まで生成可能で、生成1回ごとの最大文字数は2500文字です。ただし、商用利用は不可で帰属表示が必要となります。有料プランは月額5ドル(約720円)のスタータープラン、月額22ドル(約3000円)のクリエイタープラン、月額99ドル(約1万4000円)のプロプランがあります。

この記事のタイトルとURLをコピーする

・関連記事
iPhone上でAIが恋人になってくれるアプリ「Dolores」開発者がアプリの開発経緯と教訓を語る - GIGAZINE

元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表 - GIGAZINE

ジュディ・ガーランドやローレンス・オリヴィエら亡くなった有名俳優の声で本や記事を読んでくれる読み上げアプリ登場 - GIGAZINE

無料で音声からバックグラウンドノイズを除去してくれるAIツール「Voice Isolator」をElevenLabsが公開 - GIGAZINE

AIでクローン音声を作成するサービスを提供する企業のなりすまし対策は不十分なことが調査で発覚 - GIGAZINE

in レビュー,   ソフトウェア,   ネットサービス,   動画, Posted by log1i_yk

You can read the machine translated English article When the text-to-speech model 'Eleven v3….