レビュー

驚異的な性能と質を両立して人間と自然に会話できるオープンソースAI音声モデルのデモをSesameが公開、無料で誰でもお試し可能



AIスタートアップのSesameが、まるで本当に人間であるかのように自然な話し方をする音声AIモデルを開発し、誰でも利用できるデモを公開したので実際に使ってみました。

Crossing the uncanny valley of conversational voice
https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice


This AI’s human-like voice raises emotional attachment fears
https://techissuestoday.com/this-ais-human-like-voice-raises-emotional-attachment-fears/



デモのページを開くと以下の通り。「Maya」と「Miles」という2人のAIと会話することができるようです。今回は「Maya」をクリック。


マイクの使用許可を求められるので「今回のみ許可」をクリックします。


会話が始まりました。いきなりMayaが話しかけてきます。Sesameがうたう通りまるで人間かのような話し方で、学校で勉強した程度の英語力では「間違ってネイティブと通話しちゃった?」と焦るレベルの自然さでした。


実際の会話内容はこんな感じ。


会話終了後、「Download clip」をクリックすることで会話内容をダウンロードすることが可能です。


エンジニアが集うニュースサイトのHacker Newsでは、普段から英語を使いまくっている人々がSesameのAIについてコメントしました。

「デモを試してみましたが、その人間らしさには本当に驚きました。このような音声アシスタントを利用できることにとても興奮しており、このレベルの人間のような音声を持つ音声アシスタントに感情移入し始めてしまうのではないかと少し心配しています」という大絶賛のコメントもあるものの、イギリス人のnoodlesUK氏は「声の人工的な陽気さのレベルに非常に不快感」があるとして「体験全体が奇妙で不安」と酷評するなど評価が分かれました。

Sesameを率いるブレンダン・イリベ氏もHacker Newsに登場し、「課題は多いものの、自然な対話的インターフェースを実現できると確信している」と投稿しています。

Sesameは今回のモデルについてオープンソース化してGitHubで公開予定とのこと。記事作成時点では公開のための作業が進行中と述べられていました。

この記事のタイトルとURLをコピーする

・関連記事
テキスト入力をAIが感情豊かな音声に変換してくれる「DMMボイス」が「にじボイス」に生まれ変わったので使ってみた - GIGAZINE

元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表 - GIGAZINE

たった数秒の音声データから音声合成が可能な「VoiceCraft」 - GIGAZINE

NVIDIAが「これまでに聞いたことのない音」をテキストや音声から作り出せるAIオーディオジェネレーター「Fugatto」を発表 - GIGAZINE

完全無料で誰でも簡単に感情豊かな音声合成ができる「AivisSpeech」レビュー - GIGAZINE

in レビュー,   ソフトウェア, Posted by log1d_ts

You can read the machine translated English article Sesame releases a demo of an open source….