Elevenlabsは、高品質な合成音声の生成に特化しています。今回、スタートアップは最新モデルを発表しました。
新しいモデル「Eleven Multilingual v2」は、28の言語に対応し、これらの言語を自動的に認識してテキストから音声に変換します。Elevenlabsによれば、このモデルは前モデルよりもさらに高い声の真正性を実現しています。
音声の特徴は、合成されたものであれ声のクローンであれ、すべての言語で保持されるため、1つの声をすべての言語で使用することができます。
Elevenlabsの最初のバージョンは、市場で最高品質の音声生成技術のいくつかを提供していました。新しいバージョンのデモは、以下のビデオで聴くことができます。
Elevenlabsは、現在以下の言語をサポートしています: 中国語、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、フィリピノ語、日本語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、スロバキア語、クロアチア語、標準アラビア語、タミル語です。また、英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語は以前からサポートされており、今もサポートされています。
Elevenlabsは、AIの音声生成技術をサポートするプラットフォームを導入する計画をしています。
バージョン2のリリースにより、Elevenlabsはベータフェーズを終了しました。同社によれば、その技術は世界中で100万人以上のユーザーに利用されています。将来的には、新しい機能を導入し、ユーザーがプラットフォーム上で声を共有できるようになります。大胆なビジョンは、すべてのコンテンツをどの言語でも、どの声でも利用可能にすることです。
対象となるのは、メディア企業、ゲーム開発者、出版社、作家などです。すでにその技術を利用している顧客には、D-ID、Storytel、ScienceCast、TheSoul Publishing、Embark Studios、Paradox Interactive、MNTNなどが含まれています。Elevenlabsによれば、同社のプロプライエタリな音声技術は完全に社内で開発されたものです。