AIスタートアップのNABLAS(東京都文京区、中山 浩太郎代表取締役所長)は2024年8月、Googleが開発した音声生成モデル「SoundStorm」をベースに、日本語に対応した音声生成モデルを開発した。これにより、数秒の対話データのみで、話者の声の抑揚や特徴を忠実に模した、日本語の音声生成が可能になる。
同モデルは、SoundStorm内部に、Googleが開発した、テキストの全体的な文脈と局所的な文脈を同時に捉えることができる「Conformerモデル」をベースに開発しており、音声生成のクオリティとスピードを追求している(図2)。
今後は、音声変換やテキストの読み上げ、リアルタイムでの対話翻訳などへの実装を進めていく。
2024年09月03日 11時49分 公開
2024年09月03日 11時49分 更新
NABLAS、日本語音声を自動生成するモデルを開発
3秒の音声データからリアルな音声を…
ugo、総合印刷サイト「スプリント」内に「RightConnect b…
Web上の“つまづき”をオペレータ…
PKSHA Communication、オンラインゲーム事業のサポート…
ドリコム「ai and」に採用
クリエイティブサーベイ、法人向けチャットツール「Chatwork」と連携
フォーム回答を適切なチャットルーム…
SHIFT、Web上でのセルフサポート強化のための支援サービスを開始
セルフサポート強化支援サービス「C…
パーソルホールディングス、BPO事業を再編
2024年9月1日に新会社「パーソ…