新規登録

新規登録

ログイン

月刊コールセンタージャパン

IT ニュース

NABLAS、日本語音声を自動生成するモデルを開発

３秒の音声データからリアルな音声を生成可能

AIスタートアップのNABLAS（東京都文京区、中山浩太郎代表取締役所長）は2024年８月、Googleが開発した音声生成モデル「SoundStorm」をベースに、日本語に対応した音声生成モデルを開発した。これにより、数秒の対話データのみで、話者の声の抑揚や特徴を忠実に模した、日本語の音声生成が可能になる。

図１:音声生成モデルの出力イメージ

図２:GoogleのConformerモデルをベースに開発

同モデルは、SoundStorm内部に、Googleが開発した、テキストの全体的な文脈と局所的な文脈を同時に捉えることができる「Conformerモデル」をベースに開発しており、音声生成のクオリティとスピードを追求している（図２）。
今後は、音声変換やテキストの読み上げ、リアルタイムでの対話翻訳などへの実装を進めていく。

2024年09月03日 11時49分公開

2024年09月03日 11時49分更新

音声認識

おすすめ記事

Standard AI、「オペすいすい」の検証パートナープログラムを開始

コムデザイン、クラウドCTI『CT-e1/SaaS』で音声AI『アイブ…

アドバンスト・メディア、「AmiVoice Communication…

[製品紹介] VR-RS100RDWⅡ/VR-RD790 ／タカコムPR

[製品紹介] AmiVoice Communication Suite…PR

阪急電鉄、交通ご案内センターをクラウド化し生成AIで応対履歴を可視化

その他の新着記事

鰻の成瀬、電話注文受付でAI実証実験を開始

YC.Primarily、ECの購入後体験改善に『Recustomer…

メルカリ『m department』、RECORE連携に対応

FAQ の「よくある質問」にすべて応えます

＜FAQの泉25＞　FAQ解決率が上がりません。なぜでしょうか？　（中…

「FAQ」のギモンに専門家が回答

資生堂ジャパン、「ISO10002」適合を宣言

VOCを全社活用する環境を強化

水戸市、ブリッジウェルとスポットAI『ToyTalk』で連携協定

●コールセンター用語集（マネジメント編）

●コールセンター用語集（ITソリューション編）

人気記事ランキング　

もっと見る/一覧で見る

記事検索　

生成AI カスタマーサクセスコンタクトセンターシステム CX AI BPO チャットボットボイスボット音声認識業務効率化

ホワイトペーパー/E-Book
ランキング　

購読のご案内

月刊コールセンタージャパン

定期購読お申込みバックナンバー購入

弊社は、お客様にウェブサイトを快適にご利用いただくため、クッキーを使用しています。本ウェブサイトを継続してご覧になられる場合、お客様はクッキーの使用に承諾いただいたものとさせていただきます。プライバシーに関する詳細については、プライバシーポリシーをご覧ください。

承諾