アドバンスト・メディア(東京都豊島区、鈴木清幸代表取締役会長兼社長)は、開発者向けボイステックプラットフォーム『AmiVoice Cloud Platform』で提供しているAI音声認識API『AmiVoice API』に、End to Endを採用した次世代音声認識エンジンを搭載した。
End to Endは、音声認識エンジンの仕組みの一種で、単一のニューラルネットワークで音声認識を行う。AIが最適な手法を選定し、End to Endモデル内で音声認識を行うことにより、認識精度の向上や処理速度の高速化が期待される。
今回は「日本語」「中国語」「多言語(日・英・中を単一エンジンで認識)」の3つの汎用向け音声認識エンジンに対応。それぞれリアルタイム認識・バッチ認識(音声ファイル認識)で利用できる。
今後は、AmiVoice Cloud Platformで提供する音声認識APIサービス『AmiVoice API Private』、音声認識開発キット『AmiVoice SDK』も同エンジンに対応していく予定。
2025年03月27日 16時00分 公開
2025年03月27日 16時00分 更新