タカコム
通話録音データは、コンプライアンス管理やオペレータの教育、VOC活動などの用途に使われる。ただし、いずれの用途においても、利用のたびに通話録音システムの管理画面から検索し音声を聞き起こす手間が発生する。
この手間を排し、通話録音データの利活用における効率および品質を高める手段が音声認識によるテキスト化だ。生成AIの登場により、そのテキストを自動要約して応対履歴として利用する潮流もあり、音声認識システムの導入を検討するコールセンターは増加し続けている。
ただし、相応の精度・セキュリティを担保して導入しようとなると、費用面での課題が大きい。「導入費用が数千万円に達するケースもあるうえ、チューニングなどでランニングコストが都度発生することを考えると、使い続けられるコールセンターはごく少数に限られてしまいます」。そう指摘するのは、通話録音システムベンダーのタカコム 商品開発本部 商品企画部 部長の高屋文洋氏だ。実際、同社の主要顧客層である中小規模のセンターが音声認識を導入する例はまだ少ない。
より多くのコールセンターが、コスト・工数ともにムリなく通話音声を利活用できる世界を目指したい。こうした思いから、音声認識機能を搭載した通話録音システムを開発し、リーズナブルな価格帯で提供を開始。幅広い用途で音声利活用を促進できるよう、ラインアップを拡充している。
製品に搭載している音声認識エンジンは、いずれも日立ソリューションズ・テクノロジーの『Ruby Dictation』。高屋氏は、「開発時は汎用的な音声認識サービスも選択肢の1つにあったのですが、処理速度やセキュリティ、認識精度を左右するメンテナンスの可不可といった要素を総合的に評価して採用しました」と強調する。
2024年末に発売予定の製品も含めると、音声認識搭載通話録音システムは4製品。そのうち3製品はバッチ処理型システムで、数百万円台から購入できる。これらは、コンプライアンス管理やオペレータ評価の効率化を支援する。1製品はリアルタイム型の通話録音アプリで、1席で9万8000円(税別)の買い切り型で音声認識機能を利用でき、SVによる応対中のオペレータ支援やACWの省力化に寄与する。
運用コスト抑制の観点で、これら製品には現場で音声認識をメンテナンスできるUI(ユーザーインタフェース)を用意。「誰でも辞書をメンテナンスできるよう、画面を作りこみました」(高屋氏)。実運用に合わせて柔軟かつスピーディーに認識精度を向上できることで、音声利活用を支援する。