その他

【トレンド】音声認識システム活用

Trend

［トレンド］音声認識システム活用

精度を上げる“ひと工夫”で導入効果が高まる
「音声認識システム」活用の最新動向

音声認識システムを導入し、効果を上げる事例が増えている。その内容も、苦情の抽出、応対品質のチェック（モニタリング）、後処理業務の効率化、ユーザビリティの向上など多種多様で、活用シーンは確実に拡大しつつある。事例各社に共通しているのは単に導入しただけでなく、認識率を高めるなど“成果を出すための工夫”を凝らしている点だ。「音声認識の現状と可能性」を探る。

　企業の「音声認識システム」への関心は年々高まっている。編集部が毎年実施する「国内コールセンター実態調査（2016年）」で“今後導入予定のITソリューション”を聞くと、「音声認識システム」と回答した企業は約13％。「テキストマイニング」（約14％）の回答も比較的多いことから、用途としてはVOC分析・活用と推察できる。実際、ITベンダー各社は「ビッグデータ活用の一環で、VOC分析の相談が増えている」と話す。

発想次第で活用シーンは広がる
音声認識で実現できること

　音声認識の導入目的と期待効果を図にまとめる。

図　音声認識の導入目的・期待効果と課題・対策例

　「業務効率化」は、通話音声を自動要約して応対履歴入力を省力化したり、通話中のキーワードからFAQを自動検索して保留時間を減らす。「応対品質管理」は、オペレータがNGワードを言っていないか、苦情通話になっていないかをリアルタイムにモニタリングし、問題があれば直ぐにサポートに入る。また全通話テキスト化で応対品質を自動評価し、オペレータ指導を効果的に行う。これらはセンター運営現場での期待だ。

　「経営貢献」は、VOC分析による顧客ニーズの発見。商品・サービス開発や業務改善へのヒントを得る。「リスク管理」は、コンプライアンスの観点から問題通話や苦情通話を抽出する。これらは主に経営層やリスク管理部門などが期待する効果である。

　「サービス向上」は、音声認識IVRを導入することで、煩わしいプッシュ操作をなくし顧客満足度を高めていく。セルフ化が進めば呼量削減にもつながる。

　音声認識を導入すれば、こうした期待効果を容易に得られる──と考える企業は少なくない。しかし、導入企業からは「音声認識IVRによる業務効率化を期待して応対要員を減らしたが、誤認識が多く、かえってセンター稼働率が上がった」、「応対履歴の自動作成でオペレータの後処理業務が効率化できると期待したが、人による個人差が大きかった」など、活用フェーズに入ってから直面する課題は多い。

　結果として“音声認識は使えない”というレッテルを貼られることも少なくない。実際には、音声認識はシステムと運用の両面から取り組み、時間をかけて成果を上げていくものだ。

運用ルールを策定・徹底
プラスαの創意工夫も必要

　運用へのアプローチは重要だ。音声認識エンジンはあくまでも機械であり、上手く使わなければその性能を発揮できない。

　例えば、応対履歴を自動生成したい場合、電話回線経由で自由に話す顧客側の認識率はどうしても低くなる。そこで、オペレータが顧客の言葉を“翻訳して復唱”することで認識率を高める。残すポイントをルール化し、研修・実践を通じてオペレータに徹底させることが重要だ。ある住宅設備企業では、応対上のルールが守られているかを自動集計するツールを独自開発し、評価結果をもとにオペレータを指導している。精度の高い応対履歴を残すとともに応対品質の向上・平準化を実現した。

　また製造企業では、保守作業員の作業報告登録に音声認識IVRを活用している。一定ルールのもとフローチャートに従って作業結果を発話する。認識率を高めるため、発話を実演した動画コンテンツを作成し、Eラーニングで徹底研修している。

　苦情通話の検出に取り組む生命保険企業では、音声認識だけでは絞り込めなかった苦情候補通話について、迷惑メールのフィルタリングなどに利用される“ベイズ理論”を応用し、高精度での苦情抽出を実現している。音声認識＋αの発想が重要ということだ。

　音声認識は要素技術であり、どう使って期待効果を上げるかは導入企業の創意工夫と運用ルールの徹底が重要になる。最初は期待外れでも、中長期的視野で取り組むことで成果を得られるはずだ。

　一方、システム面では音声認識エンジンを“育てる”必要があり、ITベンダーの協力が不可欠だ。

　音声認識は基本的に辞書・音響モデル・言語モデルの3つの要素で成り立つ。辞書は認識させる言葉群で、類義語や表現の揺れなどを含めて登録する。音響モデルは、その言葉がどのように発話されるか、アクセントやイントネーションなどを設定する。言語モデルは、ある言葉の後にどんな言葉が続くか、どの言葉同士が一緒に出てくるかをまとめたものだ。通話音声などの実データに基づき、これら要素を整理しチューニングを繰り返すことで認識精度が向上する。

　場合によって音響分析も用いる。オペレータと顧客の発話比率、無音時間、話すスピード、強弱など、音声認識だけでは把握できない要素をあわせて活用することで、苦情通話などの検出率を高められる。

　音声認識エンジンの技術革新も進んでいる。辞書・音響モデルのチューニングを削減し、かつ認識率を高めるディープニューラルネットワーク（DNN）など、新たなアルゴリズムも登場している。

※記事出典：月刊「コンピューターテレフォニー」2015年2月号に掲載した記事を再編集して転載しました。
（記事は雑誌掲載時の情報に基づいており、現在では異なる場合があります）

2024年01月31日 18時11分公開

2017年08月18日 10時23分更新