【トレンド】音声認識IVR

Trend

[トレンド]音声認識IVR

“単語認識”から“自然発話理解”へ
バーチャルオペレータが電話で対応

顧客行動がデジタルシフトしているとはいえ、問い合わせチャネルの主役は相変わらず電話だ。顧客視点でいえば、機能強化および利便性向上の余地は大きい。近年は音声認識IVRも進化。AIなどの先端技術を搭載し、自然発話による振り分け処理や自動対応など高度なソリューションも実現できるようになりつつある。

 近年、カスタマーサポート/サービス関連のITソリューションの導入事例では、Webチャネルの機能強化が注目される。とくに採用難を反映してか、チャットボットやバーチャルオペレータによる応対の自動化が目立つ。

 しかし、顧客対応の主要チャネルは相変わらず電話だ。デジタル(スマホ)ファースト時代にあっても、問題が解決しない場合の最終手段は電話窓口であり、その重要性は依然として揺るがない。

 電話窓口もWebチャネルと同様、さらなる機能強化が求められる。とくに音声認識IVRによる自動化は、効率化の観点から導入メリットが大きい。人工知能(AI)技術の進化を背景に、音声認識IVRがバーチャルオペレータとして活躍できる時代を迎えつつある。

音声認識進化の3ステップ
見えてきた次世代IVRのカタチ

 音声認識IVRを進化のプロセスで分類すると、(1)単語発話×単語認識、(2)自然発話×単語認識、(3)自然発話×意図理解──の大きく3つに分けることができる。

(1)単語発話×単語認識
 20年程前から存在する技術。特定のカテゴリーに含まれるワードを発話すると、それに関連した情報を自動的に返す。例えば、証券会社の株価照会サービスでは、証券銘柄を発話するとその時点での株価を音声で教えてくれる。プッシュ操作型IVRでは銘柄が多くて対応困難なサービスも、音声認識を使えば手軽に提供できる。テクニカルサポートセンターなどで、機種を発話して専門スキルを持ったオペレータグループにルーティングするといった利用法もある。

(2)自然発話×単語認識
 近年注目されるようになった技術。航空会社のチケット予約サービスなどで、「8月1日に成田からロンドンまでのチケットを取りたい。夕方出発の便はある?」と話すと、条件にあったチケットを自動予約できる。自然発話だが、実際には日付・出発地・目的地・時間といったチケット予約に必要な情報のみを認識している。情報が欠けていたり、認識できなかった場合は、問い返して聞き出すといったコールフローを設計する。

(3)自然発話×意図理解
 AIの進化により実現する技術。IVRのバーチャルオペレータに自然発話で用件を伝えると、自然言語処理技術などで意図を理解し、適切な対応を行う(図1)。具体的には、FAQによる自動回答、アプリケーションを使った自動処理、適切なオペレータへのルーティングなど、あたかも有人オペレータのように一次対応を実施する。

図1 「自然発話×意図理解」型IVRの概要

図1 「自然発話×意図理解」型IVRの概要

 万能な人工知能(強いAI)は存在しないため、業務特化型の人工知能(弱いAI)を利用する。当然ながら、適用範囲をどこまで広げるかで開発規模は変わってくる。

 国内市場では、(1)のタイプがもっとも普及している。それでもプッシュ操作型IVRに比べるとかなり少ない。誤認識が顧客満足度の低下やクレームになることを懸念する企業が多く、広く普及するには至ってないのが実情だ。

 また(2)は、主要ベンダー数社にヒアリングした限り、国内企業での導入はほぼない。海外では航空会社、金融機関、製造業、自治体など、業界を問わず広く導入が進んでいる。日本語解析の難しさと、前述のようなクレームへの恐れが普及を阻害する要因と思われる。

 (3)のタイプは、現在、主要音声認識ベンダー各社が開発を進めている。ディープニューラルネットワーク(DNN)技術による認識率の向上、自然言語処理と対話エンジンによる自然な会話の実現を目指しており、2017年度中には対応製品を出すというベンダーもある。

電話からチャット・Web・SNS
クロスチャネル運用を提案

 音声認識技術を踏まえながら、各社のソリューションをみる。

 音声認識ベンダーとして世界的シェアを持つニュアンス・コミュニケーションズ・ジャパンは、自然発話から必要なワードを認識し後処理につなぐ、従来型の単語認識タイプのIVRを機能強化している。とくに声紋認証による本人確認プロセスの簡略化を推奨。セルフサービスの適用範囲を広げることで音声認識IVRの普及を促す。

 クロスチャネルの運用も提案する。例えば、電話での問い合わせから必要に応じて手元のスマホにメッセージを送信、Webチャットに切り替えて視覚的なコンテンツを添えて対応するなど、より柔軟な応対フローを実現していく。2017年の夏以降、まずはFacebookメッセンジャーとの連携機能を提供予定。

 さらに2017年度末、自然発話をリアルタイムに全文テキスト化する新たなIVRソリューションを提供開始する。Web用のバーチャルオペレータなどと連携可能なため、電話によるセルフサービスのあり方も変わると見据えている。

図2 ニュアンスが提唱する対話型IVRの概念

図2 ニュアンスが提唱する対話型IVRの概念

 ログイットはSI企業として、ニュアンスの音声認識エンジンに独自の住所・姓名辞書などを組み込み、システム開発を含めた音声認識IVRの提案を行っている。近年はテレマアウトソーサーへの提供が増えており、音声認識IVRをサービスとして利用する企業ニーズが広まっていると見ている。

 今後はニュアンスのラインナップ強化にあわせてアプローチをすると同時に、ナイスジャパンの分析製品「ネクシディア・アナリティクス」との連携も提案する。自然発話からテキスト分析することで顧客傾向を把握、対話エンジンのブラッシュアップなども進める。

発話内容からAIが意図解釈
自然対話で目的まで誘導

 アドバンスト・メディアの音声認識エンジン「AmiVoice」は全文テキスト化が特徴。コールセンターでのVOC分析や応対品質管理などで活用されている。IVR利用では、顧客が話した内容をテキスト化し、AIに渡して意図解釈を行い、適切な後工程(振り分けや自動処理など)につなげていく。

 AIについては、独自対話ソリューション「AmiAgent」の対話エンジン「AOI」と連携する。スマホアプリ、IVR、Web、チャット、SNSなどで自動応答するための仕組みで、話者(利用者)の意図を解釈しながら会話・手続きを行う。大手銀行のスマホアプリなどで採用されている。このほか、IBMの人工知能「Watson」などとも連携可能。ユーザー企業の要望に応じて最適なパートナーと組み、システム開発を行う方針だ。

 U-NEXTマーケティングは、コールセンター構築・運営や、それに伴うシステム開発を行っている。昨年9月、アドバンスト・メディアと提携、自動応答コンタクトセンターサービス「AIコンシェルジュ」の提供を開始した(図3)。

図3 「AmiVoice / AmiAgent」を搭載した「AIコンシェルジュ」

図3 「AmiVoice / AmiAgent」を搭載した「AIコンシェルジュ」

 大手金融機関の事例では、社内ヘルプデスクに「AIコンシェルジュ」を活用。システムにログインできない、メール送信できないなど、問い合わせ件数の多い案件について解決方法を自動案内する。これは実証実験で、上手くいけば顧客向けの自動対応サービスを開始する予定。この他、旅行会社の問い合わせサポートや通販企業の受注業務など、自動化案件の引き合いは多いという。

 SI企業のSCSKは、「AmiVoice」と独自開発のAI自動回答エンジン「Desse」を組み合わせた音声認識IVRの実用化検証を行っている。入電のコールリーズンの自動判別および、適正な振り分け、自動回答による効果検証など、実証実験で課題抽出と対策を行いながら、提案を進めていく方針だ。

実際の応対内容を教材に
自己学習して賢くなるIVR

 NTTソフトウェアとNTTアイティが合併し、2017年4月に誕生したNTTテクノクロスでは、NTT研究所が開発したAIや対話エンジンを搭載した音声認識IVRの開発を進めている。自然発話での意図理解を実現、仮想エージェントが「ご用件をお話ください」と促し、利用者が目的を伝えると、内容に応じて適切なオペレータグループに振り分けたり、自動処理アプリケーションと連動したセルフサービスを実行する。対応を誤った際はバックヤードにいる人間が瞬時に補正、利用者に気付かれることなく適切なオペレータグループへと電話をつなぐ。こうした情報を常に学習し、経験を積むほど正確な対応を行えるようになる。

 さらに利用者とオペレータの通話録音や店舗窓口での応対音声をビッグデータとして蓄積。機械学習システム「Jubatus(ユバタス)」を通じて応対ナレッジを作成する。実際の応対に基づいた実用性の高いナレッジを自動生成できる(図4)。これを活用し、電話に限らずさまざまなチャネルで、自動対応を実現できるよう構想している。

図4 NTTテクノクロスが目指すコンタクトセンターの姿

図4 NTTテクノクロスが目指すコンタクトセンターの姿

 一方、NTTデータ先端技術では、CTI総合ブランド「VOISTAGE」の一環として、主力製品「マルチメディアボックス」シリーズに音声認識エンジンを標準搭載。これを活用したソリューションとして、自治体の各種情報提供や映画館の上映案内で使用される「音声認識テレホンガイドシステム」がある。これらは情報提供型のIVR活用だが、近年はAIと連動した自動処理を行うなど、より高度なIVR利用の相談が増えているという。一例として、IBM Watsonと連携したメール共有ソリューション「テクノマーククラウド+」を提供しており、今後は音声認識によってテキスト化した“顧客の声”をWatsonと連携することで、自動的にFAQから回答を提示するなど、AIを活用した音声処理(IVR)とテキスト処理(メール/FAQ)の連携も計画している。

 NECに寄せられるIVRに関する相談は、実務に即したものが多い。とくに音声メニューの煩わしさに伴う不正確な振り分けは、CSを下げるとともに生産性を悪化させる。そこで複雑なガイダンスを聞くことなく、問い合わせ用件を発話するだけで適切なオペレータに自動振り分けし、利便性を向上させている。さらに問い合わせ内容を事前にオペレータに提示することで応対時間を削減、コンタクトセンターの業務効率化につなげている。こうした一次対応業務の自動化は、製造業、官公庁、流通・サービスなど、十数社で提案しているという。

 冒頭でも述べたようにWebチャネルにおけるシステム投資は盛んだが、電話に関してなおざりという企業が多い。しかし、どのチャネルでも同じ顧客体験を提供するというカスタマー・エクスペリエンス実践の精神に乗っ取るならば、電話が旧態依然のままでは矛盾するといえる。チャネルを問わず、24時間いつでもサービスを提供するという意志のもと、電話対応の一部をシステムに置き換える判断をしてもいいのではないだろうか。

2024年01月31日 18時11分 公開

2017年08月18日 10時22分 更新

その他の新着記事

  • スーパーバナー(リンク2)(240426画像差し替え)

購読のご案内

月刊コールセンタージャパン

定期購読お申込み バックナンバー購入