コールセンター/CRMのソリューション・サービス“さがし”にご利用下さい!

コールセンターのITさがしは、コールセンター/CRMのための、ソリューションやサービス探しをサポートします。情報収集・比較検討・導入検討にご活用下さい。「コールセンターのITさがし」について

音声認識

音声をデジタルデータとして認識し、テキスト化または自動操作を行う

音声認識 / ASP・SaaS・クラウド / AI(人工知能)

更新日:2018/11/15

MSYS Omnis

丸紅情報システムズ
詳細を見る
対象ユーザー コールセンター全般
対象規模 -
製品形態 クラウド(一部オンプレミス)
価格情報 <POC参考価格>(イニシャル)100万円、(ランニング)295,000円(月額) ※税抜
製品概要 MSYS Omnisは、Google Cloud Platform(TM) を活用した次世代コールセンターソリューション。これまで、音声認識を導入しようとすると高額なシステム投資が必要だったが、Google(TM) が提供するAPIを利用、かつクラウドで装置の購入を不要としたことで、安価に音声認識を実現する。さらに、Googleが提供するAPIを組み合わせて、コールセンター向けソリューションを独自に開発――AI FAQ、文章要約、分析、IVRを低コストで実現する。コールセンター業務の効率化だけではなく、分析のしやすさや、顧客へ提供するサービス全般のスピード化を目指すソリューションである。
 
  • 製品紹介

Google™の音声認識技術を活用!
コールセンターの自動化を実現する「Omnis IVR」をリリース!

MSYS Omnis

丸紅情報システムズ

1カ月でスタートできる高精度な音声認識──。丸紅情報システムズが提供するクラウドAIサービス「MSYS Omnis(エムシス オムニス)」は、Google™の最先端技術を活用することで「チューニングの手間なし」で実用レベルの認識精度を実現する。コールセンターにおける通話音声の活用を支援する方針だ。

 音声認識システムの実用がいよいよ本格化しつつある。編集部が毎年実施している「国内コールセンター実態調査」では、「導入予定のITソリューション」について、「音声認識システム」と回答した企業は25.0%。昨年の同調査と比較して15.7ポイント増加している。近年、実際に導入し、一定の成果を生んでいる事例があることも検討を後押ししている要因だ。

 導入目的も、苦情の抽出、応対品質のチェック(モニタリング)、応対履歴入力の効率化、顧客満足度向上など多種多様で、活用シーンは確実に拡大している。ところが、費用対効果が発揮されるのは「50席規模以上」といわれており、事例の多くは大規模センターだ。具体的には、初期導入コストに加え運用開始後のチューニングコストがネックとなり、導入を断念せざるを得ないケースが少なくない。

 こうしたコスト障壁を取り除くソリューションとして、丸紅情報システムズはクラウドAIサービス「MSYS Omnis(以下オムニス)」の提供を開始した。

 オムニスは、 Googleが提供するクラウドコンピューティングのプラットフォーム「GoogleCloud Platform™(以下GCP)」上で提供するGoogle Cloud Speech to Textを利用し、コールセンターでの利用シーンに合わせてカスタマイズを施した従量課金制のクラウドサービスだ。音声認識を中心に、文章要約や翻訳、分析などの機能を持つ()。音声認識は、全文テキスト化が可能。用途に応じてリアルタイムで認識するか、録音音声を認識するバッチ型かを使い分けることができる。Avaya、Genesys、BIZTEL、Pure Cloudなど、代表的なコンタクトセンタープラットフォームとの連携が可能だ。2017年夏の提供開始以来、すでに300社以上の引き合いがあるという。

図 オムニス──ソリューション群

図 オムニス──ソリューション群

1カ月でスタートできる高精度な音声認識

 オムニスの特徴は、「低コスト・短納期」「高精度な音声認識」「安全性」の3点にある。

 「低コスト・短納期」は、クラウド提供によってもたらされた。チューニング不要のため、約1カ月で運用を開始できる。

 負荷が高い処理はすべてクラウド上で実行するため、1サーバーで250席まで対応可能。オンプレミスシステムと比較すると、およそ10分の1のコストで済む。スモールスタートで効果を測定しながら、運用の継続および拡張を見極められる。一般的な単語に関する音声認識エンジンのチューニングは、Google側が機械学習を用いて行っているため、現地作業やベンダー依頼はほぼ不要だ。さらに、音声認識以外の諸機能はライセンス購入で、必要に応じて取捨選択することによりコストのスリム化を図れる。

 「高精度な音声認識」は、Googleがグローバルに展開しているコンシューマービジネスで収集したデータを基盤としている。常に最新の口語表現や書き言葉を取り込んでいるため、チューニングレスでも精度の高い通話音声テキストが出力可能だ(解説[1])。現在、120以上の言語と方言に対応。日本語の方言による発話もスムーズにテキスト化できるという。

 機械学習を活用した音声認識技術はさまざまな企業がサービス化しているが、検索サービスの利用者が他を圧倒しているうえに、AIの技術者を数千人単位で擁するGoogleに一日の長があるという見方は強い。最新のアルゴリズムを活用した、高精度かつ利便性の高い音声認識を先行運用できることも魅力の1つだ。

解説[1]チューニング

「ほぼ手間なしで高精度」を実現

 オムニスの音声認識機能は、GCP上の「Google Cloud Speech to Text」を通じてGoogleの音声認識エンジンを利用しているため、“チューニングレス”がメリットだ。認識精度は平均で85%超。オペレータ側の発話であれば95%前後の認識精度を維持している。

 一般的に、「(コールセンターでは)チューニングなしの音声認識はありえない」といわれるが、コンシューマ向けに提供されている検索エンジンや「OK,Google」の発話で起動するモバイル音声アシスタントから収集したデータをリソースとした機械学習のため、日常で使う書き言葉/話し言葉の認識精度は圧倒的に高い。さらに製品やサービス名も含む新しい単語や言い回しにも即時対応できる。コールセンターにおける顧客応対では専門用語は極力使わず、“日常で使う言葉”に言い換えることも多い。チューニングレスでも、問題なく運用できるセンターは多そうだ。

 もちろん、BtoBやヘルプデスクは企業独自の略語や用語が問い合わせに含まれる可能性も高いが、その場合はオムニスの管理者UI(ユーザーインタフェース)から単語の辞書登録が可能(図)。これにより、認識されにくい固有名詞も認識しやすくなり、「完済」「関西」などの同音異義語のうち特定の単語を優先して変換できるようにするなど、認識精度の向上を実現する。なおオムニスは、企業ごとに専用のインスタンスを構築しているため、登録された辞書はその企業だけのものとなる。

図

拡大画像はこちら

 「安全性」については、グローバルのセキュリティ基準に準拠していることが挙げられる。具体的には、受託会社の内部統制基準である「SOC(Service Organization Control)」やカード情報セキュリティの国際統一基準「PCI DSS(Payment Card Industry Data Security Standard)」、情報セキュリティマネジメントシステム「ISMS(Information Security Management System)」に対応。さらに、日本の政府系シンクタンクFISC(金融情報システムセンター)によって作成された安全対策基準にも見解を明示している。このため、金融機関をはじめとするセキュリティポリシーが厳格な業界でも、十分に要件を満たすことが可能だ。

 懸念されることが多いネットワークリソースの負荷増大によるサービス機能停止の可能性についても、3年間で300億ドル近くを投下してインフラ増強を図るなどして、リスク回避に努めている。

音声テキスト化ニーズに応え 機能拡充、サービス開発

 認識した通話音声テキストを活用するための諸機能は、Googleが提供するAPI、または連携パートナーの提供機能をアプリケーションで提供する。

 例えば、IVRの煩わしいプッシュ操作をなくし、顧客満足度を高める「音声認識IVR」(解説[2])。顧客の発話内容に対し、適切なオペレータにルーティングする他、「音声合成」と組み合わせて“音声ボット”を構築することも可能だ。

解説[2]音声認識IVR

“1回の発話”で適切なオペレータに接続

 音声認識IVR「Omnis IVR」は、音声認識、自然言語処理技術の利用により、顧客が発話した内容を把握し、適切なオペレータにルーティングする機能を提供する。

 図のように通常のIVRと同様に自動応答ガイダンスを再生し、発話を促す。「ギフトカードはどこで買えますか」といった顧客の質問の意図を把握し、該当するスキルグループに割り振る。製品やサービスの数が多く、スキルグループが複雑なコールセンターでも、1回の発話でオペレータに辿りつけるため、既存のIVRのように長く複雑な分岐によるガイダンスは必要ない。電話の顧客体験におけるマイナス要因の1つである「アナウンスの間、待たされる」「IVR操作の煩雑さ」の解消による顧客満足度向上が期待できる。

 さらに、音声合成の活用による「音声ボット」も実現可能だ。IVRフローに従って作成した会話シナリオを学習。顧客の発話内容に対し、適切な回答を自動応答し、解決まで導く。例えば、「住所変更」であれば、最初に氏名を確認し、発話が認められたら現住所、新住所の確認からオペレータの応対といった段階的なコミュニケーションも実現できる。コールリーズンに応じて、オペレータに接続するだけでなく他のチャネルに誘導するなど、柔軟な設計が可能。例えば音声ボットにAHTが短く比較的呼量が多いコールを振り分け、オペレータは高額商品の購入前相談などの応対品質を重視すべきコールに集中させるなど、リソース最適化も果たすことができそうだ。

図

拡大画像はこちら

 応対業務の効率化であれば、回答支援「AI FAQ」や会話要約「Summarize」が活用できる。AI FAQは、自然言語処理により、通話音声の認識結果から顧客の問い合わせ内容を把握し、適切な回答候補を提示する。人手不足が深刻化している状況においては、新人オペレータの教育時間の短縮につながりそうだ。

 Summarizeは、応対履歴入力の省力化とともに、入力内容の均質化によるVOC分析の精度向上に寄与する。要約文の長さは可変式で、要約するためのルールは自動生成される。手間がかからず、かつ柔軟な運用を実現した。

 なお、音声認識した結果を、セールスフォース・ドットコムが提供するCRMプラットフォーム「Salesforce Service Cloud」の画面に取り込めるアプリケーションを開発し、2019年3月に専用のマーケットプレイス「AppExchange」に拡充する予定だ(解説[3])。

解説[3]AppExchange

セールスフォースのCRMと連携しオペレータの負荷を軽減

 テキスト化した通話音声は、オペレータの回答支援や要約、VOC分析(分類)など、応対業務の効率化や製品の改善プロセスの素材として使われる。結果、導入の際に、課題としてあげられやすいのが「CRMシステムとの連携」だ。

 例えばFAQなどの自動表示の場合、応対の状況に応じてCRMシステムの顧客情報画面と音声認識の経過表示およびFAQ画面はオペレータが手動で切り替えるか、PCモニターを2つ用意して対応していた。いずれも、顧客応対のたびに、2つの画面を見比べることになるため、オペレータに負担を強いていた。

 そこで、丸紅情報システムズは、主要なCRMベンダーのセールスフォース・ドットコムの「Salesforce Service Cloud」のAppExchange化に着手した。AppExchangeは、セールスフォース・ドットコムが提供するビジネスアプリケーションのマーケットプレイスを指す。

 AppExchange化により、アプリケーションをインストールするだけで、Salesforce Service Cloudの画面に音声認識画面を組み込むことが可能だ(画像)。さらに、認識結果を応対履歴として1クリックで登録できる。なお、導入費用は、オムニスと同水準。2019年3月までに提供開始予定だ。

図

 他のコールセンター向けの新機能の拡充については、直近ではテキストや画像から感情を分析する機能の取り込みを図る計画だ。音声テキスト化のニーズは、会議や対面店舗や対面営業など「会話」が発生するあらゆる場面から検証する考え。すでに、会議での利用を想定した議事録作成ソリューション「Omnis Meeting」(解説[4])の提供を控えている。

解説[4]議事録作成ソリューション

対面でのコミュニケーションもテキスト化

 会議の議事録作成に不可欠な、会議音声の聞き起こし。一般的には会議時間の1.5倍〜3倍の時間を要する。そのうえ、時間が経過するとともに記憶が薄れるため、要点整理が難しくなり、より多くの時間を費やすことになる。

 2018年12月に提供開始する予定の議事録作成ソリューション「Omnis Meeting」は、オムニスの音声認識機能を利用し、書き起こし作業を効率化する。マイクで集音した音声ファイルのテキスト化および要約が可能だ(図)。会議音声には、機密事項が含まれる可能性が高いが、GCPはグローバルのセキュリティ基準に準拠している。

 また、近年は対面店舗や対面営業の通話録音を行う企業は珍しくはない。証券販売や旅行代理店など、業種はさまざまだ。主にコンプライアンス管理とVOC(顧客の声)活動に利用されている。

 コンプライアンス管理は、会話のリアルタイム音声認識による能動的なアプローチが可能だ。例えば、証券会社であれば、「値上がりします」など、あらかじめ設定したNGワードが発話されると、管理者にアラートを発報する仕組みを構築できる。VOC活動は、会議の議事録と同様、書き起こし作業の効率化が期待できる。

 このほか、面談(フィードバック)の記録など、利用者の発想次第であらゆる業務の効率化・自動化を実現できそうだ。

図

 次いでオムニスを先行導入した3社の事例を紹介する。

ユーザー導入事例

MSYS Omnisの導入実績

株式会社横浜銀行

応対内容の記録や分析の簡易化を実現
応対品質向上、サービス改善に取り組む

 地方銀行の最大手である横浜銀行は、通話内容の記録業務の簡素化によるオペレータの負荷軽減、およびテキスト化で正確に把握される応対内容の分析データとしての活用など、応対品質の向上やサービスの改善を目的に試験導入を実施している。

図

株式会社イントラスト

先進技術の導入による業務改善に挑戦
サービス品質と生産性の向上を目指す

 総合保証サービスを手掛けるイントラストは、顧客とオペレーター間の通話内容の音声認識、文章要約により、(1)オペレータ業務のサービス品質向上、(2)業務効率指標CPH(Call per head)アップ、(3)採用コスト削減による生産性向上を目指している。

図

大東建託株式会社

多言語対応の音声認識AI導入により
1件当たりの対応時間を約45%短縮

 大東建託パートナーズは、将来の総合コールセンター化に向け、サポートセンターの品質向上と効率化を目的に「MSYS Omnis」の試験導入を実施。1件当たりの対応時間をおよそ46%短縮し、総合コールセンター化後は年間約3億円の経費削減を見込む。

図

お問い合わせ先

丸紅情報システムズ株式会社
CRMソリューション事業本部
TEL:03-4243-4300
E-mail:msysgcp@marubeni-sys.com
〒169-0072
東京都新宿区大久保三丁目8番2号新宿ガーデンタワー
URL:http://www.marubeni-sys.com/msys_omnis

お問合せ・資料請求

音声認識 / 情報の分析・共有 / VOC活用

更新日:2020/03/23

Verint会話音声認識・分析ソリューション

ベリントシステムズジャパン
詳細を見る
対象ユーザー 幅広い業種の企業の顧客応対に対応
対象規模 小規模から大規模まで
製品形態 オンプレミス、クラウド
価格情報 個別にお見積
製品概要 ベリントの会話音声認識・分析ソリューションは、セマンティック技術、自然言語解析、オントロジー、機械学習、文脈解析など多様な音声認識技術やAI技術を搭載し、ワンストップで録音・音声認識から分析までを提供する。さらに当社の声紋認証技術により、ステレオ録音だけではなくモノラル録音も話者分離が可能。他システムとの連携による音声認識も可能で、個別ツールを導入して連携させる手間やコストを大きく削減するだけでなく、使い勝手の良いインターフェースを提供し、分かりやすい分析機能を提供する。また、音声を証跡としても活用できるのも強みだ。企業の課題を可視化して分析し、VoCを企業の売上げ貢献にも活用したい企業を支援する。
 
  • 製品紹介

多機能でリーズナブル!
音声認識〜分析までワンストップで課題を解決

Verint会話音声認識・分析ソリューション

ベリントシステムズジャパン

 コンタクトセンターには顧客との会話音声という宝の山が眠っている。この宝を活用すると、コンタクトセンターの業務効率化やクレーム対応対策だけでなく、企業の売り上げにも貢献できる。

 ところが多くの企業では、通話録音と音声認識を別々に導入して、運用が複雑になっているケースが見受けられる。また個別導入のため連携ができずに、分析の結果を見て会話音声のモニタリングをしようにも、そもそも該当する録音音声の確認が困難というケースもある。

 「Verint会話音声認識・分析ソリューション」なら、通話録音、音声認識に加え、会話分析までワンストップで提供する。「ベリントはここが違う!」というポイントを紹介する。

音声認識 ワンストップ VS 個別ソリューション

音声認識 ワンストップ VS 個別ソリューション

コールリーズン分析による課題の見える化!

 ベリントは膨大な会話音声からキーワード検索、あいまい検索、演算子などを使った分析カテゴリで関連性のあるコールを数秒で自動抽出。さらに入電の根本原因を自動分類しておけば、適切な業務改善策を立てることができる。

使い勝手の良いインターフェース 分かりやすい分析機能

 通話録音装置と同じUIを採用しているため、非常に分かりやすいUIになっている。分析機能も自動またはワンボタンで操作できるので、データ分析の知識のない人でも視覚的に使いやすい設計になっている。

音声分析を活用してクレーム対応を解決する

 単語のトレンド分析機能や、お客様が発したクレームにつながるような些細なキーワードなどを見える化することで、今までは潜在していたクレームにいち早く対応することができる。

 またベリントの会話音声分析は会話の波形の横にキーワード吹き出しが表示されるので、それをクリックするだけで音声の聞き起こしが可能。クレームの通話内容を的確に把握して対策を打つことができる。

音声を分析して売り上げに貢献

 さらにお客様との会話の中で購入に繋がったコールと購入に繋がらなかったコールを比較したレポートを出すこともできるので、見本となるコールが売り上げに繋がった分岐点が見えてくる。このような応用でコンタクトセンターでの通話が企業の宝として活用されている事例もある。

「違い」をもっと知りたい方へ

 隔月で少人数制のセミナーを開催中。ぜひ一度ご参加ください。

ベリントの音声認識分析はここが違う!
隔月で音声活用セミナー開催!

コールリーズン把握で呼減に繋げる事例、聞き起こしの効率化を実現する事例などをご紹介。

日程/詳細・お申し込みはこちらへ

お問い合わせ先

ベリントシステムズジャパン株式会社
TEL:03-6261-0970
E-mail:al_japansales@verint.com
URL:http://www.verint.co.jp

お問合せ・資料請求

音声認識 / 業務の効率化 / ASP・SaaS・クラウド

更新日:2020/03/09

COTOHA Voice Insight

NTTコミュニケーションズ
詳細を見る
対象ユーザー コンタクトセンター業務全般
対象規模 企業規模問わず
製品形態 クラウドサービス
価格情報 月額25万円~
製品概要 「COTOHA Voice Insight」は、コンタクトセンターの業務に特化した音声のテキスト化サービスで、NTTの研究所で培った高度な音声認識機能を安価で手軽に利用することができる。VOC活用においてコールリーズン分析、クレームの抽出、アウトバウンドコールの分析、コンプライアンスチェックなど、さまざまな目的に適用することで、人材不足で多くの課題を抱えるコールセンターの業務変革を推進。SVの業務負荷低減やオペレータスキルの向上、顧客満足度向上につながる施策を支援する。
 
  • 製品紹介

会話の“見える化”で絶大な効果!
コンタクトセンターの業務変革

コンタクトセンター向け音声テキスト化サービス「COTOHA Voice Insight®

NTTコミュニケーションズ

「音声認識システム」は、2019年秋現在、最も“旬”なITといえる。スマートフォン向けのあらゆるアプリ、自動車、AIスピーカーなど、さまざまな製品/サービスに組み込まれている。コンタクトセンターにおいてもニーズは急拡大。契約確認、オペレーターの評価・教育のためのモニタリングなど、さまざまな活用シーンで導入が進んでいる。NTTコミュニケーションズ株式会社(以下、NTT Com)が展開する「COTOHA Voice Insight®」は、NTTの研究所で培った日本語解析の技術を安価かつ手軽に利用できるクラウドサービスとして耳目を集めつつある。

 コールセンターにおける音声認識システムの歴史は、かなり長い。2000年代初頭にはすでに英語圏で利用開始され、日本にも上陸した。しかし、“世界一難しい”と言われる日本語の認識はやはり困難で、かつ一定水準の認識率を達成するには膨大な手間とコストを要するため、「ROI(費用対効果)が見出だせない」として、なかなか普及に至らなかった。

 その様相に変化が生じたのは、ここ数年、IT市場を活性化させたAI(人工知能)とクラウドサービスの普及だ。

 AIを適用することで、認識精度が飛躍的に向上しただけでなく、さまざまな関連ソリューションとの組み合わせで活用シーンが拡大。さらにクラウドサービス化によって、それまで“数千万〜億単位”と言われていた導入費が低下し、一気に導入機運が高まっている。

 図1は、コールセンタージャパン編集部が実施した「コールセンター実態調査」における「導入/導入予定のITソリューション」に対する回答をまとめたものだ。音声認識システムの導入率は12.3%だが、「導入予定」は23.2%で、ブーム化しつつあるチャットボットに次ぐ導入意向となっている。

図1 導入/導入予定のITソリューション(n=220、複数回答あり)

図1 導入/導入予定のITソリューション(n=220、複数回答あり)

活用シーンが拡大する音声認識システム
「VOC」「モニタリング」へのニーズ高まる

 音声認識システムのコールセンターにおける活用は、(1)顧客の発声を認識し、IVRと組み合わせてプッシュトーンの代わりに用件を入力する、(2)顧客の発声を認識し、用件に応じたFAQなどのナレッジベースをオペレーターのデスクトップに表示する、(3)顧客とオペレーターのやり取りをすべてテキスト化し、VOC分析やモニタリングの自動化を図る、(4)顧客の発声を認識し、合成音声でやり取りする音声ボット(コミュニケーションの自動化)──などがある。(4)の音声ボットの事例はまだ極めて少ないが、(1)〜(3)はすべて、先進的なコールセンターでの採用が始まっている。

 近年、最もコールセンター運営企業が注目している用途は(3)だ。従来、VOCとは「オペレーターがCRMデータベースに入力したテキスト情報」が基盤だったが、これはオペレーターの要約スキルに依存し、かつ繁忙期にはACW(後処理業務)の短縮のため、詳細な記録が難しいといった課題がある。全文テキスト化し、マイニングすることで、この課題はある程度解消できるはずだ。

 さらに大きな効果が見込まれるのがモニタリング業務だ。コールセンターのマネジメントにおいて、最も大きな労力と時間を割いている業務なだけに、効率化に対する期待値は大きい。特にオペレーター評価では、評価サンプル通話数が増加し、公平性が増すことでモチベーションの向上につながるという。

セキュリティも万全!
クラウド上にファイルを残さない仕様で提供

朝倉 浩志 氏

NTTコミュニケーションズ株式会社
アプリケーション&コンテンツサービス部
テクノロジー部門 第四グループ(兼務)
AI推進室 担当課長
朝倉 浩志 氏

 NTT Comは2019年春、コンタクトセンター向け音声テキスト化サービス「COTOHA Voice Insight」をリリース。高度な音声認識機能をクラウドサービスとして提供している。

 アプリケーション&コンテンツサービス部 テクノロジー部門 第四グループの朝倉浩志課長は、「コールリーズン分析、クレームの抽出、成果をあげたアウトバウンドコールの分析、コンプライアンスチェックなど、さまざまな用途で手軽に活用できるサービスです。人手不足に苦しんでいるコールセンターの業務変革を推進したい」と説明する。

 サービス概要は図2の通り。クラウドといっても、パブリック型ではなく閉域網で行うプライベート型なので、情報セキュリティに関しても備えは万全だ。実際に、金融各社に代表されるように、音声ログの取り扱いには細心の注意を払うセンター運営企業が多い。「COTOHA Voice Insight」は、テキスト化した音声ファイルは自動的に消去される。また、生成されたファイルも7日間経過すると自動消去され、クラウド上にはファイルを残さない配慮がされている。

図2 COTOHA Voice Insightのサービス概要

図2 COTOHA Voice Insightのサービス概要

高い操作性、高精度の認識率──
安価で短期間に最先端の技術を利用

 現場における操作もかなり容易で、優れたインターフェイスを搭載している。コンタクトセンターの担当者が管理画面から音声ファイルをアップロード(API経由での自動アップロードも可能)すると、即座にテキスト化が施され、ダウンロードできる。いわば準リアルタイム型のスピーチ・トゥ・テキストで、タイムラグも少ない。

 最大の特徴は日本語の処理に長けている点で、NTTの研究所で蓄積された長年の研究成果が最大限に発揮されている。汎用辞書の性能が高いため、「チューニングレスでも十分に活用でき、稼働開始までの時間も大幅に短縮できます」(朝倉課長)という。それに企業ごとの専用辞書を組み合わせることで、音声認識システムにおける“永遠の課題”ともいえる認識精度も飛躍的に高めることが可能だ。顧客の発声は多少認識率が落ちる場合もあるが、「専用辞書のチューニング次第ではオペレーター・顧客の発声の認識率を平均で90%程度まで引き上げることができる」と自信を見せる。なお、同社では専用辞書の作成支援メニューも提供する方針だ。

 導入費用に関しては、運用するボリュームによるが「ミニマム構成(300時間)で月額25万円から」(朝倉課長)。申込金、初期の設定費用等は別途必要だが、数千万〜億単位と言われていたオンプレミス型とは比べるまでもない。もちろん、大規模センター向けにボリュームディスカウントも可能だ。

 高機能な日本語認識エンジンを安価かつ短期間で導入できるだけに、盛り上がりつつある音声認識市場へのニーズに応えられるサービスといえる。朝倉課長は、「契約確認、コンプライアンスチェックなど、録音データを聞き起こす必要のあるセンターは数多い。さまざまな用途で提案し、音声認識市場のすそ野を拡大したい」と意気込む。さらに、契約の獲得や顧客からの感謝の言葉をもらった「優秀な対応」の抽出も容易となるため、同社ではそれをベースとしたトークスクリプトの作成も提案する方針だ。

 実際に、後述する事例企業の1社、通信事業者の株式会社東名では、4名がかりで契約に関わる全通話内容を確認していたが、その負荷は大幅に軽減されている。人手不足は、オペレーターだけでなくこうしたリーダークラスの管理者にもおよんでいる。金融、通信、通信販売など、同じような課題を抱えているセンターには極めて親和性の高いソリューションといえそうだ。

toumei

Case Study

COTOHA Voice Insight®導入事例

株式会社東名

導入設計はノータイムで実現
音声テキスト化により大幅業務改善

左からCO事業部 事業部長(インタビュー当時)の立川将弘氏、CO事業部 事業部長(現任)の山田邦敬氏、CO事業部 品質管理課の不破瑠美氏

左からCO事業部 事業部長(インタビュー当時)の立川将弘氏、CO事業部 事業部長(現任)の山田邦敬氏、CO事業部 品質管理課の不破瑠美氏

 株式会社東名は、中小企業、SOHOオフィス向けに、光回線インフラやプロバイダーサービスを提供する通信事業者だ。2015年4月からは自社商材の「オフィス光119」の販売を開始。コールセンターのテレマーケティングにより営業を展開し、ユーザー企業は95,000社にもおよぶ。

 電話による営業は口頭での契約となるため、特定商取引法上の留意点や重要事項の説明が正しくなされているか通話内容を確認する必要がある。同社では「オフィス光119」のセールスに関してCO事業部が4名体制で、すべての通話内容を確認していたが、契約に関わる気を遣う内容のため、スタッフの精神的な負荷は高いものがあった。

 さらに、マザーズに上場している同社は、今後の東証上場を視野に入れ、さらなるコンプライアンス強化を図り、パトロールと呼ばれる通話チェックの頻度を大幅に増やすという新たなルールを設定することになった。そのため、品質管理のパトロールにはさらなる人員増も迫られていた。

音声のテキスト化により品質チェック効率は約30倍

 同社では業務効率化を考え、音声認識による通話内容のテキスト化を、2・3年前から検討しており、他社サービスを検討していたが、当時は認識精度の低さとコストの高さで実導入までは至ることはなかった。

 このような状況で、2019年4月にリリースされた「COTOHA Voice Insight」の提案を受け、その機能性とリーズナブルな料金体系から導入を決定、7月には運用を開始した。

 「導入への取り組みや設計作業は、ほぼノータイムでした」とCO事業部 事業部長の立川将弘氏は導入当初を振り返る。具体的な作業としては、クラウドコンタクトセンターシステムで取得した通話録音データ50〜100件分を、その日のうちに「COTOHA Voice Insight」にアップロード。翌日までにはすべてテキスト化されている。テキスト化された通話内容を4人の担当者で分担してチェック。導入前は4人の担当者が1日(8時間)がかりで15件をパトロールしていたが、導入後は4人が1時間で50〜60件をパトロールすることができるようになった。単純に計算すると、1件あたり約2時間かかっていた音声チェックが、わずか4分で完了できるため、作業効率は約30倍アップしたことになる。

営業教育や人事評価など活用の幅を広げる構想

 導入効果を試算すると、業務の効率化により人件費換算で大幅なコスト削減に相当する。また通話録音では、解約や違約金といった重要事項説明の個所を探すのが大変だったが、テキストと通話時間が合わせて表示されるので欲しい情報がすぐ視認できるメリットがある。「導入前は一日仕事だった業務が、導入後は自分のペースで業務時間を割り当てることができ、他の業務を実行する余裕ができました」とCO事業部 品質管理課の不破瑠美氏は説明する。以前はパトロールに時間が取れず、半月ほどチェックできない期間があったがそのような問題も解消されたという。

 今後の展開としては、「COTOHA Voice Insight」によりコンプライアンスを徹底させるだけでなく、営業トークの分析をすることで、機会損失をなくすため営業教育に活用できると考える。さらに、一般のお問い合わせ受付や障害対応などのテクニカルサポート部門への導入でも教育ツールとしての活用を視野に入れている。

 CO事業部 事業部長の山田邦敬氏は「顧客維持のため顧客のファン化を進めていくには、営業一人ひとりの品質を上げるため細かく見る必要があります。そのためには人事評価としての活用も考えていきたい」とさらなる活用に意欲的だ。

(2019年8月21日インタビュー)

お問い合わせ先

NTTコミュニケーションズ株式会社
TEL:0120-106107 受付時間:9:30〜17:00(平日)
URL:https://www.ntt.com/business/services/application/ai/cotoha-vi.html

お問合せ・資料請求

音声認識 / 生産性の向上 / AI(人工知能)

更新日:2020/02/20

sAI Phone

サイシード
詳細を見る
対象ユーザー IP電話を利用しているコールセンター
対象規模 5ブース以上
製品形態 SaaS
価格情報 初期費用:200万円
月額費用:30万円~(1500h~)通話時間による従量課金
製品概要 「sAI Phone」はオペレータがキーボードの入力なしで、FAQ検索と後処理ができる音声認識システムだ。特徴としては以下の3つが挙げられる。
1.次世代のFAQ検索システム「sAI Search」と連携し、シームレスにFAQ検索が可能――テキストから関連するFAQとタグがサジェストされ、オペレータは提示されるタグを直感的に選択するだけで目的のFAQに辿り着く。
2.後処理もドラッグのみで完結――企業の後処理フォーマットを事前に設定し、各項目ではテキストをドラッグするだけでほぼ後処理が完結する。
3.システム連携なしにブラウザからすぐに利用可能――IP電話を利用していれば、CRMやCTIとの連携なしにすぐにブラウザからの利用ができる。
 
  • 製品紹介

FAQ検索から後処理までクリックだけで完結!
開発不要の音声認識システム

sAI Phone(サイフォン)

サイシード

システム連携なしで導入 音声認識システム「sAI Phone」

 「弊社は音声認識の分野では後発の企業です。したがって、既存の音声認識システムの導入ハードルや実務的に使いにくいところを徹底的に排除していこうと考えました。」とサイシード CEO 中村 陽二 氏は語る。

 自社開発のAIを使ったFAQシステムやチャットボットを提供している同社が、新たに音声認識システムの提供をはじめた。「sAI Phone」の特徴は次の2点に集約される。

・コンタクトセンター運営側が、システム連携なしに簡単に利用できる

・オペレータは、問い合わせ対応の一連のオペレーションでFAQ検索から後処理までクリックだけで完結

 音声認識は手段であり、目的ではない。重要なのは、音声をテキスト化したあとにオペレータに適切なFAQを提示し、後処理の手間を削減することである(図1)。

図1 音声をテキスト化し、関連するFAQをオペレータに提示

図1 音声をテキスト化し、関連するFAQをオペレータに提示

 中村氏は続ける。「まずは音声認識システムをオペレーションに組み込んで、効果を検証すべきなのに、既存のサービスはサーバー構築やシステムの連携が必要で、それだけで少なくとも数百万円〜数千万円の開発費用と時間がかかってしまいます。sAI Phoneは、ブラウザからアクセスするだけで、ブース数に関係なく即日利用することができます(IP電話の利用を前提)」。

 初期費用200万円、月額費用も従量課金で30万円からという料金体系も魅力的なので、音声認識の導入に躊躇していた企業にとっては有力な選択肢になりそうだ。

次世代FAQシステムと連携 新たな検索ロジックで高機能化

 サイシードでは、「sAI Search」という次世代のFAQシステムを開発しており、最初からsAI Phoneとシームレスに連携されている。そして、このsAI Searchがサイシードの技術の肝だと言う。

 同社CTOの西田 圭嗣 氏は、「従来の検索システムは、ユーザーが入力した結果の一覧を提示し、結果から絞り込むのはユーザーに任せていました。しかし、“自分が何を検索すればよいのか”をうまく言語化できないユーザーが予想以上に多いことがわかりました。sAI Searchは、そのような“モヤモヤしている頭の中をシステム側が当てに行く”という検索思想で開発しています」と説明する。

 ユーザーはシステムから提示される関連タグを直感的に選択するだけで、目的のFAQに辿り着くことができる(図2)。検索の仕組みは、1990年代後半から20年あまりほとんど進化がないといえるが、sAI Searchの検索ロジックは日本初で、恐らく世界でも例がないと考えられる。

図2 ユーザーが選択したタグに対して、関連タグを提示

図2 ユーザーが選択したタグに対して、関連タグを提示

 今後の開発ロードマップとして、sAI Phoneはクラウドサービスという利点を活かして、クライアントの声を参考に絶え間ないUI・UXの改善を地道に続けていく。

 結局オペレータにとっての使いやすさが、対応品質向上と効率化につながるため“他社よりもちょっと使いやすい”を積み重ねていく。現在は、そのPoCに共同で取り組むパートナー企業を募集している。

お問い合わせ先

株式会社サイシード
AI事業部
TEL:03-6871-8691
URL:https://saichat.jp/saiphone/

お問合せ・資料請求

音声認識 / 品質の向上 / 生産性の向上

更新日:2020/11/12

AmiVoice CommunicationSuite Cloud

アドバンスト・メディア
詳細を見る
対象ユーザー コールセンター全般
対象規模 -
製品形態 -
価格情報 お問い合わせください
製品概要 オペレータ支援、全通話テキスト化、音声認識IVR、音声入力など、独自の音声認識技術「AmiVoice」を駆使して、コールセンターを支える斬新なソリューションを提供するアドバンスト・メディアは音声認識のトップランナーである。野村総合研究所との自動要約ソリューションの発表、独自のテキスト解析フィルターを用いた「クレームの可能性のある通話リスト」の自動生成など、他社に先駆け多方面で実用化されており、2020年9月現在、約340社のコールセンターへの導入実績を誇る。AmiVoice Communication Suite Cloudは、従来のオンプレミス製品をクラウドプラットフォームに構築し、直ぐに、安価に通話のテキスト化を可能にしたサービスである。
 

<導入事例> キャッチネットワーク

“手挙げ対応”もできる在宅環境を実現
全件テキスト化で「SVのお仕事」をフォロー

AmiVoice Communication Suite

アドバンスト・メディア

通話内容をリアルタイムでテキスト化する音声認識ソリューションは、導入すると“なくてはならないツール”になる。オペレータは、対話を続けながらFAQを検索するという苦労から解放され、SVもエスカレーションなどの際に音声通話を聞き返す負荷が減る。キャッチネットワークは、音声認識ソリューションをフル活用することで、離れた場所からでもSVが十分にフォローできる体制を構築。コロナ禍で、スムーズなリモートシフトを実現した。

安藤 潤 氏

株式会社
キャッチネットワーク
営業本部
お客様ふれあい室
カスタマーセンター
安藤 潤 氏

梅津 佳之 氏

株式会社
キャッチネットワーク
営業本部
お客様ふれあい室
カスタマーセンター
課長補佐
梅津 佳之 氏

 キャッチネットワークは、愛知県のケーブルテレビ事業者だ。コールセンターは、加入申し込みや受信機器の操作、番組に関する問い合わせなどに対応している。電話はフリーコールで、入電数は月に約9000件。IVRで、(1)加入問い合わせ、(2)機器の操作方法の案内、(3)契約内容の変更、(4)解約、(5)その他の5つに分類している。年中無休(9時〜19時)で稼働中だ。

 同社は2017年、テレワーク導入を見据え、トラムシステム(愛知県名古屋市、梶田幸宏代表取締役)が提供する、アバイア製PBX「AVAYA ACCS」を全社に導入。また、2019年にはアドバンスト・メディアのクラウド型音声認識ソリューション「AmiVoice Communication Suite(以下AmiVoice)」の運用を開始した。これにより、新型コロナ感染症の流行によって実施した、コールセンターの在宅シフトがスムーズに進んだ。

図 システム構成イメージ

図 システム構成イメージ

決め手は「業界特化型の辞書」 『4K放送』を正確に認識

 営業本部お客様ふれあい室カスタマーセンターの課長補佐、梅津佳之氏は、「音声認識ソリューションの導入目的は、オペレータのFAQ検索支援やSVの負荷軽減、VOC活用など。AmiVoiceを導入する決め手になったのは、放送通信業界向けの辞書を実装し、当時、使われ始めたばかりの“4K放送”というキーワードを認識できたことでした」と振り返る。

 従来、オペレータはFAQの検索に手間取ったり、電話を保留にしてSVに聞きに行くことが多かったが、オペレータの発話を認識し該当するFAQを提示する仕組みを導入したことでATT(平均通話時間)を短縮。CS向上にもつながった。

 オペレータの発話内容は、常にリアルタイムでテキスト化され、SVは管理画面上でそれを確認できる。これにより、オペレータのフォローや品質チェックにかかる負荷は大きく軽減されたという。

離れていても管理がラク リモートシフトで奏功

 コロナ禍において、これらのシステムが極めて有効に活用された。通信インフラは、固定電話からソフトフォンへの切替えのみで、スムーズにリモートシフト。音声認識ソリューションは、VPNの設定に多少時間がかかったものの、リモート環境でも活用できるようになった。個人情報の取り扱いについては、もともとISMS(情報セキュリティマネジメントシステム)を取得しており、これに準じて個室の用意や紙でメモを取らない、などのリモートシフトのルールも作成している。とくにメモについては、AmiVoiceを導入していたことが奏功し、ルール遵守につながった。

 また、AVAYA ACCSを全社に導入していたことから、在宅勤務の社員へのエスカレーションもスムーズだ。テキスト化したログの連携によって、迅速な対応につながっている。

 AmiVoice導入後、オペレータは、オペレーション画面のヘルプボタンからSVに助けを求めることができるようになった。つまり、リモートでも“手挙げ”ができる仕組みだ。

 センターの様子について、安藤潤氏は、「リモートワークに移行してからは、オペレータ業務の可視化ができていたことが役立っていると聞きます。オペレータからも、いつも見てくれているという安心感があるという声が挙がっています」と説明する。

 個室が用意できない、インターネット環境が整備されていないといったオペレータもいるため、従来のコンタクトセンターも稼働している。万が一に備え、センターを2部屋に分けて運用。管理画面上には実際の席順で配置し、在宅オペレータも含め、全席のパフォーマンスを1画面で確認できる。

画面1 座席表──Interactive Seat Map

画面1 座席表──Interactive Seat Map
※上掲の画面はサンプルです

公正な評価、ミスゼロを実現 “あって当たり前”のツールに

 今年7月から、モニタリング機能も活用。「ありがとう」などのキーワードやNGワードをもとにスコアを計測し月次評価としてフィードバックしている。「人手による評価よりも公平性がある」と、オペレータの反応も良好だ。

 また、ACW(後処理)も、テキスト化されたログから確認することができるため、固有名詞や数字などの記入ミスがなくなった。ミスを防ぐ機能は、オペレータの働きやすさにつながっている。

画面2 品質評価──SpeechVisualizer

画面2 品質評価──SpeechVisualizer
※上掲の画面はサンプルです

 「現場にとっては、早くもAmiVoiceは“あって当たり前”のツールになっています。オペレータが安心して働けるのも、SVがオペレータを十分に支えられているのも、AmiVoiceによって実現しています」(安藤氏)

 導入目的のひとつであった、VOC活用については今後の課題だ。

 梅津氏は、「お客様の声をもとに地区ごとの営業課題を抽出したり、番組制作にフィードバックしたいと考えています。しかし、テキスト化された膨大なログを活かすには、要約や分析が必要。そこにかかるコストと労力をどう捻出するかが課題です」と説明。センターに蓄積されたVOCをもとに、経営に貢献する窓口を目指す。

ユーザープロフィール

株式会社キャッチネットワーク

所在地:愛知県刈谷市野田町大ヒゴ1番地

設立:平成3年6月24日

資本金:24億3,750万円

代表者:代表取締役社長 松永 光司

従業員数:238名

事業内容:有線テレビジョン放送事業、電気通信事業、イベント事業 など

URL:https://www.katch.co.jp/

ジャパン・ペンション・ナビゲーター株式会社

お問い合わせ先

株式会社アドバンスト・メディア
CTI事業部
TEL:03-5958-1091
URL:https://www.advanced-media.co.jp

お問合せ・資料請求




トレンド・ガイド