音声認識 / ASP・SaaS・クラウド / AI(人工知能)

更新日:2018/11/15

MSYS Omnis

丸紅情報システムズ
詳細を見る
対象ユーザー コールセンター全般
対象規模 -
製品形態 クラウド(一部オンプレミス)
価格情報 <POC参考価格>(イニシャル)100万円、(ランニング)295,000円(月額) ※税抜
製品概要 MSYS Omnisは、Google Cloud Platform(TM) を活用した次世代コールセンターソリューション。これまで、音声認識を導入しようとすると高額なシステム投資が必要だったが、Google(TM) が提供するAPIを利用、かつクラウドで装置の購入を不要としたことで、安価に音声認識を実現する。さらに、Googleが提供するAPIを組み合わせて、コールセンター向けソリューションを独自に開発――AI FAQ、文章要約、分析、IVRを低コストで実現する。コールセンター業務の効率化だけではなく、分析のしやすさや、顧客へ提供するサービス全般のスピード化を目指すソリューションである。
 
  • 製品紹介

Google™の音声認識技術を活用!
コールセンターの自動化を実現する「Omnis IVR」をリリース!

MSYS Omnis

丸紅情報システムズ

1カ月でスタートできる高精度な音声認識──。丸紅情報システムズが提供するクラウドAIサービス「MSYS Omnis(エムシス オムニス)」は、Google™の最先端技術を活用することで「チューニングの手間なし」で実用レベルの認識精度を実現する。コールセンターにおける通話音声の活用を支援する方針だ。

 音声認識システムの実用がいよいよ本格化しつつある。編集部が毎年実施している「国内コールセンター実態調査」では、「導入予定のITソリューション」について、「音声認識システム」と回答した企業は25.0%。昨年の同調査と比較して15.7ポイント増加している。近年、実際に導入し、一定の成果を生んでいる事例があることも検討を後押ししている要因だ。

 導入目的も、苦情の抽出、応対品質のチェック(モニタリング)、応対履歴入力の効率化、顧客満足度向上など多種多様で、活用シーンは確実に拡大している。ところが、費用対効果が発揮されるのは「50席規模以上」といわれており、事例の多くは大規模センターだ。具体的には、初期導入コストに加え運用開始後のチューニングコストがネックとなり、導入を断念せざるを得ないケースが少なくない。

 こうしたコスト障壁を取り除くソリューションとして、丸紅情報システムズはクラウドAIサービス「MSYS Omnis(以下オムニス)」の提供を開始した。

 オムニスは、 Googleが提供するクラウドコンピューティングのプラットフォーム「GoogleCloud Platform™(以下GCP)」上で提供するGoogle Cloud Speech to Textを利用し、コールセンターでの利用シーンに合わせてカスタマイズを施した従量課金制のクラウドサービスだ。音声認識を中心に、文章要約や翻訳、分析などの機能を持つ()。音声認識は、全文テキスト化が可能。用途に応じてリアルタイムで認識するか、録音音声を認識するバッチ型かを使い分けることができる。Avaya、Genesys、BIZTEL、Pure Cloudなど、代表的なコンタクトセンタープラットフォームとの連携が可能だ。2017年夏の提供開始以来、すでに300社以上の引き合いがあるという。

図 オムニス──ソリューション群

図 オムニス──ソリューション群

1カ月でスタートできる高精度な音声認識

 オムニスの特徴は、「低コスト・短納期」「高精度な音声認識」「安全性」の3点にある。

 「低コスト・短納期」は、クラウド提供によってもたらされた。チューニング不要のため、約1カ月で運用を開始できる。

 負荷が高い処理はすべてクラウド上で実行するため、1サーバーで250席まで対応可能。オンプレミスシステムと比較すると、およそ10分の1のコストで済む。スモールスタートで効果を測定しながら、運用の継続および拡張を見極められる。一般的な単語に関する音声認識エンジンのチューニングは、Google側が機械学習を用いて行っているため、現地作業やベンダー依頼はほぼ不要だ。さらに、音声認識以外の諸機能はライセンス購入で、必要に応じて取捨選択することによりコストのスリム化を図れる。

 「高精度な音声認識」は、Googleがグローバルに展開しているコンシューマービジネスで収集したデータを基盤としている。常に最新の口語表現や書き言葉を取り込んでいるため、チューニングレスでも精度の高い通話音声テキストが出力可能だ(解説[1])。現在、120以上の言語と方言に対応。日本語の方言による発話もスムーズにテキスト化できるという。

 機械学習を活用した音声認識技術はさまざまな企業がサービス化しているが、検索サービスの利用者が他を圧倒しているうえに、AIの技術者を数千人単位で擁するGoogleに一日の長があるという見方は強い。最新のアルゴリズムを活用した、高精度かつ利便性の高い音声認識を先行運用できることも魅力の1つだ。

解説[1]チューニング

「ほぼ手間なしで高精度」を実現

 オムニスの音声認識機能は、GCP上の「Google Cloud Speech to Text」を通じてGoogleの音声認識エンジンを利用しているため、“チューニングレス”がメリットだ。認識精度は平均で85%超。オペレータ側の発話であれば95%前後の認識精度を維持している。

 一般的に、「(コールセンターでは)チューニングなしの音声認識はありえない」といわれるが、コンシューマ向けに提供されている検索エンジンや「OK,Google」の発話で起動するモバイル音声アシスタントから収集したデータをリソースとした機械学習のため、日常で使う書き言葉/話し言葉の認識精度は圧倒的に高い。さらに製品やサービス名も含む新しい単語や言い回しにも即時対応できる。コールセンターにおける顧客応対では専門用語は極力使わず、“日常で使う言葉”に言い換えることも多い。チューニングレスでも、問題なく運用できるセンターは多そうだ。

 もちろん、BtoBやヘルプデスクは企業独自の略語や用語が問い合わせに含まれる可能性も高いが、その場合はオムニスの管理者UI(ユーザーインタフェース)から単語の辞書登録が可能(図)。これにより、認識されにくい固有名詞も認識しやすくなり、「完済」「関西」などの同音異義語のうち特定の単語を優先して変換できるようにするなど、認識精度の向上を実現する。なおオムニスは、企業ごとに専用のインスタンスを構築しているため、登録された辞書はその企業だけのものとなる。

図

拡大画像はこちら

 「安全性」については、グローバルのセキュリティ基準に準拠していることが挙げられる。具体的には、受託会社の内部統制基準である「SOC(Service Organization Control)」やカード情報セキュリティの国際統一基準「PCI DSS(Payment Card Industry Data Security Standard)」、情報セキュリティマネジメントシステム「ISMS(Information Security Management System)」に対応。さらに、日本の政府系シンクタンクFISC(金融情報システムセンター)によって作成された安全対策基準にも見解を明示している。このため、金融機関をはじめとするセキュリティポリシーが厳格な業界でも、十分に要件を満たすことが可能だ。

 懸念されることが多いネットワークリソースの負荷増大によるサービス機能停止の可能性についても、3年間で300億ドル近くを投下してインフラ増強を図るなどして、リスク回避に努めている。

音声テキスト化ニーズに応え 機能拡充、サービス開発

 認識した通話音声テキストを活用するための諸機能は、Googleが提供するAPI、または連携パートナーの提供機能をアプリケーションで提供する。

 例えば、IVRの煩わしいプッシュ操作をなくし、顧客満足度を高める「音声認識IVR」(解説[2])。顧客の発話内容に対し、適切なオペレータにルーティングする他、「音声合成」と組み合わせて“音声ボット”を構築することも可能だ。

解説[2]音声認識IVR

“1回の発話”で適切なオペレータに接続

 音声認識IVR「Omnis IVR」は、音声認識、自然言語処理技術の利用により、顧客が発話した内容を把握し、適切なオペレータにルーティングする機能を提供する。

 図のように通常のIVRと同様に自動応答ガイダンスを再生し、発話を促す。「ギフトカードはどこで買えますか」といった顧客の質問の意図を把握し、該当するスキルグループに割り振る。製品やサービスの数が多く、スキルグループが複雑なコールセンターでも、1回の発話でオペレータに辿りつけるため、既存のIVRのように長く複雑な分岐によるガイダンスは必要ない。電話の顧客体験におけるマイナス要因の1つである「アナウンスの間、待たされる」「IVR操作の煩雑さ」の解消による顧客満足度向上が期待できる。

 さらに、音声合成の活用による「音声ボット」も実現可能だ。IVRフローに従って作成した会話シナリオを学習。顧客の発話内容に対し、適切な回答を自動応答し、解決まで導く。例えば、「住所変更」であれば、最初に氏名を確認し、発話が認められたら現住所、新住所の確認からオペレータの応対といった段階的なコミュニケーションも実現できる。コールリーズンに応じて、オペレータに接続するだけでなく他のチャネルに誘導するなど、柔軟な設計が可能。例えば音声ボットにAHTが短く比較的呼量が多いコールを振り分け、オペレータは高額商品の購入前相談などの応対品質を重視すべきコールに集中させるなど、リソース最適化も果たすことができそうだ。

図

拡大画像はこちら

 応対業務の効率化であれば、回答支援「AI FAQ」や会話要約「Summarize」が活用できる。AI FAQは、自然言語処理により、通話音声の認識結果から顧客の問い合わせ内容を把握し、適切な回答候補を提示する。人手不足が深刻化している状況においては、新人オペレータの教育時間の短縮につながりそうだ。

 Summarizeは、応対履歴入力の省力化とともに、入力内容の均質化によるVOC分析の精度向上に寄与する。要約文の長さは可変式で、要約するためのルールは自動生成される。手間がかからず、かつ柔軟な運用を実現した。

 なお、音声認識した結果を、セールスフォース・ドットコムが提供するCRMプラットフォーム「Salesforce Service Cloud」の画面に取り込めるアプリケーションを開発し、2019年3月に専用のマーケットプレイス「AppExchange」に拡充する予定だ(解説[3])。

解説[3]AppExchange

セールスフォースのCRMと連携しオペレータの負荷を軽減

 テキスト化した通話音声は、オペレータの回答支援や要約、VOC分析(分類)など、応対業務の効率化や製品の改善プロセスの素材として使われる。結果、導入の際に、課題としてあげられやすいのが「CRMシステムとの連携」だ。

 例えばFAQなどの自動表示の場合、応対の状況に応じてCRMシステムの顧客情報画面と音声認識の経過表示およびFAQ画面はオペレータが手動で切り替えるか、PCモニターを2つ用意して対応していた。いずれも、顧客応対のたびに、2つの画面を見比べることになるため、オペレータに負担を強いていた。

 そこで、丸紅情報システムズは、主要なCRMベンダーのセールスフォース・ドットコムの「Salesforce Service Cloud」のAppExchange化に着手した。AppExchangeは、セールスフォース・ドットコムが提供するビジネスアプリケーションのマーケットプレイスを指す。

 AppExchange化により、アプリケーションをインストールするだけで、Salesforce Service Cloudの画面に音声認識画面を組み込むことが可能だ(画像)。さらに、認識結果を応対履歴として1クリックで登録できる。なお、導入費用は、オムニスと同水準。2019年3月までに提供開始予定だ。

図

 他のコールセンター向けの新機能の拡充については、直近ではテキストや画像から感情を分析する機能の取り込みを図る計画だ。音声テキスト化のニーズは、会議や対面店舗や対面営業など「会話」が発生するあらゆる場面から検証する考え。すでに、会議での利用を想定した議事録作成ソリューション「Omnis Meeting」(解説[4])の提供を控えている。

解説[4]議事録作成ソリューション

対面でのコミュニケーションもテキスト化

 会議の議事録作成に不可欠な、会議音声の聞き起こし。一般的には会議時間の1.5倍〜3倍の時間を要する。そのうえ、時間が経過するとともに記憶が薄れるため、要点整理が難しくなり、より多くの時間を費やすことになる。

 2018年12月に提供開始する予定の議事録作成ソリューション「Omnis Meeting」は、オムニスの音声認識機能を利用し、書き起こし作業を効率化する。マイクで集音した音声ファイルのテキスト化および要約が可能だ(図)。会議音声には、機密事項が含まれる可能性が高いが、GCPはグローバルのセキュリティ基準に準拠している。

 また、近年は対面店舗や対面営業の通話録音を行う企業は珍しくはない。証券販売や旅行代理店など、業種はさまざまだ。主にコンプライアンス管理とVOC(顧客の声)活動に利用されている。

 コンプライアンス管理は、会話のリアルタイム音声認識による能動的なアプローチが可能だ。例えば、証券会社であれば、「値上がりします」など、あらかじめ設定したNGワードが発話されると、管理者にアラートを発報する仕組みを構築できる。VOC活動は、会議の議事録と同様、書き起こし作業の効率化が期待できる。

 このほか、面談(フィードバック)の記録など、利用者の発想次第であらゆる業務の効率化・自動化を実現できそうだ。

図

 次いでオムニスを先行導入した3社の事例を紹介する。

ユーザー導入事例

MSYS Omnisの導入実績

株式会社横浜銀行

応対内容の記録や分析の簡易化を実現
応対品質向上、サービス改善に取り組む

 地方銀行の最大手である横浜銀行は、通話内容の記録業務の簡素化によるオペレータの負荷軽減、およびテキスト化で正確に把握される応対内容の分析データとしての活用など、応対品質の向上やサービスの改善を目的に試験導入を実施している。

図

株式会社イントラスト

先進技術の導入による業務改善に挑戦
サービス品質と生産性の向上を目指す

 総合保証サービスを手掛けるイントラストは、顧客とオペレーター間の通話内容の音声認識、文章要約により、(1)オペレータ業務のサービス品質向上、(2)業務効率指標CPH(Call per head)アップ、(3)採用コスト削減による生産性向上を目指している。

図

大東建託株式会社

多言語対応の音声認識AI導入により
1件当たりの対応時間を約45%短縮

 大東建託パートナーズは、将来の総合コールセンター化に向け、サポートセンターの品質向上と効率化を目的に「MSYS Omnis」の試験導入を実施。1件当たりの対応時間をおよそ46%短縮し、総合コールセンター化後は年間約3億円の経費削減を見込む。

図

お問い合わせ先

丸紅情報システムズ株式会社
CRMソリューション事業本部
TEL:03-4243-4300
E-mail:msysgcp@marubeni-sys.com
〒169-0072
東京都新宿区大久保三丁目8番2号新宿ガーデンタワー
URL:http://www.marubeni-sys.com/msys_omnis

お問合せ・資料請求





トレンド・ガイド