コールセンターシステム機能|音声認識テキスト化|トラムシステム
iPhoneの「Siri」「OK Google」やAIスピーカーなど、音声認識については日常生活で広く利用させるテクノロジーとして認識されています。コールセンターでは10年以上前から音声認識技術は施行されてきましたが、AIアルゴリズムの活用もあり、コールセンターでも実用化が進んできたようです。
自宅でのAIスピーカーなどの利用は、音声で何らかの検索や注文などテキスト入力の代替としての活用方法ですが、コールセンターの場合、通話内容をテキスト化する“音声認識テキスト化”が目的になっています。
目次
音声認識テキスト化システム利用状況
コールセンターにおいて、音声認識テキスト化システムに対する興味の高さが際立っています(コールセンター白書2018)
特に2017年と2018年を比較した場合にも、その増加率が顕著となっており、2017年以降の様々な
音声認識テキスト化システムを活用した事例が出てきたことにより、一機にその関心が高くなったと考えられます。音声認識テキスト化システムを実際にどの様に活用しているか?という点については、コールセンター白書での統計は無いものの、実際のコールセンターの現場では以下の様な活用が多くなっています。
1.応対履歴入力の簡素化
顧客との通話内容結果を応対管理システムに向かって履歴入力する際、通話内容を全て入力する訳にはいきませんし、通話内容を失念してしまうこともあります。通話録音システムにて通話内容を再生し、聞きおこして確認することは可能ですが、非常に時間が掛かります。(通話時間が10分だとしたら、聞きおこしをして、該当箇所の通話を発見するには、およそ3倍の時間がかかると言われています)
その際、音声内容がテキスト化されていれば、単語やフレーズで検索するこで、該当の通話をすぐに発見することができます。
2.オペレータ支援AIの一部としての活用
別途ご紹介するオペレータ支援AIでは、音声認識テキスト化をもとに、FAQや他のデータベースから回答のリコメンドをする仕組みです。三井住友銀行コールセンターでの事例など先端のコールセンターでの活用事例がこれにあたります。
3.監査目的
通話録音システムの活用目的と同様ですが、顧客からのクレーム対応など、万が一に備えて、通話内容をテキスト化しておくことで、その対応を迅速に行うことが可能となります。
4.オペレータモニタリング
コールセンター管理者が、音声のリアルタイムモニタリングの代わりに、音声テキストをリアルタイムにモニタリングしている事例があります。音声モニタリングの場合、同時に聞くことができる対象オペレータは1名ですが、テキスト化された文章に対しては複数人のオペレータの管理を同時に行うことができるメリットがあります。
音声認識テキスト化の技術について
そもそも音声をテキスト化する技術はどの様なものなのでしょうか?
これまでは「音響モデル」という手法によりテキスト化を実現していました。音声の音響的な特徴と言語的な特徴の組合せによりテキスト化を実現しています。音響的な特徴とは、認識対象の音素がそれぞれどのような周波数特性を持っているかを表したものですが、一方で言語的な特徴とは、音素の並び方に関する制約を表したもので言語モデルと呼ばれています。例えば「あなた (a n a t a)」という発声の直後には「が (g a)」や「は (w a)」などの発声が続く確率が高い、などの制約である。
ここで課題となるが「認識率」です。録音された通話内容がどの程度正確にテキスト化されるのかということです。認識率が低ければ全く使い物になりません。
音声認識テキスト化のソフトウエアメーカは上記の音響モデルと言語の特徴をデータベース化し、認識率を高める努力をしてきました。
しかし、昨今ではAIアルゴリズムを活用して音声認識テキスト化を実現しています。IBM Watsonによる音声認識テキスト化などがその例です。機械学習や深層学習が可能になったことにより。音響モデルと言語的特徴の実績を学習させることで、より精度の高い音声認識テキスト化が実現できるようになってきました。
コールセンターシステムにおける音声認識テキスト化システムの位置づけ
コールセンターには利用者とその対応をするオペレータそして管理者が存在します。対象者毎に必要な機能は以下の通りです。
利用者向け機能
・電話番号・電話回線
・PBX/ACD
・IVR
オペレータ向け機能
・応対履歴管理機能
・CTI(ComputerTelephonyIntegration)機能
・FAQ機能
・電話機、ソフトフォン機能
・通話録音再生機能
★音声認識テキスト機能
管理者向け機能
・KPIレポート機能
・オペレータ管理機能
・通話録音再生機能
★音声認識テキスト機能
・QM(QualityManagement)機能
・WFM(WorkForceManagement)機能
・テキストマイニング機能
音声認識テキスト化システム機能
音声認識テキスト化システムは通話内容をテキスト化するのですが、テキスト化のタイミングによって機能が分かれます。
①バッチ処理によるテキスト化
バッチ処理によって通話録音のデータをテキスト化する機能です。1日1回程度を目途として当日分の音声データをテキスト変換し、保存します。
これは5年以上前から実現していたシステム機能で、主に監査目的で使われています。
②リアルタイムテキスト化
リアルタイムでのテキスト化表示を行います。顧客とオペレータの通話内容を分けて表示します。通話内容の表示は専用のソフトウエアにて実現します。
③通話タグ、アラート機能
リアルタイムのテキストに対して予めアラートすべき通話が発生した場合には、そのメッセージに自動的にタグをつけたり、管理者へのアラート通知するような機能です。
④CTI連携
各オペレータが自分の通話内容を確認したい場合があります、通話内容を失念してしまった場合でも、②のテキスト化ソフトウエア画面とCTI連携することにより、該当履歴に対する通話内容をテキストにて確認することができます。
⑤キーワードスポッティング機能
予め、キーワードを指定しておくことで、そのキーワードを顧客又はオペレータが通話したタイミングで、何らかのドキュメントやURLページを自動起動することできる機能です。例えば、「入会手続きですね」とオペレータが通話したタイミングで、入会手続きというキーボードをもとに、入会手続きのマニュアルを自動的に画面に出力するようなことが実現できます。
⑥品質管理機能
テキスト化された通話内容に基づき、オペレーター通話内容に対する評点を行う機能です。
冒頭挨拶・クロージング挨拶が行われたか? 通話スピードが適当か?などを自動評点します。
音声認識テキスト化システム設計の論点
音声認識テキスト化システムを導入する上では以下の様な観点での事前検討が必須です。
①音声認識テキストを導入する目的・想定される業務内容
②通話録音システムについて
通話録音システムについてはステレオ録音が前提となります。通話録音システムからの情報取得方式を検討します。モノラル録音をしている場合には、別途音声認識テキスト専用の機器が必要となります。
③バッチ処理型とするかリアルタイム型とするか
導入目的に応じてバッチ型かリアルタイム型とするかを選定します
④他システムとの連携
音声認識テキストを使って他システムとの連携を行うか否か。テキストマイニングシステムや
要約システム、オペレータ支援AIなどが考えられます。
その場合、他システムとの連携を実現する為のAPIの有無を確認します。
⑤CTI連携
応対管理システムからオペレータ自身の通話テキストを再生確認できるように、通話ID(UCID)などによって、通話データと音声認識テキストを紐づけする設計を行います。
まとめ
音声認識テキストは非常に注目されているテクノロジーです。
デジタル変革が進み、テキストコミュニケーションが増える一方で、AIスピーカーの台頭により音声認識技術が注目されています。コールセンターに於いても人材不足と新人の離脱という課題を解決する為に、AIや音声認識技術が注目されてきました。
自社の業務要件を鑑み、音声認識テキスト化の活用を検討してください。
WRITER
トラムシステム(株)メディア編集担当 鈴木 康人
広告代理店にて、雑誌の編集、広告の営業、TV番組の制作、イベントの企画/運営と多岐に携わり、2017年よりトラムシステムに加わる。現在は、通信/音声は一からとなるが、だからこそ「よくわからない」の気持ちを理解して記事執筆を行う。