Voice

ビジネスフォンやクラウドPBXを電話・通信のプロがわかりやすく解説!

\ クラウドPBX資料 /

無料ダウンロード

フリーワード検索

2021.06.01

コールセンター / 仕組み / AI / 音声認識 / Amivoice /

音声認識ソリューションのAmiVoiceとは丨特徴・魅力・導入事例を紹介|トラムシステム

AIによって声を文字に変換する音声認識技術は、iPhoneのSiriやAmazonのAlexaなど今や身近な存在となっています。コールセンター(コンタクトセンター)などの企業においても、議事録作成や顧客対応などのシーンで音声認識技術は広く活用され始めています。

この記事では、様々な業界で導入されている音声認識システム「AmiVoice」について、その特徴、魅力、導入事例などを詳しく解説していきます。

音声認識とは

音声認識とは、人間の音声をAIが認識してテキスト化や発声している人を識別する技術を指します。身近なものであればAppleのSiriや、声でオンオフの切り替えができる家電など、すでに様々な分野で利用されています。

企業においては、主にコールセンターやコンタクトセンターで導入が進んでおり、クレーム対応や対応品質の向上、業務効率化や正当なオペレータの評価などに活用されています。

コールセンターが音声認識技術を活用するメリット

音声認識技術は、特にコールセンターにおいて大きな効果を発揮します。主なメリットを3つ紹介しましょう。

1.顧客からのクレーム対策
音声認識機能では、人の声のトーンや喋るスピードなどを分析し喜びや怒りなどの感情分析が可能です。そのため、顧客の感情をリアルタイムに察知し、必要に応じて上長に通知することで速やかにオペレーターのフォローを行うことができます。

クレームに発展しそうな問題を未然に防ぐだけでなく、その際の分析データを確認し、オペレーター教育に活かすことで、応対品質や顧客満足度の向上にも役立つでしょう。

2.オペレーターの離職率低下
オペレーターの離職率の高さに頭を悩ませるコールセンター担当者は多くいますが、この問題も音声認識を活用することで改善が期待されます。

顧客からの無理難題やクレームによってオペレーターに過度なストレスがかかると、声のトーンが下がったり、言葉や言い回しが乱暴になったりします。音声認識技術では、これらを察知することで、リーダーやSV(スーパーバイザー)が間に入って対応のフォローを行うことが可能になるのです。

3.オペレーターの業務負担の軽減
顧客との通話後は、対応履歴やレポートを入力することが一般的ですが、これらの後処理に時間と手間がかかることで応対効率が低下しているセンターも多くあります。

音声認識技術を活用すれば、顧客との通話中に発せられた言葉を自動でテキスト化することができるため、その後の対応履歴・レポート入力の手間が大幅に軽減します。

また、通話中のキーワードを拾い、自社のFAQや資料の自動検索を行うことで、オペレーターが1からマニュアルなどを探す時間が短縮され、スピーディかつ的確な回答が可能になります。

様々な音声認識ソリューションを提供するAmiVoiceとは

「AmiVoice」は、音声認識市場で6年連続シェア1位を獲得しているAI音声認識システムです。

提供会社であるアドバンスト・メディア社は、1997年に設立された企業です。独自の音声認識技術の研究・開発と、その技術を活用した音声認識ソリューションの開発、販売などを行っています。

コンタクトセンターにおけるAmiVoiceの導入実績は343社を超え、音声認識市場のマーケットリーダーと言える企業です。

参考:アドバンスト・メディア

AmiVoiceの仕組み

音声認識は、声の情報と言語情報を密接に組み合わせながら、音声を文字に変換しています。具体的には以下のような手順で行われます。

(出典:アドバンスト・メディア)

1.録音した音声のコンピュータ用にデジタルデータへ変換(音響分析)
2.音響分析で変換したデータがどの音に近いか事前に学習したデータと照らし合わせパターン認識をする(音響モデル)
3.特定された音を発音辞書と照らし合わせて一番近い単語を検出する(パターンマッチ)
4.単語同士の関係を調べてより正確な文章を組み立てる(言語モデル)

ステップ1.音響分析
まず、音声から特徴量(周波数や音の強弱)を抽出し、AIが認識しやすいデータに整えます。

具体的に説明すると、AIは人間のように音声を認識できないため、アナログ信号である元の音声をコンピュータが認識できるようにデジタル信号の波形に変換して、音素を抽出しノイズを除去する、といった作業を音響分析と言います。

ステップ2.音響モデル
そして、データ化した特徴量をAIが事前学習したデータと照らし合わせて、発話された声の特徴量がどの音素モデルにどれくらい近いかを計算します。この作業を「音響モデル」といいます。

ステップ3.パターンマッチ
次に、先ほどの音素モデルがどの単語と近いかを発音辞書を使用して判断します。音素を単語単位で組み立てていきます。音響モデルは声の最小単位の”音素”ごとにモデル化されており、音素音響モデルを発音辞書に従って連結して、最も近い単語を検出します。

ステップ4.言語モデル
最後に、文字列や単語列が日本語として適切かを評価するために言語モデルという機能が使われます。日本語テキストを多く集め、統計処理したものが言語モデルです。検出した単語と、前後の単語の関係性を精査し文章化する作業を行います。

AmiVoiceの魅力・特徴

国内シェアNo.1を誇るAmiVoiceは「いつでも、どこでも、誰でも」様々なシーンで利用できることが大きな魅力です。

AmiVoiceのどのような特徴が、それを可能にしているのでしょうか。ここからは、特にAmiVoiceが幅広い業界・企業に選ばれている理由を紹介しましょう。

会話スピード・アクセントに左右されない

自然言語処理技術(NLP)により、わざわざオペレーターのクセや話し方を学習させる必要がありません。

本来、自然言語処理によって人間が日常的に使っている自然言語をコンピューターに処理させるためには、膨大な機械可読辞書が必要です。

しかし、AmiVoiceは20年以上を超えるノウハウの蓄積があるため、改めて登録する必要なく誰でもすぐに使用できます。

高品質・高速で認識

AmiVoiceは長・短期記憶技術をエンジンに実装しており、高精度・高速に認識が可能になっています。

長・短期記憶(Long short-term memory、略称: LSTM)技術とは、人口回帰型ニューラルネットワークが基本設計となっており、単なるデータ点(例:画像)だけではなく、全データ配列を処理することが出来ます。

例として、繋がりのある音声や手書きの文字などの認識が可能です。

例えば「A製品について」とお客様が話し始めるとします。これだけではA製品の話ということしかまだ分かりません。

次に「資料を」と言うとします。そこで初めてAIは「資料を必要としている」と認識しますが、前の「A製品について」を記憶していなければどの資料か分かりません。

そこでこの長・短期記憶技術によって、「A製品の資料が必要」という繋がりを持たせることで、正確かつ高速な認識が可能になるのです。

高度なノイズ除去機能

周囲の話し声や雑音は認識率を低下させる原因となります。

AmiVoiceでは、世界トップクラスの技術により強力なノイズ除去が可能です。不特定多数の人が会話をするコールセンターやオフィスはもちろんのこと、騒音の多い工場、道路沿い、飛行機や電車の近くなど場所を選ばず利用ができます。

元の音声データも保存

AmiVoiceは高性能エンジンによって高速に音声データをテキスト化すると同時に、元の音声データも保存されます。これにより、後で元の音声を聞きながらテキストを修正するなど、音声データとテキストデータを合わせた活用も可能です。

AmiVoiceの導入・課題解決事例

すでに多くの企業・業界でAmiVoiceのソリューションが導入され、その効果を実感しています。今回は、様々な業界や業務でのAmiVoiceの導入事例を紹介します。

コールセンター・コンタクトセンター

AmiVoiceは、次のようなお悩みや課題を持つコールセンター・コンタクトセンターにおすすめです。

・オペレーター業務、管理者業務を効率化したい
・応対品質を向上させたい
・通話録音データを活用したい

例えば、株式会社JALカードでは、テキストデータが必要な際は音声データを聞きながら人力で書き起こしする必要があり、非効率な点が課題でした。

「AmiVoice Communications Suite」を導入することで、通話録音の書き起こしが可能になり業務効率化に貢献できました。データを探す際にも、応対IDや電話番号などで検索できるため簡単に見つけることが出来るようになりました。

事例の詳細はこちらから確認できます。

医療

AmiVoiceは、次のようなお悩みや課題を持つ医療機関におすすめです。

・キーボードを使用せずにリアルタイムで診断内容や紹介状を作成したい
・指導文などレポート作成に必要な時間を減らして作成数を増加したい
・詳細な内容を自在に作れるようにしたい

例えば、医療法人社会福祉法人仁生社 江戸川病院では、手書きカルテから電子カルテへの移行を考えていましたが、特に年配のスタッフがパソコン操作が不得意である点が課題となっていました。

「AmiVoice Ex7」を導入することで、キーボードを使わずにその場で正確でスムーズな電子カルテ作成が実現。これまでのキーボードと違い入力スピードが早いため、紹介状・保険会社の書類・介護認定の報告書などにも活用しています。

事例の詳細はこちらから確認できます。

建設・不動産

AmiVoiceは、次のようなお悩みや課題を持つ建設・不動産会社におすすめです。

・建築検査や管理業務の効率化をしたい
・議事録作成を効率化したい
・ハンズフリーで作業を効率化したい

例えば、飛島建設株式会社では、定例会議の議事録の書き起こし作業に多大な時間と労力がかかっていました。

「AmiVoice ScribeAssist」導入したところ、議事録作成にかかる時間は以前の3割程度に削減されました。音声とテキスト化されたデータは紐付いているため、微修正の際には聞きたい部分だけを再生できます。テキスト化されたデータを保存・管理することで、備忘録としても活用しています。

事例の詳細はこちらから確認できます。

開発ツール・モバイルアプリ

開発ツール・モバイルアプリについて次のようなお悩みや課題を持つ企業にも、AmiVoiceはおすすめです。

・アプリに音声認識を組み込みたい
・外国人向けに多言語対応したい
・音声認識の効果的な組み方が分からない

例えば、Hamee株式会社では、子供向けの音声チャットロボット「Hamic BEAR(はみっくベア)」のメッセージの文字化に音声認識を組み込みたいという要望がありました。

そこで「AmiVoice Cloud WebSocket API」を採用し、子供がHamic BEARに話しかけるとリアルタイムにテキスト化させることに成功。さらに、単語登録をしておけば名前やあだ名も認識することが可能です。

テキスト化されたデータは、保護者のスマートフォンアプリに送信させる仕組みを実現することができました。

事例の詳細はこちらから確認できます。

製造・物流・流通

AmiVoiceは、次のようなお悩みや課題を持つ製造・物流・流通業界にもおすすめです。

・作業効率が悪く人件費の負担が大きい
・手作業やキーボード入力によるデータエントリー作業に時間がかかりすぎている
・作業者同士の情報交換を円滑にしより安全な体制を保ちたい

例えば、株式会社銀座コージーコーナーでは、物流センターにおける、各店舗への商品配送業務の作業効率向上とミスの削減に取り組んでいました。

そこで「AmiVoice keyboard」を導入。音声指示・音声入力により、ハンズフリー・アイズフリーを実現し、作業ミスをなんと33万分の1まで大幅減することが出来ました。

さらに音声認識を利用した声出し確認ができるようになったことで、商品から目を離すことが減り、作業効率は1時間あたり20%増加することが出来ました。

事例の詳細はこちらから確認できます。

営業日報・報告業務

AmiVoiceは営業日報・報告業務について、次のようなお悩みや課題を持つ企業にもおすすめです。

・応対記録や業務報告書の作成を効率化したい
・お客様の声を蓄積してデータ活用したい
・営業日報の作成が非効率なので報告者の負担が大きい

例えば、一般社団法人共同通信社では、事件やスポーツなどの現場から編集部に写真を送信する際、よりスピーディで円滑な作業を目的として写真のキャプション(解説)を音声で吹き込む運用を行っています。

しかし、集中力と迅速性が求められる状況でデータを受け取った編集担当者の負担は大きく、以前から「音声をテキスト化してほしい」という要望が多く上がっていたようです。

そこで「AmiVoice Ex7 Business」を導入し、現場カメラマンの音声を認識し、テキスト化することで、作業を効率的かつ迅速に行えるようになりました。AmiVoiceでは専門用語の単語カスタマイズも可能なため、一般的には使われないような言葉も事前設定により認識が可能になります。

事例の詳細はこちらから確認できます。

議事録・書き起こし

AmiVoiceは議事録・書き起こしに際して、次のようなお悩みや課題を持つ企業にもおすすめです。

・AIを利用して議事録作成を効率的に行いたい
・クラウドサービスはセキュリティリスクが心配
・オフライン利用だとバージョンが古くなっていくのではないかと不安

例えば、株式会社ティーネットジャパンでは、議事録の作成に会議時間の2~3倍もの時間を要し、効率が悪いことが課題でした。さらにコロナウイルスの影響によりテレワークが導入されたことで、議事録への捺印作業を削減するための電子化が進められていました。

このような状況もあり、そもそも議事録のあり方を見直すためテキスト化できるソリューションとして「AmiVoice ScribeAssist」を導入。

その結果、高精度な文字起こしによって議事録作成にかかる時間は1/3にまで短縮することができました。音声認識中でも専門用語や固有名詞の登録ができる点やスタンドアローン(インターネットに接続しない)型のアプリケーションである点なども、AmiVoiceへの満足度が高い理由となっています。

事例の詳細はこちらから確認できます。

AI対話

AmiVoiceはAI対話について、次のようなお悩みや課題を持つ企業にもおすすめです。

・問い合わせの自動化がしたい
・新しい顧客接点を増やしたい
・24時間365日対応できる体制を作りたい

例えば、株式会社三菱UFJ銀行のAI音声の対話アプリ「バーチャルアシスタント」には、「AmiVoice」(音声人認識技術)と「AmiAgent」(意図解釈・対話技術)が搭載されています。

これらの技術により、電話、メール、チャットなどさまざまなチャネルにおいて問い合わせ業務を自動化することができました。回答できなかった場合は、自動的にコールセンターのオペレーターへ共有されるため、顧客満足度を下げることなく効率的でスムーズな対応が可能になりました。

事例の詳細はこちらから確認できます。

まとめ

高品質・高速な音声認識エンジンを搭載したAmiVoiceによって、これまで人がやらなければいけなかった業務の自動化や、多くの手間がかかっていた作業の効率化が可能になります。

トラムシステムでは、株式会社アドバンスト・メディアの販売パートナーとして、コンタクトセンター向け⾳声認識ソリューション「AmiVoice Communication Suite」の取り扱いを行っております。

ご興味を持たれた方は、お気軽にお問い合わせください。


WRITER

トラムシステム(株)メディア編集担当 鈴木康人

広告代理店にて、雑誌の編集、広告の営業、TV番組の制作、イベントの企画/運営と多岐に携わり、2017年よりトラムシステムに加わる。現在は、通信/音声は一からとなるが、だからこそ「よくわからない」の気持ちを理解して記事執筆を行う。


UNIVOICEが東京MXの「ええじゃないか」という番組に取り上げられました。

注目記事Recommend Post