ビジネスフォンやクラウドPBXを電話・通信のプロがわかりやすく解説!

Voice

2019.01.06ツール

音声認識の課題と展望丨メリット・今後の活用シーンとは|トラムシステム

IBM社のAIエンジン「Watson」を始めとするAIの活用が進んでいます。Apple社の「Siri」やAmazon社の「Alexa」など、音声を認識させることで様々なアプリケーションを起動させたり、文字入力をさせたりといった便利な使い方が身近になってきました。この記事では、音声認識の長所や現在の課題、また今後の展望について詳しく解説します。

音声認識のメリット

音声認識を活用するメリットは大きく2つに分類されます。一つは、入力速度がキーボード入力よりも早いということ、もう一つは手を使わないで操作ができることです。

入力速度

音声認識による文字のタイピングは、音声を発するだけで自動的に文字を判定して漢字変換までしてタイピングをしてくれます。キーボード入力の場合には、内容を考える、タイピングする、文字を置換する、内容に間違いがないか確認するといった4工程を経た後に文字が出力されていきますが、音声入力の場合には、内容を考える、内容に間違いがないか確認するといった2工程で処理が終わるため、入力速度が圧倒的に早くなります。

もちろん、雑音が入ったり、句読点の入力が苦手だったりといった音声入力ならではの問題は含まれており、考えながらタイピングする操作の場合には手直しの量が増えるため結果的に時間がかかるかもしれませんが、あらかじめ内容の構成ができているものや原稿が用意されているもの、正確な記録ではなく概要がつかめればよい(時間を短縮するほうが優先される)業務については真価を発揮できます。

また、タイピングをする必要がないことから、腱鞘炎など指や腕への負担も軽減できるため、普段パソコン操作が多くてこういった症状に悩まされている方にとっては朗報と言えるでしょう。

高い操作性

手を使わないで音声のみで操作ができるため、遠く離れた物体に対しての指示出しも可能です。例えば、Alexaに代表されるような機器の場合には手元になくても遠隔操作でアプリケーションを実行させることや、調べものの結果を返してもらうといったことができます。

音声のみで操作ができるものとして、AIスピーカー(スマートスピーカー)、スマートフォン、ヘッドホン、テレビといったものが挙げられます。

手を使わないで操作ができることで、音声で指示を与えながら自分はその管理に専念すると行った運用が可能になるため、例えば工場で製造工程を管理している場合、1人で複数のロボットを操作しながら作業するといったこともできるようになります。そうすることで、人を新たに確保しなくてもあたかも部下をたくさん扱っている感覚で業務を進めることも可能になります。

音声認識の課題

音声認識には業務の効率化や仕事の断捨離ができる可能性を秘めていますが、まだまだ課題があります。

例えば、道に迷ったあなたがSiriに「あとどのくらい?」と質問してもほしい回答を得ることは難しく、目的地に対して現在地から徒歩でどのくらいかかるのか、といった具体的な内容の指示をしなければいけません。いわゆる、意訳して回答を用意することができないため、細く説明して内容を補完する必要があります。

また、音声認識の普及率という意味ではまだ低く、ロボットに対して人間と同じようなことをさせることで抵抗感を持ってしまう方もいることは否めません。例えば、介護ロボットや会話ロボットがありますが、人間に変わってコミュニケーションを取る役割を担っていますが、肝心の精度の問題もあるものの、人間がロボットと会話することに慣れていないため、あらかじめ慣れるまで一定期間必要になることがあります。

音声認識技術も日進月歩で進んではいますが、精度としては今ひとつで改善が必要なところもあります。基本は標準語をベースに言語辞書が作成されているため、例えば方言やなまりといった独特の表現や、低音で聞き取りにくいような音声で会話をする人の声を正確に認識できない点もあります。

マイクの感度の問題になりますが、音声認識させる端末のマイク感度が異なっていることから、周囲の雑音を拾ってしまい、正確な認識を妨害してしまうことも挙げられます。この場合はノイズ除去の仕組みや話者に向けて音声収集するマイクを固定することである程度回避しています。

複数人が同時発話する場合も個人単位の音声を識別することが困難なため、すべて同一人物が発言したような状態で情報が蓄積されてしまうことから、ディベートなどの議事録作成で利用するには不向きと言えます。

音声認識の今後の活用場面

音声認識には多くの課題があるものの、今後は顕在化されている課題に対して対策や技術的な側面からの抜本的な対策が行われていくことから、音声を活用したサービスや業務改善はますます進んでいくと考えられています。

コールセンター

いま、一番音声認識の導入が前向きに進んでいる業務といえばコールセンターが挙げられます。いままではお客様からの問い合わせは人間のオペレーターが対応していますが、音声認識を含む人工知能の技術を活用したAIコールセンターの流行の兆しが見えています。

お客様からの問い合わせ内容によってすべてをさばくことは難しいですが、一般的な内容やあらかじめ決められたマニュアル通りの対応であればAIを活用することで自動応答も可能になります。昨今の人手不足やオペレーターの教育など、人間のオペレーターで対応するには相当なコストと体制が必要になり、その大部分をAIで対応できればコストの大幅な圧縮に加え、簡単に対応できる体制を増やす、減らすといったこともできるようになるためです。

ホテル・アミューズメント施設

ホテルやアミューズメント施設での案内に音声認識技術が使われています。特にホテルではお客様ごとの対応状況をホテルのスタッフ間で共有することで質の高いおもてなしができるわけですが、日々の業務に忙殺されている中で情報共有できるよう内容を整理して情報を打ち込み、共有をするということはかなりの業務負荷になっています。

こうしたスタッフ間のやり取りの履歴をリアルタイムに音声からテキスト化させることで情報共有のスピードが上がると同時に、作業をしながら情報をインプットすることもできるため業務効率といった観点でも効果があると言えます。

音声翻訳

機能面では音声翻訳が今後さらに普及すると見込まれています。既に複数社から日本語で入力すると英語や他の言語で回答をするといった端末が発売されていますが、こういった機器は特に訪日外国人の観光や海外旅行や海外出張する方にとってはありがたいサービスになり得ます。

議事録・報告書作成

音声認識で最近特に注目されているのが、議事録作成などの記録です。タイピングに比べて2/3の時間で議事録作成できる結果も出ており、議事録作成が必要となる国会の答弁や重要な会議、様々なお客様との打ち合わせにも利用ができます。作成された議事録を社内で共有できれば、お客様に対して質の高いアプローチや提案も可能になるため、営業面でも効果的な使い方の一つと言えます。

まとめ

音声認識技術はまだ課題もありますが、作業の自動化や人間が行う作業時間の短縮・業務効率化に繋がります。高齢化社会や働き方改革など、日本の働き方や労働に対する考え方が大きな転換期を迎えている今、これらの技術を活かした労働改革を検討してはいかがでしょうか。


WRITER

トラムシステム(株)メディア編集担当 鈴木 康人

広告代理店にて、雑誌の編集、広告の営業、TV番組の制作、イベントの企画/運営と多岐に携わり、2017年よりトラムシステムに加わる。現在は、通信/音声は一からとなるが、だからこそ「よくわからない」の気持ちを理解して記事執筆を行う。


クラウドPBXに関するお役立ち資料を無料配付中!

「クラウドPBXポイント10選」

クラウドPBXのメリットやデメリットを10のポイントから解説した資料です。よくある質問とその答え、機能・サービスの比較表でベンダーの比較ができます。さらに導入事例を数社ピックアップして掲載してます。クラウドPBXの検討はこの資料から!

資料をダウンロードする