クラウドPBXや電話システムについてIT・通信のプロが解りやすく解説|voice

ビジネスフォンやクラウドPBXを電話・通信のプロがわかりやすく解説!

\ クラウドPBX資料 /

無料ダウンロード

フリーワード検索

2019.02.12

テキストマイニングでデータを分析|トラムシステム

消費者がある商品を購入しようとした場合、Googleを活用して企業のホームページを読み込んだり、ソーシャルメディア上である商品について有名人がつぶやいている内容を見たりして情報収集しているのではないでしょうか。こういった世の中にありふれているテキスト情報をビジネスで利用しようという研究が進んでおり、その手法はテキストマイニングと呼ばれています。

テキストマイニングでは、例えばコールセンターでオペレーターがお客様とやり取りした音声をテキスト情報に変換させて、オペレーターの品質向上とコールセンターの最適な体制構築のためにテキストマイニングは利用されています。

こういったテキストマイニングを自社の課題解決に使用したいと考えている方からは、
「そもそも、テキストマイニングってなんだっけ?」
「テキストマイニングをする目的ってなに?」
「テキストマイニングで扱うデータはどういったデータなの?」
といったお話をよく聞きます。

そこでこの記事では、これからテキストマイニングについて調べようと考えている方向けにテキストマイニングの内容とその目的、また取り扱うデータについて詳しく解説していきます。この記事を読むことで、テキストマイニングについて理解を深めて、自社の課題解決に活用できそうか判断することができるようになるでしょう。

テキストマイニングとは

それでは、テキストマイニングについて詳しく解説していきましょう。まずは、テキストマイニングの解説の前に、同じような用語であるデータマイニングについて整理します。
データマイニングとは、統計学などの手法を用いて大量にあるデータを分析、解析することで法則性の発見や課題を見つけ出す技術のことであり、あらゆるデータが対象となります。一方、テキストマイニングは、定性データを活用するために利用される手法になります。

例えば、「彼は宇都宮市に住んでいます」という文章を言語処理で「彼/は/宇都宮市/に/住んで/います」と意味や文法に沿って分解します。この分解されたキーワードに対して、関係性の強さや出現頻度、出現傾向などを分析して有益な情報を導き出すのがテキストマイニングです。

それでは、テキストマイニングの流れを整理しておきましょう。

データ

まずはテキストマイニングをするために必要なデータを収集します。
小売業であれば売上情報や属性情報を保持しているPOSシステム、ECサイトであればWebサイトのアクセスログや売上情報になりますが、最近はtwitterやFacebookなどのソーシャルメディア上でつぶやかれている情報も対象になります。また、アンケート結果などに記載されている自由記入欄なども分析対象データとして取り扱われます。

前処理

取得したデータは、通常文字列が連続して記録されているためそのまま解析することはできません。そこで、解析ができるよう前処理として形態素解析やクレンジングを実施してデータ解析ができる状態に施します。
形態素解析では、文字列を分解できる最小限の単語単位で分割していきます。最小限にすることで、単語の出現頻度をカウントしたりなどの集計処理が施せるため、テキストデータを数値データとして取り扱えます。
また、データを整理しやすくするためにデータのクレンジングを行います。いわゆる、表記ゆれと呼ばれる同じ意味を表す単語が別の表現で使用されていたり、大文字小文字の統一、全角半角の統一などを実施して単語を整理していきます。形態素解析やクレンジングを活用することで解析できる状態にデータを整理できるようになります。

解析

テキストマイニングによる解析では、単語同士のつながりの強さや単語同士の相関関係、単語間の使用されている距離感などを分析していきます。
このようにテキストマイニングでは、解析対象のデータを選定して収集し、前処理を行うことで解析ができる状態にデータを加工し、他の分析手法と同じくその特徴を見つけていくことで、示唆を得る分析手法と言えるでしょう。

テキストマイニングの目的

テキストマイニングについて理解を深めたところで、テキストマイニングを実施していく目的を考えてみましょう。

テキストマイニングでは、定性データを分析することで統計的に有益な情報を発見したり、付加価値情報を見つけていくことが目的であり、具体的には、以下の目的が考えられます。

・大量のテキストデータを整理して短い言葉(単語)でその傾向や特徴を把握したい
・大量のテキストデータの中から、重要な言葉やキーワードを抽出して、文章内の出現頻度や同時に使用される単語の関連性から全体傾向や重要事項を整理したい
・大量のテキストデータに含まれるこれまで想定していなかった斬新なアイデアや潜在化していたが顕在化していなかったクリティカルな課題の発見やその兆しを把握したい

このような目的を達成する手段の一つがテキストマイニングであり、様々なビジネスで利用されてきています。

扱うデータ

テキストマイニングで扱うデータは主に定性データになりますが、定量データと合わせてその違いや特徴を把握していきましょう。

定量データ

定量データは、あるサービスの市場占有率や売上規模、従業員にかかっている費用など、数値として扱えるデータを指しており、時系列や年齢などの属性情報、テニスが好きなどの趣味趣向情報など細く分析することができるため、あらゆる戦略検討の際に重要視される基礎データとなります。
一般的に定量データは、Webサイトの行動ログ、店舗での売上情報、などが利用されます。

定性データ

一方、定性データは、「このサービスを利用し続けている理由」、「商品のパッケージは派手だがデザインの見た目はいい」「雨が降っているのになぜ店舗まで出向いて購入したか」など、数値では把握することができなかった購入者や利用者に内在する声を分析するための基礎データとなります。
一般的に定性データは、アンケート結果やWebサイトの見た目、パッケージの良し悪し、などが利用されます。

どちらが良くてどちらが悪いという話ではなく、定量データも定性データそれぞれ特徴があるため、解析内容や目的に応じて使い分けていくべきでしょう。

まとめ

テキストマイニングはコールセンターにかかってきた電話内容の解析やソーシャルメディア上でつぶやかれている自社製品の動向などで利用されており、音声認識技術が飛躍的進歩を遂げていることから、今後ますますテキストマイニングを活用した課題点の発見や関連性の把握などで利用されることになるでしょう。特にソーシャルメディア上では様々なことがつぶやかれており、自社製品に限らず他社製品に関しても語られていることが多いことから、ただの顧客満足度向上のための品質向上で利用されるのではなく、マーケティング活動の一環としても多く利用されています。

このように顧客満足度の向上からマーケティング活用まで幅広く利用することができることから、自社のどの部門のどういった用途でテキストマイニングを利用していくのが一番効果的なのかしっかり考えて、これまで見つけられなかった課題の発見や主要キーワードと一緒に語られている単語から消費者の気持ちを類推し、ビジネスに活用していってはいかがでしょうか。


WRITER

トラムシステム(株)メディア編集担当 鈴木 康人

広告代理店にて、雑誌の編集、広告の営業、TV番組の制作、イベントの企画/運営と多岐に携わり、2017年よりトラムシステムに加わる。現在は、通信/音声は一からとなるが、だからこそ「よくわからない」の気持ちを理解して記事執筆を行う。


UNIVOICEが東京MXの「ええじゃないか」という番組に取り上げられました。

注目記事Recommend Post

  • クラウドのセキュリティは不安?クラウドPBX導入時に知っておくべき要件を解説

  • IaaSって何?丨代表例と導入時の注意点をわかりやすく解説

  • 高速大容量・低コストを実現する5Gで私達の生活はどう変わる?

    2019.10.20