CX向上を実現するコンタクトセンター向けCRMソリューション
更新日:2022年11月1日
近年、テクノロジーは急速に発展を続けており、コールセンター業界でもその恩恵を多く受けています。特にコールセンター業界において重要度の高いテクノロジーが、「音声認識」です。今回は音声認識の概要から具体的な活用方法、現状の課題、最近登場したソリューションの例まで網羅的にご紹介します。
2.1. VOCの蓄積、分析
2.2. リアルタイム文字起こしによる応対品質の向上
2.3. ACWの短縮
2.4. オペレーターの育成
2.5. 感情分析によるクレーム対応効率化
2.6. コンプライアンス確認
3.1. 認識の精度が人間レベルではない
3.2. 音質の確保が重要
3.3. 導入コストが高い
さまざまなテクノロジーの中でも、その発展が目まぐるしいのが「音声認識」の分野です。音声認識はコンピューター自身が学習を行うモデルによりその精度を上げていくことが可能で、音声認識のテクノロジーを用いたさまざまな商品も登場しています。いち早く登場し、驚きをもって世間に受け入れられたひとつがiPhoneに搭載されているSiriです。現在はスマートスピーカーも数多く発売され、家庭内でも音声を使って電化製品の操作ができるようになっています。商業の分野においては、高精度な自動文字起こしや感情の分析なども登場しています。
声を仕事にしているコールセンター業務は、音声認識との相性が非常に高い業種です。音声認識のテクノロジーがコールセンターにもたらす恩恵は非常に大きく、さまざまな可能性が期待されています。
音声認識のテクノロジーを用いると、具体的にコールセンターにはどのようなメリットがあるでしょうか。ここでは6つの活用方法についてご紹介します。
音声認識が得意なことの1つが、自動文字起こし(音声のテキストへの変換)です。これまで文字起こしというと、人が音声を聞いてタイピングで起こすことが当たり前でしたが、音声認識の技術が発達することでこれをコンピューターが行えるようになっています。
業務中に取得した通話録音ファイルから夜間等に自動で文字起こしを行うことにより、コールセンターではVOCの蓄積を大幅に自動化することが可能です。これまではコールリーズンが分かる程度にしか記録できなかったVOCも、コール内容全体をそのまま保存できるようになり、音声認識がなかった頃とは比べ物にならない量のデータを蓄積できるようになっています。
蓄積したVOCは分析に活用することも可能です。膨大なVOCをコンピューターが分析し、人間では類推できないような傾向を示すこともできるようになってきました。
リアルタイム文字起こしは、コール1つひとつの応対品質の向上にもつながります。たとえば、オペレーターはコール内容が文字起こしされることで客観的に状況を把握することができ、顧客に寄り添った対応やFAQの素早い検索につながります。また、SVは文字起こしの内容を見ることで複数のコールを同時にモニタリングできるようになり、問題が起こった際のリカバリーを素早く行えるようになります。
自動で文字起こしすることができれば、ACW(After Call Work:後処理)の時間を短縮することも可能です。コールセンターで応対時間を短縮し、効率の良い稼働を実現するには電話やメールの対応が終わった後の処理時間を効率化することが有効な手段の1つですが、短くしようと焦ると人為的ミスが増える恐れもあります。音声認識によるサポートがあれば正確な入力作業が可能になり、もちろん時間も短縮しやすくなります。
音声認識は言葉の意味を理解し、どういう状況かを判断することもできるので、NGワード検出などでコール内容に問題があればすぐさま通知することも可能です。これによりSVがすぐさまカバーできるだけでなく、オペレーターは何が悪かったか、次からどうすれば良いかのフィードバックをその場で受けることができます。
また、対応履歴を音声に加えてテキストでも確認することによりオペレーター1人ひとりの傾向も把握しやすいので、客観的な分析に基づいたトレーニングを行うことも可能です。
コールセンターの重要な業務の1つにクレーム対応がありますが、これが原因で離職率がなかなか下がらないこともある厄介なものです。音声認識は、声色や発声スピードなどからオペレーターや顧客の感情を分析し、すぐさまアラートをかけることができます。これにより素早い二次対応で顧客満足度の低下を防げると同時に、オペレーターにかかる負担を大幅に減らし、ストレスによる離職率の課題を解決することも可能です。
オペレーターがコンプライアンスに違反するような発言をしている場合に、すぐさま知らせることができるのも音声認識の利点の1つです。その発言により顧客の感情を悪くしてしまった場合にはすぐさまSVがフォローに入り、早期に指導することでコールセンターの応対品質の底上げが可能となります。
驚くほどの進化を遂げ、コールセンターの業務内容を一変させるようなシステムも登場している音声認識ですが、まだまだ課題も多くあります。
精度を伸ばし続けている音声認識ですが、言ってしまえば、まだ人間レベルには追いついていません。条件によっては誤認識が多く発生することもあり、その信頼性を疑問視する声もあります。特に、不鮮明な喋り方になることもある顧客の声は拾いにくいケースもあり、オペレーターが復唱するなど認識へ運用面の工夫も必要です。
十分な精度で音声認識を行うには、高音質の環境が必要という現状もあります。たとえば、マイクに向かって1人が話せば十分に認識できても、複数人が同時にしゃべれば精度は一気に落ちます。また、人間の耳には十分に聞き取れる音質でも、音声認識では拾い切れないこともあります。そのため、現状の技術力で音声認識の効果を最大限に発揮するためには、ノイズが少ない環境や高音質のマイクなどが必要です。
実用化されてからある程度時間が経っているものの、音声認識の導入にはまだまだコストが高いという課題もあります。費用対効果を考慮すると、現状ではその恩恵を受けているセンターは限定的だと言えます。
まだまだ課題もある音声認識ですが、進化を続けており、コールセンター業務をサポートする新しいソリューションもどんどん登場してきています。
導入費用の面ではクラウド型の音声認識ソリューションも増えており、ライセンス+使った分に応じて支払う従量型で導入もできるようになっており、費用面でのハードルは下がっています。
2019年に新たに登場したソリューションとして、コンピューターが顧客の音声を認識して最適なオペレーターへつなぐという「音声認識版IVR」のようなシステムがあります。これまでのIVRでは、長いガイダンスとボタンをプッシュする手間がどうしても必要でしたが、このシステムでは「◯◯がしたい」「◯◯について知りたい」と話すだけでいいため、顧客にとっての利便性が大幅に増すことが期待されます。
また、音声認識によりコール内容を分析した上で要約文を作成するシステムも登場しています。自動文字起こしした内容を単純に蓄積するだけでなく、要約までをシステムが行うことでオペレーターやSVにとって扱いやすいデータとなり、さまざまな改善活動に活かすことが可能となります。
コールセンター業務との親和性が高い音声認識のテクノロジーは、今後もコールセンターに特化したソリューションを数多く生み出していくことが期待できます。まだまだ導入コストが高い問題もありますが、テクノロジーを上手に導入することでコールセンター成長のための投資となるため、音声認識のテクノロジーの発展にはよく注視しておくのがおすすめです。