
コミュニケーションAIが
実現するAI接客
お客さま応対向けの
既存のチャットボットや応対AIでは、
個人や状況に合わせた応対が
実現できていないという問題がある。
この問題の解決には、
お客さまの会話ペース・ニーズの把握や、
お客さまからの問合せ内容の中で言語化
されていない意図を解釈する必要がある。
そこでドコモでは、
話速測定技術や顧客行動分析技術、
LLMを活用した情報収集のための
聞返し技術といった複数のAI技術を
組み合わせてお客さま応対を行う
コミュニケーションAIを開発し、
これを用いてお客さまの的確なサポートを
めざす。
まえがき
チャット窓口やコールセンタなどのお客さまの問合せ窓口において,既存の自動応答システム*1は,さまざまなお客さまの状況があるにもかかわらず一律で同じような回答になり,必ずしもお客さまが満足する応対ができているとはいえない.このような問題の解決には,お客さまごとの状況や属性をシステム側が把握し,それを踏まえた応対を行う必要がある.
また自動応答システムにおけるもう1つの大きな問題点として,お客さまが音声やチャットにより入力した問合せ内容に情報不足があった場合に適切な応対ができないということがある.ドコモでは,自動応答システム向けに,お客さまからの入力音声や入力テキスト情報に対して,これがどのような問合せを意図したものであるかの目的特定を行う意図解釈技術[1]を開発したが,問合せ内容に情報不足があった場合は目的特定の精度が著しく低下するため,このような情報不足の解消が課題とされていた.
そこでドコモでは,お客さま1人ひとりの状況や属性を考慮した応対の実現と,問合せの目的特定のための情報不足の解消という2つの課題達成に向けて,これまで開発した複数のAI技術を組み合わせた自動応答システムであるコミュニケーションAIを開発した.
本稿では,コミュニケーションAIの詳細について解説する.

- 自動応答システム:コールセンタやチャット受付などのお客さま窓口において,お客さまの電話やチャットに対して,人が応答するのではなく,システムが自動で応対・案内する仕組みのこと.
コミュニケーションAIの概要
コミュニケーションAIは,お客さまからの問合せを音声として受け付け,あらかじめ登録された応対マニュアルなどの参照情報を基に,お客さまへの回答を音声として出力するシステムである.
ドコモのアセットを用いたコミュニケーションAIの構成を図1に示す.コミュニケーションAIには3つの大きな特長がある.
1つ目は,単に問合せへの回答を行うだけではなく,お客さまに寄り添った受答えを行うことである.お客さまのお急ぎ具合や,そのお客さまに適した会話ペースを把握するために,音声認識や話速測定といったドコモが開発した音声分析技術を1つに集約した音声DX(Digital Transformation)*2基盤[2]と連携している(図1①).これらの技術を活用することで,お客さまの非言語情報*3を踏まえた応対を行う.
2つ目は,ドコモの会員基盤を活用してお客さまの行動データ*4や属性データ*5からお客さまのニーズを理解する顧客行動分析技術[3]やdocomo Sense[4]と連携し,これらの技術を活用することで,お客さまの潜在的なニーズを満たすような提案を自律的に行うことである(図1②).
3つ目は,お客さまからの問合せ内容が曖昧なまま回答を行わないようにするために,問合せ目的を明確化する聞返しを行うことである.コミュニケーションAIは,お客さまへの回答に向けて必要な参照情報を特定するために,意図解釈技術を用いて問合せの目的特定を行うが,その準備段階として情報収集や認識合せのための聞返しを行う(図1③).これにより,聞返しを行わない場合と比べて目的特定の精度が大きく向上する.
以下では,これらの特長をもつ本システムの応対を行う仕組みについて述べる.

- DX:ITを活用してサービスやビジネスモデルを変革させ,事業を促進するとともに人々の生活をあらゆる面で良い方向に変化させること.
- 非言語情報:声色や表情といった言語以外のコミュニケーションにおける相手への伝達情報のこと.
- 行動データ:Web閲覧履歴といったお客さまの行動パターンをとらえたデータのこと.
- 属性データ:年代,性別といったお客さまのプロフィールをとらえたデータのこと.
お客さまに寄り添う応対
お客さま応対において,言語情報のみならず非言語情報も考慮した応対を行うことが,より効果的なコミュニケーションの鍵となる.ドコモの音声DX基盤を活用することで,お客さまの会話のペースをリアルタイムで把握し,応対に反映させることが可能となる.
コミュニケーションAIによるお客さまに寄り添う応対例を図2に示す.お客さまが速い発話で質問した場合,コミュニケーションAIはお客さまが急いでいると判断し,コミュニケーションAIの話速をお客さまの話速に合わせて速くする.加えて平常時より端的な説明を行うことで,焦りを感じているお客さまには迅速な応答を提供する.一方で,落ち着いており,遅い発話で質問するお客さまに対しては,コミュニケーションAIは平常時よりゆったりとした話速に調整する.加えて平常時より丁寧な説明を行うことで,お客さまに対して安心感を提供する.以上のようにお客さまに寄り添ったコミュニケーションを実現することで,お客さま体験の質を大きく向上させることが期待できる.

お客さまのニーズに基づく応対
企業は,お客さま1人ひとりに合わせたカスタマーサポートを実現するため,属性や行動などの顧客情報からニーズや課題をとらえ,最適な方法でお客さまを支援する必要がある.コミュニケーションAIでは,ドコモの会員基盤を活用した行動データからお客さまのニーズを理解する顧客行動分析技術とdocomo Senseを活用することで,それらを実現する.
例えば,あるお客さまがスマートフォンを購入する確率が高いことが予測できたとしても,そのお客さまに手続き上不明な点が生じていた場合,その不明点を解消するために必要な情報の推薦も同時に行う必要がある.顧客行動分析技術ではお客さまの将来行動の予測とその発生確率を算出し,そこから適切なサポートの方法を予測・算出する.その結果に基づく提案を行うことにより,円滑なお客さまの手続きのサポートを実現する(図3).
また,あるお客さまにキャンペーンを告知する場合,単なるキャンペーンの告知ではなく,そのキャンペーンがお客さまの趣味嗜好に合致していることを含めて告知するほうがキャンペーンのメリット・魅力を訴求することができ,効果的である.例えば,同じキャンペーンを異なるお客さまに紹介する場合,スポーツ好きな方にはスポーツの動画サービスを例に,映画好きな方には映画が豊富な動画サービスを例にキャンペーンを告知したほうが効果的である.docomo Senseではドコモの会員基盤を基に,お客さまの興味関心を理解することができるため,その情報を活用し,個々のお客さまのニーズに合わせた応対を行うことが可能である.

お客さまの目的特定のための聞返し技術
お客さまからの問合せ文が曖昧であるとき,それだけの情報からお客さまの目的を特定することは難しい.そこで図3に示すように,聞返し技術を用いて不足している情報をお客さまに尋ね,回答から得られた情報を活用することで,精度良く目的特定を行うことをめざす.
聞返し技術を導入した目的特定の流れを図4に示す.まず,お客さまの問合せ文に対して意図解釈モデル*6を適用し,問合せ目的の候補を獲得する.目的の候補に対応するマニュアルを検索システムにより特定し,これを参照情報として,図5に示すようにLLM(Large Language Model)*7に聞返し内容を生成させる.ここで用いるマニュアルとは,お客さまに対するサポートを行う際に,オペレータが参照するものである.聞返しの作成にあたっては,まずお客さまの問合せ内容の要約を作成し,これと参照情報を用いてLLMにより目的候補を文章化する.次に目的の候補それぞれについて,問合せ文との関連度を算出し,関連度が高い候補がお客さまの問合せ目的に合っているかをお客さまに聞き返す.そしてお客さまからの返答を踏まえた上で改めて意図解釈モデルによる目的特定を行う.
実際にお客さまから寄せられた問合せを用いて聞返し技術の実験を行った.図6で示すような実験設定で,問合せ文としてドコモのチャット応対窓口に寄せられた247件を使用して評価を行ったところ.本技術の導入により,目的特定の正解率は66.80%から82.18%に向上したことが確認できた(表1).
聞返し技術を導入したことにより情報不足を解消できた応対例を図7に示す.最初の問合せ文は何についての質問であるかが明確でなく,この段階では正しく目的特定が行えていない.そこで,曖昧な問合せ文に対して,聞返し技術により不足している情報を補うことで,質問の意図が明確な問合せ文が生成されていることが確認できる.これにより最終的な目的特定も成功し,以降の応対に対して円滑に繋げていくことが可能になる.
反対に,聞返し技術が正しく動作しなかった応対例を図8に示す.この例では聞返しが問合せ文と関係の無い内容になっており,最終的な目的特定も正しく行われなかった.この原因として,問合せ文に関連するマニュアルを検索システムが適切に取り出せていないという問題と,関連度の低いマニュアルに対してLLMが高い関連度スコアを付与するという問題が考えられる.これらの問題に対してプロンプト*8改善などにより対処することが今後の課題となる.




あとがき
本稿では,ドコモのAI技術を集約したコミュニケーションAIの特長とその応対例を解説した.音声DX基盤,顧客行動分析技術,docomo Sense,聞返し技術といった,複数のAI技術を活用することで,お客さまの状況やニーズを踏まえた応対や,問合せ解決に必要な情報を自律的に収集するような対話を行い,これにより従来の自動応答サービスと比べて格段に人間による応対に近しい柔軟な応対が可能となった.今後は,社内外での実証実験を通した有効性検証を進め,応対業務のDX推進に貢献していく.
- 意図解釈モデル:意図解釈を行う機械学習モデルのこと.お客さまからの問合せ文を入力とし,推定される問合せ目的を出力する.
- LLM:大量のテキストデータに基づいて機械学習により訓練された大規模な人工知能モデルのこと.ここでは特に,文脈を理解して人間らしい自然な文章を生成する能力をもつモデルを指す.
- プロンプト:LLMを操作する際にユーザが投入する指示や入力文.
- [1] 橋本,ほか:“AIによるコールセンタお客様満足度向上とオペレータ業務効率化—音声認識IVRの開発—,”本誌,Vol.25,No.4,pp.6-11,Jan. 2018.
https://www.docomo.ne.jp/binary/pdf/corporate/technology/rd/technical_journal/bn/vol25_4/vol25_4_003jp.pdf(PDF形式:1,645KB)
- [2] 千葉,ほか:“音声DX基盤が拓く音声データの活用,”本誌,Vol.32,No.1,Apr. 2024.https://www.docomo.ne.jp/corporate/technology/rd/technical_journal/bn/vol32_1/003.html
- [3] 千葉,ほか:“お客さまの手続きをサポートする顧客行動分析技術,”本誌,Vol.31,No.4,Jan. 2024.https://www.docomo.ne.jp/corporate/technology/rd/technical_journal/bn/vol31_4/002.html
- [4] NTTドコモ:“顧客理解エンジン「docomo Sense」.”https://ssw.web.docomo.ne.jp/marketing/strengths/sense/