広告配信効果向上を目的とした大規模行動モデルの活用
- #データ/AI活用
- #ライフスタイル
川崎 愛実(かわさき まなみ)
山路 大樹(やまじ だいき)
外山 篤史(とやま あつし)
サービスイノベーション部
あらまし
デジタルマーケティングにおいて広告効果を高めるには,刻々と変化する顧客の状況(コンテキスト)をとらえ,その時々において最適な顧客に広告を届けることが重要である.しかし従来手法では,個々のコンテキストを把握できない精度面の限界に加え,広告配信の対象者抽出の膨大な業務稼働やシステム化のハードルといった運用面の課題があった.そこで顧客のコンテキストをとらえ,未来の行動を予測する大規模行動モデル(LAM)を開発し,性能を確認するための技術検証を行った.本技術によって,広告配信するべき最適な顧客を自動抽出することを可能にし,配信効果向上と業務稼働削減が可能であることを確認した.
01. まえがき
多くの企業では,日々多くの広告をセグメント*1に基づいて配信しているが,その中には顧客が関心の無いものも含まれてしまうことが少なくない.ライフスタイルや趣味嗜好が多様化した現代において,企業が単に年代や性別などの静的な属性だけで顧客を分類する従来のアプローチでは,もはや顧客1人ひとりの心に響く提案をすることは難しくなっている.
現在顧客が真に求めているのは,自分の置かれている状況やニーズを送り手が理解し,適切なタイミングで役に立つ情報を届けてくれる体験である.このような1人ひとりに合わせた「1to1マーケティング*2」が実現すれば,顧客は不要な広告に煩わされることなく,自分に必要なサービスや商品とスムーズに出会うことができるようになる.
しかし,企業にとって膨大な数の顧客1人ひとりのその時々の状況(以下,コンテキスト*3)を正確に読み取り,広告に最もマッチする顧客を選び出すことは,従来の人手による運用では限界があった.そこでドコモでは,NTTと共同で,自身が保有する顧客の行動データから1人ひとりのニーズを深く理解し,マーケターが企画した広告に対して,最適な広告配信対象者を自動で選定する技術を開発した.本技術により,顧客にとっては「欲しい情報が届く」快適な体験を提供でき,企業にとっては効果的かつ効率的な広告配信の実現が期待できる.
本稿では,本技術の詳細について解説する.
- セグメント:顧客を特定の属性や条件で分類したグループ.
- 1to1マーケティング:顧客1人ひとりの状況に合わせて個別にアプローチする手法.
- コンテキスト:顧客が置かれている動的な状況や文脈.
02. 課 題
1to1マーケティングを実現するにあたり整理した,従来のアプローチにおける配信効果と業務稼働やリソース確保における課題について,以下に述べる.
2.1 広告の配信効果における課題
(1)従来のセグメント技術におけるコンテキスト理解の限界
従来の広告配信で主流となっていた「セグメント配信」では,年代や性別といった属性や,過去に指定の店舗に来訪したことがあるといった特定行動に基づいて,顧客をグループ分けしていた.しかし,この手法では顧客の「コンテキストの推移」を時間軸に沿って正確にとらえることは困難である.
例えば,ある顧客が「住宅購入関心層」のセグメントに分類されているとする.この顧客がすでに物件の契約を済ませ,家具やカーテンを閲覧し始めている場合,現在のコンテキストは「物件探し」から「新生活の準備」へと移行している.この段階の顧客が真に求めているのは,不動産広告ではなく,引越し業者や新しいインターネット回線の案内である.しかし,従来の画一的なセグメント分類による広告配信では,こうした数週間から数カ月単位で変化するコンテキストの移り変わりに対応できず,結果としてすでに不要となった物件情報の広告を配信し続けてしまうといった課題があった.
(2)広告に適したターゲット選定(抽出ロジック)の難しさ
マーケティングの実務において,マーケターは「どのような広告を,どのクリエイティブ(画像や文章)で,いつ,どのチャネルで配信するか」という企画決定を行う.しかし,その企画が決まったとしても,「では,具体的にどのようなコンテキストをもつ顧客に配信すれば最も効果的か?」という問いに答えることは非常に難しい.
従来は,この企画のターゲット選定をマーケターの経験や勘に頼って行っていた.例えば「このキャンペーンなら,店舗Aを利用した人がいいのではないか」といった仮説ベースで条件を設定し,顧客を抽出していた.しかし,膨大なデータの中から,特定の広告に反応する行動パターンや予兆をマーケターの能力で見つけ出すには限界があり,潜在的なニーズをもつ顧客にリーチしきれない,あるいは訴求ターゲットと顧客のミスマッチが生じるといった課題があった.
2.2 広告配信にかかわる業務稼働や計算リソース確保における課題
(1)ターゲット抽出にかかる膨大な稼働
マーケターが広告に適した顧客を見つけ出すためには,データベースに対して複雑な条件指定を行い,試行錯誤しながら顧客を抽出する必要がある.この「誰に広告配信をするか」を決めるための抽出作業や,配信基盤への設定作業には多大な工数がかかっており,マーケターの業務を圧迫していた.
(2)AIを利用する場合の計算リソース(GPU:Graphics Processing Unit)の不足
顧客1人ひとりのコンテキストを考慮した1to1マーケティングを実現するためには,数千万人の顧客データに対し,大規模な計算処理を行う必要がある.特に,変化し続ける顧客の状況に合わせて最適なタイミングや商材を予測するには,膨大なデータを用いた推論処理が必要である.また,最新のトレンドを反映させるためのモデル更新(学習)が欠かせない.
しかし,こうした処理には高性能なGPUが多数必要であるものの,近年の世界的なAIブームによりGPUの需給は極めてひっ迫している.十分なGPUを安定的に確保することは難しく,リソース不足によって計算処理が間に合わず,最適な配信タイミングを逃してしまうリスクが大きな課題となっていた.
03. 提案手法
上記の課題を解決するため,我々はドコモが保有する会員データを活用し,顧客の将来行動を高精度に予測する「大規模行動モデル(LAM:Large Action Model)*4」[1][2]を開発した.そして,このモデルを組み込んだLAMシステムを構築した.
3.1 LAMを活用したコンテキストの理解
顧客1人ひとりのコンテキストを自動で理解し,最適なタイミングで広告を配信することは,配信効果を最大化する鍵となる.これを実現するのがLAMである.
本モデルの核となるのは,自然言語処理*5分野で広く活用されているTransformer技術[3]である.一般的な大規模言語モデル(LLM:Large Language Model)*6において,Transformerは文章や会話の前後関係を考慮し,次に発生する確率の高い「単語」を予測する.この際,単語は「トークン*7」と呼ばれる最小単位として処理される.これに対して,今回開発したLAMでは,顧客の決済,Web閲覧,アプリ利用といった「顧客行動」の1つひとつをトークンとして定義した.これにより,LLMが文章の文脈を理解するように,LAMでは顧客の行動シーケンス(順序関係)を学習し,「この一連の行動の後には,次にこの行動が起こる可能性が高い」という予測を可能にした.
LAMとLLMの比較を図1に示す.モデルの構築にあたっては,個人情報やプライバシー情報を適切に扱いながら,ドコモ会員約1億人のデータを横断的に活用している.このデータには年代や性別といった静的な属性データ*8に加え,サービス申込,商品購入,広告閲覧,Web閲覧,アプリ利用などの動的な行動データが時系列で含まれており,顧客のコンテキストをモデルが深く理解するための十分な情報量を有している.
さらに,本モデルは以下の二部構成の学習で設計されている.
・エンコーダ(コンテキストの理解)
顧客の膨大な行動履歴を網羅的に学習し,顧客1人ひとりの特徴やコンテキストをベクトル表現として獲得する.
・デコーダ(特定行動の学習)
エンコーダが理解したコンテキストを基に,特定の広告配信(サービス申込や商品購入など)に対する顧客行動に特化した学習を行う.これにより,エンコーダで得られた汎用的な特徴量を流用し,短時間でモデル生成を可能にしている.
この構成により,過去の顧客の行動データに基づいた精度の高いコンテキスト理解が可能となった.結果として,従来マーケターの経験や勘に依存していたターゲット選定を,データに基づく客観的かつ高精度な自動予測へと進化させ,広告配信効果の最大化を実現した.
3.2 LAMのシステム
LAMを用いて,人手を介さずに高精度な1to1配信の配信対象者の抽出を実現する.そのために構築したLAMシステムを図2に示す.
(1)学習と推論のプロセス
本システムでは,常に最新のコンテキストを把握しながら,個別の広告に最適化するために,以下の2段階の学習・推論プロセスを採用している.
①エンコーダ学習(定期実行)
日々蓄積される膨大な顧客の行動履歴を反映させるため,エンコーダの学習は定期的なバッチ処理*9として実行する.これにより,顧客の最新のコンテキスト(興味関心の変化やライフステージの推移など)を常にモデルの基礎部分に保持し続ける.
②デコーダ学習(広告連動実行)
マーケターによる本システムへの広告投入をトリガとして,その都度,特定タスクに特化させたデコーダ学習を実行する.システムに入力された広告内容(訴求商材やターゲット条件)に合わせて,過去の広告配信履歴とその効果を用いて,その広告に特化した学習を行うことで,個々の広告に最適な予測モデルを動的に生成する.
(2)提案したLAMシステムを用いた処理フロー
LAMシステムを用いた広告配信の処理フローは,以下のとおりである.
①マーケターの役割(企画・入力)
マーケターはLAMシステムに「広告内容,クリエイティブ,チャネル,配信期間」を入力する.
②システムの役割(学習・抽出)
マーケターの入力が行われると,LAMシステムは該当広告のデータを基に自動的にデコーダ学習を開始し,当該広告に特化した予測モデルを生成する.その後,定期的に学習されたエンコーダと組み合わせ,全顧客の将来行動を予測し,「該当広告に最も反応する可能性が高い顧客」を抽出する.
③マーケターの役割(配信実行)
LAMシステムから出力された配信顧客リストを基に,入稿作業を行い,広告配信を実施する.
この仕組みにより,マーケターは複雑なデータ分析や抽出条件の検討を行うことなく,広告要件を入力するだけで,最新の顧客コンテキストに基づいた最適なターゲティングを実現できるようになった.
3.3 フォールバック戦略によるGPUリソースの安定確保
本システムでは,マーケターから投入された広告ごとに専用のデコーダ学習を行うため,広告の投入に合わせて動的にGPUリソースを確保する必要がある.そこで,世界的なGPU供給不足や突発的な需要変動に対応し,確実なリソース割当てを行うために,利用可能なインスタンス*10を優先順位に従って探索する「フォールバック*11戦略」を実装した.
具体的には,AWS(Amazon Web Services)*12にて構築された本システムにおいてリソース確保の要求が発生した際,まずメインとなるデータセンタのアベイラビリティ・ゾーン(AZ:Availability Zone)*13から確保を試み,空きがない場合には順に,同一リージョン内の別のAZ,海外を含む他リージョンへと自動で切り替える仕組みとなっている.このように,リソースが確保できるまで段階的に探索範囲を拡張することで,特定の環境が混雑している状況下でも処理を停滞させることなく,安定的なシステム稼働を実現した.
- 大規模行動モデル(LAM):顧客の将来行動を予測するモデル.
- 自然言語処理:人間が日常的に使っている言語(自然言語)をコンピュータに処理させる技術.
- 大規模言語モデル(LLM):大量のテキストデータを使って学習された言語モデルで,言語の理解や文章の生成に優れた能力をもつもの.
- トークン:AIが処理するデータの最小単位.
- 属性データ:年代や性別といった顧客のプロフィールをとらえたデータのこと.
- バッチ処理:一定量,一定期間のデータを集め一括処理をする処理方法.
- インスタンス:クラウドコンピューティングにおけるオンデマンドで提供される仮想サーバ.ある処理が発生したときのみ仮想サーバが起動し終了するなど,仮想サーバの起動から終了までのライフサイクルは散発的である.
- フォールバック:システムや機器で障害・機能制限が発生した際,自動的に代替手段や機能制限モードへ切替え,最低限のサービスを継続する仕組み.
- AWS:Amazon Web Services社が提供するクラウドコンピューティングサービス.
- アベイラビリティ・ゾーン(AZ):物理的,ソフトウェア的に自律しているデータセンタの集合単位.
04. 検証結果
4.1 広告の配信効果の検証
本技術の予測精度を確認するために,以下2つの検証を実施した.
(1)従来のセグメント配信との比較検証
従来用いられていた機械学習*14手法とLAMの顧客行動予測の性能をオフラインで比較した.その結果,LAMは従来の機械学習手法に対して約30%,一般的なTransformerモデルに対しても約10%の予測性能向上を確認した.これは,LAMが顧客のコンテキストをより深く正確にとらえていることを示している.
(2)マーケターの経験則に基づく配信との比較検証
以下の2つのターゲット郡に対して広告配信を行い,その配信効果を比較した.
・マーケターが自身の経験や仮説に基づき抽出したターゲット群
・マーケターは広告内容を入力するのみで,LAMが自動で最適と判断したターゲット群
その結果,LAMを用いた配信は,マーケターが設計した配信と比較して,広告の開封率やクリック率(CTR:Click Through Rate)*15などの配信効果において2~3倍の向上を確認した.この結果は,マーケターが限られた情報から仮説ベースで考えるターゲット選定よりも,LAMが膨大な顧客行動データから「広告に反応するコンテキスト」を直接導き出すほうが,はるかにマッチング精度が高いことを裏付けている.以上のことから,LAMの導入によってターゲット選定の属人化や精度の限界という課題が解決され,マーケターが複雑な抽出ロジックを考案することなく,高い配信効果を実現できることが実証された.
4.2 広告配信にかかわる業務稼働やリソース確保の検証
(1)広告配信にかかわる人的リソースの削減
マーケターがLAMシステムに必要事項を入力するだけで,ターゲット抽出を自動で実現できるようになった.これを用いた広告配信の技術検証により,従来は数十時間を要していたターゲット抽出作業とその入稿作業が数十分へと短縮され,最大で99%の稼働削減が見込めることを確認した.
(2)フォールバック戦略によるGPU確保の検証
提案したフォールバック戦略(マルチAZ・マルチリージョン対応)によって,広告連動型の学習に必要なGPUリソースが確実に確保できるかを検証した.前述のとおり,本システムでは広告投入ごとにデコーダの学習処理が発生するため,複数の広告が重なるピーク時には突発的なリソース需要が生じる.
検証の結果,フォールバック機能が正常に動作し,システム稼働の最低要件であるGPU36台以上を安定して確保できることを確認した.さらに,繁忙期を想定した20並列での同時学習リクエストに対しても,自動的に探索範囲を広げることで遅延なくリソースを確保できた.これにより,GPU枯渇が懸念される状況下であっても,LAMを用いた学習や予測を停滞させることなく安定的に遂行できることが実証された.
- 機械学習:入力されたデータを基にパターンを学習し,何らかのタスクを実行するコンピュータアルゴリズムのこと.
- クリック率(CTR):「(広告のクリック数)÷(配信総数)」で得られる,インターネット広告の効果を測る指標の1つ.
05. あとがき
本稿では,デジタルマーケティングの高度化をめざし,LAMを活用した広告配信最適化技術について解説した.本技術により,マーケターは広告の企画に専念し,「最適な顧客の抽出」をAIに任せるという新たな業務プロセスを確立できることを実証した.その結果,配信効果の最大化と業務効率化を同時に達成できることを確認した.今後は,モデルの予測精度をさらに向上させるとともに,予測結果に基づいて「どのような広告を行うべきか」という広告立案そのものをAIが支援する技術の開発にも取り組む予定である.
文献
- [1] 千葉 昭宏,福島 健祐,塩田 哲哉,林 芳樹,浅井 洋樹,永田 智大,石井 方邦,倉沢 央,柴田 樹,佐藤 篤:“周期性を考慮したBERTの顧客行動分析への応用,”IEICEソサイエティ大会講演論文集,No.B-15-24,Mar. 2023.
- [2] 倉沢 央,富田 準二:“大規模行動モデル(Large Action Model: LAM)の提案と実用化:マーケティング,医療,エネルギー分野への応用,”電子情報通信学会論文誌 B,Jul. 2025.
- [3] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser and I. Polosukhin:“Attention Is All You Need,”Advances in Neural Information Processing Systems,Vol.30,Dec. 2017.