2026年4月ドコモの事業に貢献するAI・サービス特集

グラフニューラルネットワークを活用したデジタルマーケティングに関する取組み

＃データ/AI活用

岡村洋希（おかむらひろき）
山路大樹（やまじだいき）
橋本雅人（はしもとまさと）
冨樫勇哉（とがしゆうや）
阿座上知香（あざかみともか）
サービスイノベーション部

あらまし

ドコモでは顧客の多様なデータを活用したデジタルマーケティングを推進しているが，特定の店舗やコンテンツに興味をもつ顧客というセグメントの抽出での精度向上と，セグメントごとのモデル運用のコスト削減が重要な課題となっている．そこで，データ横断的な行動解析によるセグメント抽出の高度化と，モデル運用の効率化を目的とし，グラフニューラルネットワーク（GNN）に基づき顧客・店舗・コンテンツをベクトル化するモデルを開発した．これにより，単一のモデルで多様なセグメントを高精度かつ効率的に抽出できる．ドコモが保有する大規模かつ多様な顧客行動データをグラフ構造として統合し，GNNを用いて顧客・店舗・コンテンツを共通のベクトル空間に表現することで，単一モデルによる高精度かつ低コストなデジタルマーケティングを実現した．

01. まえがき

社会全体のデジタル化が急速に進展したことに伴い，リアル空間・サイバー空間を問わず，人々の多様な行動履歴が即時に収集・蓄積できるようになった．国内有数の大規模な顧客基盤をもつドコモでは，顧客の多様なデータを活用したデジタルマーケティングを推進し，顧客1人ひとりに最適な新しい顧客体験（CX：Customer Experience）*1の創出を図っている[1]．その一環として，これまで特定の店舗（ドコモの加盟店）や，スマートフォンアプリなどのコンテンツに興味をもつ顧客（以下，セグメント）を高精度に抽出してきた．現在，このセグメントに基づき，関心の高い顧客への広告配信を行うことで，顧客は関連性の高いコンテンツを享受することができている．
従来のドコモにおけるセグメント抽出では，対象となる店舗やコンテンツごとに，顧客の興味や利用度合いを推定する個別の機械学習モデル*2を構築・運用してきた．しかしながら，数百社にも上る加盟店や大量のスマートフォンアプリに対して，個別にモデルを構築することは，運用コストの増大を招く．例えば，モデルの性能維持・向上を図る際には，個々のモデルに対して独立した改善が必要となる．
そこでドコモでは，グラフニューラルネットワーク（GNN：Graph Neural Network）*3を活用し，顧客と店舗やコンテンツの複雑な相関関係を反映したベクトル表現*4を獲得するモデルを開発した．このGNNにより，顧客の加盟店での決済といった直接的な行動履歴に加え，顧客間の行動パターンの類似性や，店舗やコンテンツ間の利用傾向の関連性といった，データ間の間接的な相互作用までを学習することが可能となる．本手法により獲得された，顧客・店舗・コンテンツそれぞれのベクトルは，セグメント抽出だけでなくさまざまな下流タスクへの汎用性がある．例えば，あらかじめ算出されたベクトルを他の機械学習モデルへ入力することで，予測精度の向上といったモデルの性能改善に寄与する．また，セグメント抽出においては，従来のように個別のモデルを運用することなく，ベクトル間の計算のみで多種多様なセグメントを高精度かつ効率的に抽出できるようになった．
本手法の最大の特徴は，ドコモが保有する「顧客の多種多様な行動データ」をグラフ構造*5として統合した点にある．具体的には，あらかじめ同意を得た顧客の，基地局データに基づく位置情報，スマートフォンアプリ利用履歴，d払い・dカード利用履歴，dポイント付与履歴といった，横断的なデータをグラフの関係性として学習する．これら異種データ間の相互作用を考慮した学習によって，顧客の多面的な行動特性や店舗・コンテンツの特徴をとらえた，高精度なベクトル表現が獲得できる．
本稿では，本手法の設計や特徴について解説するとともに，オフライン検証における有効性について述べる．

顧客体験（CX）：商品やサービスの購入前から購入後，さらにはその後のフォローアップに至るまでの一連のプロセスを通じて顧客が得る，すべての体験や感情のこと．
機械学習モデル：データに潜むルールやパターンを学習し，未知のデータに対する予測や判断を行う数理モデルのこと．
グラフニューラルネットワーク（GNN）：データ同士の関係性を「グラフ」として定義し，その構造を学習する機械学習モデルの一種．ノード同士のつながりを考慮し，各ノードの特徴を表すベクトルを算出する．
ベクトル表現：文章や画像をはじめとした任意のデータを数値の列（ベクトル）として変換したもの．データがもつ意味や特徴を多次元の数値として表現することで，データ同士の計算や比較が可能になる．
グラフ構造：ノードとエッジで構成されるデータ表現．

02. GNNを用いたベクトル表現学習技術

2.1 異種混合データのグラフ化

本手法では，数千万人規模にわたる顧客の多様なデータを統合的に扱うため，顧客と，顧客が接点をもつ対象を「ノード*6（頂点）」，それらの間の行動を「エッジ*7（線）」とする，異種混合グラフを構築した．本グラフの概要を図1に示す．グラフにおけるノードは，「顧客」に加え，顧客が接触するサービスや場所である「加盟店（d払い・dカード・dポイント）」「スマートフォンアプリ」「地域メッシュ*8」により構成される．ここで地域メッシュとして4次メッシュを用いた．なおこのメッシュは総務省統計局などが用いる基準地域メッシュの2分の1地域メッシュである．そして，エッジは顧客の具体的な行動履歴に基づいて定義され，本手法では以下の3種類の関係性をエッジとして定義した．
①加盟店利用：d払い，dカードによる決済，およびdポイントの付与が行われた際に，顧客ノードと対象の加盟店ノード間にエッジを張る．
②スマートフォンアプリ利用：顧客が特定のアプリを一定時間使用した際に，顧客ノードとアプリノード間にエッジを張る．
③場所への滞在：ドコモの顧客理解エンジン「docomo Sense*9」の推定ロジックに基づき，顧客が特定の地域メッシュ内に一定時間以上滞留したと判定された場合に，顧客ノードと地域メッシュノード間にエッジを張る．

構築されたグラフは，数千万人規模にわたる顧客の行動履歴を反映した大規模な構造となっており，顧客の行動を統合的に表現している．

2.2 R-GCNによるベクトル表現の学習

構築したグラフから，顧客をはじめとしたノードの特徴を表すベクトル表現を獲得するために，本手法ではR-GCN（Relational Graph Convolutional Networks）[2]を採用した．
一般的なGNNでは，隣接するノードの特徴量*10を集約して自身のベクトルを更新する際，エッジの種類を区別せず，隣接ノードの特徴量に対して共通の重みパラメータ*11を一律に適用する．そのため，「加盟店利用」や「場所への滞在」といった意味の異なるエッジが存在する本グラフにおいては，それぞれのエッジがもつ特徴の違いを区別できない．一方でR-GCNは，特徴量を集約する過程において，エッジの種類ごとに異なる重みパラメータを適用する．これによって，顧客行動の種類に応じた情報の重要度を，ベクトルに反映させることができる．
ベクトルの学習は，グラフ内のエッジの有無（リンク）を予測する「リンク予測タスク」を通じて行う．リンク予測タスクとは，実際に存在するエッジと，ランダムに抽出された存在しないエッジを区別するものである．具体的にベクトルは「顧客Aの加盟店Bでのd払い決済」といった実在データには高いスコアを，未観測の組合せには低いスコアを算出するよう学習する．このスコア関数として，本手法ではDistMult[3]を採用した．DistMultは，リンク予測対象とする2つのノード s,o を表すd次元ベクトルe_s , e_o ∈ ℜ^d に加え，ノード間の関係性 l を表すd次元ベクトルr_l ∈ ℜ^d を用いた3つのベクトルの演算であり，以下の式で定義される．

ここでdiag( r_l ) はr_l の各要素を対角成分にもつd×dの対角行列*12である．
例えば，「顧客Aの加盟店Bでのd払い決済」のスコアを算出する場合，「顧客Aベクトル」「加盟店Bベクトル」「加盟店でのd払い決済を表す関係性ベクトル」を入力とする．このスコアは，「関係性の存在する可能性」としてとらえることができる．
さらに，以上により獲得されたベクトルは，顧客の行動履歴やサービスの特性を反映したものとなる．これにより，類似した行動を示した顧客のベクトル同士や，利用傾向が類似している店舗・コンテンツのベクトル同士が，高い類似度をもつことが期待される．

ノード：「グラフ」を構成する基本要素．「ノード」はグラフにおける点を指す．
エッジ：「グラフ」を構成する基本要素．「エッジ」はノード間を結ぶ線を指す．
地域メッシュ：総務省統計局の定めた，緯度・経度に基づき地域を網の目のように四角形に区切った区画のこと．本稿で用いた4次メッシュは，一辺が約500mの区画となる．
docomo Sense：ドコモが保有する多様な顧客データを解析し，顧客の属性や興味関心，滞在場所を推定する，顧客理解エンジン．
特徴量：機械学習モデルがデータのパターンを学習するために用いる，データの具体的な属性や情報．
重みパラメータ：機械学習モデルにおいて，入力データの重要度や影響力を調整する数値のこと．モデルの学習プロセスにおいて，予測精度が高くなるように自動的に値が更新される．
対角行列：行数と列数が等しく，左上から右下へ並ぶ対角成分以外の要素がすべて0である行列．

03. 技術の検証

3.1 検証概要

本手法により獲得されたベクトル表現の有効性を確認するため，実データを用いたオフライン検証を行った．検証タスクは，特定のd払い加盟店における将来の利用予測とした．具体的には，まず過去の行動データに基づき，各顧客が対象加盟店を利用する可能性（スコア）を算出する．その上で，スコアの高い上位10万人の顧客を抽出し，そのうち実際に決済を行った顧客の割合（Precision）を評価指標とした．またデータセットには，学習用として2025年7～9月までの3カ月間のデータを，評価用として10月の1カ月間のデータを用いた．なお評価対象は，利用規模の異なるd払い加盟店50社とした．
さらに比較手法として，従来のドコモにおけるセグメント抽出で用いられているLightGBM（Gradient Boosting Machine） *13[4]を採用した．この従来手法では，顧客の性別・年齢・契約情報などの属性や，過去の加盟店利用実績，アプリ利用履歴，滞在施設など，人手で設計された数百種類の特徴量を入力とし，各顧客のd払いを利用する可能性を推定する．一方で，本手法では，R-GCNによって得られたベクトルに対しDistMultに基づいてd払いを利用する可能性を表すスコアを算出する．なお，ベクトルの次元数は128次元とした．

3.2 定量評価結果

加盟店50社における本手法と従来手法の比較結果を図2に示す．結果として，48社の加盟店において，本手法が従来手法の精度を上回った．特に規模の大きな加盟店で，大きな精度の改善幅がみられた．さらに，運用コストの観点においても本手法は優位性がある．従来手法では加盟店ごとに個別のモデル構築とチューニングを要していたのに対し，本手法では単一のモデルでこれらを上回る精度を達成している．これにより，加盟店の増加に比例して増大していた運用コストを，大幅に抑制できるようになった．

3.3 ベクトル空間の可視化

本手法によって得られたベクトルは，セグメント抽出以外にも，さまざまな下流タスクにおける入力特徴量としての活用が期待される．例えば，顧客の興味関心対象の推定や，行動傾向の似た顧客の抽出などが挙げられる．そこで，これらのタスクにおいて重要となる，顧客の属性や嗜好が，獲得されたベクトル表現に反映されているかを検証した．具体的には，若年層（18～24歳）とシニア層（65歳以上）の顧客のベクトルを，t-SNE（t-Distributed Stochastic Neighbor Embedding）*14[5]を用いて2次元空間に可視化した．可視化対象の顧客は，ある大手ドラッグストアで10月にd払い利用履歴のある顧客からランダムにサンプリングした．
結果を図3に示す．図より，若年層とシニア層のベクトルの分布に差異が見られ，特にシニア層の顧客でベクトルが密集していることが確認できる．これは，モデルが顧客の属性情報と，それに伴う行動パターンの特徴を学習し，ベクトルとして表現していることを示唆している．従って，本手法によって得られたベクトルは，顧客の多面的な特徴を集約した表現となっており，下流タスクへの高い汎用性があると考えられる．

LightGBM：条件分岐を繰り返してデータを分類するモデルを，多数組み合わせることで予測精度を高めた機械学習手法．表形式のデータを扱うタスクにおいて広く利用されている．
t-SNE：高次元のデータを，2次元や3次元に圧縮して可視化するためのアルゴリズム．低次元上で似ているデータ同士が近くに集まるように配置され，高次元のデータを直感的に理解するために広く用いられる．

04. あとがき

本稿では，ドコモの大規模かつ多様なデータを活用し，顧客とサービスを汎用的なベクトルとして表現するGNNモデルの構築手法と，その有効性について解説した．d払い加盟店の利用予測タスクを用いたオフライン検証では，従来手法と比較して高い精度でのセグメント抽出に効果があることを確認した．さらに，本手法では単一のモデルから獲得されたベクトル表現を用いてセグメント抽出を行うため，効率的な運用ができる．また，ベクトル空間の可視化により，本ベクトルが行動データにおける顧客の多面的な特徴を反映していることが示唆された．
現在，本手法は実際のマーケティング施策へと適用されており，実サービスにおける効果検証を進めている．具体的には，加盟店の広告配信施策における迅速なセグメント提供を可能にしているほか，本手法で獲得されたベクトルを他AIモデルの特徴量として提供するなど，多面的な活用を推進している．今後も，顧客の多様な行動をこれまで以上に深く，かつ精緻にとらえた高精度なベクトル表現の獲得をめざす．

文献

[1] NTTドコモ：“ドコモマーケティングソリューション，”（2025年12月25日参照）．
https://ssw.web.docomo.ne.jp/marketing/
[2] M. Schlichtkrull, T. N. Kipf, P. Bloem, R. van den Berg, I. Titov and M. Welling：“Modeling Relational Data with Graph Convolutional Networks,”European Semantic Web Conference（ESWC）, pp.593-607, Jun. 2018.
[3] B. Yang, W.-t. Yih, X. He, J. Gao and L. Deng：“Embedding Entities and Relations for Learning and Inference in Knowledge Bases,”arXiv preprint arXiv:1412.6575, Aug. 2015.
[4] G. Ke, Q. Meng, T. Finley, T. Wang, W. Chen, W. Ma, Q. Ye and T,-Y. Liu：“LightGBM: A Highly Efficient Gradient Boosting Decision Tree,”Advances in Neural Information Processing Systems 30, 2017.
[5] L. van der Maaten and G. Hinton：“Visualizing Data using t-SNE,”Journal of Machine Learning Research（JMLR）, Vol.9, pp.2579-2605, Nov. 2008.

Vol.34 No.1 表紙に戻る