Special Articles

3GPP Release 18標準化活動(2)
3GPP Release 18におけるネットワーク自動化およびAI/MLの高度化技術

ネットワーク自動化 AI/ML 連合学習

Bahador Bakhshi Malla Reddy Sama
Riccardo Guerzoni

ドコモ欧州研究所
巳之口 淳(みのくち あつし)
6Gテック部

あらまし
次世代ネットワークにおいて,AI/MLと通信の組合せが期待されている.本稿では,3GPP Rel-18で検討されている,ネットワークのためのAI/MLと,AI/MLアプリケーションに対するネットワークのサポート機能を解説する.特に,これらの機能を実現する5GCの進歩について掘り下げ,5GCがどのように知的なネットワークの実現を促し,最先端のAI/MLサービスの展開をサポートするか述べる.

01. まえがき

  • 人工知能と機械学習(AI/ML(Machine Learning)*1)は,さまざまな業界で ...

    開く

    人工知能と機械学習(AI/ML(Artificial Intelligence/Machine Learning)*1)は,さまざまな業界で大きな可能性を秘め,急速に発展している技術である.複雑化するネットワークや増加するデータ伝送量,ますます要求が高くなるサービス品質(QoS:Quality of Service)*2などの要件を満たす必要がある通信は,AI/MLにとって特に重要で有望な分野である.AI/MLと通信ネットワークの緊密な組合せは,ネットワーク運用とユーザ体験の両方に大きな変化をもたらすことが期待されている.

    AI/MLと通信ネットワークの関係は,以下に示すように2つある.

    • AI/MLを使用すると,ネットワークの設計,運用,管理を大幅に改善できる.機械学習アルゴリズムは,ネットワークデータを分析することで,障害を予測および防止し,リソース割当てを最適化し,定型業務を自動化し,最終的に知的な自律ネットワークを実現する.これにより,ネットワークの効率と信頼性が向上するだけでなく,移動通信事業者の運用コストも削減できる.
    • 通信ネットワークは,アプリケーション層*3のAI/MLベースのサービスをサポートする上で重要な役割を果たす.最新のネットワークによって提供される高データレートと低遅延な通信は,AI/MLベースのリアルタイムアプリケーション*4に不可欠である.例えば,チャットボット*5やバーチャルアシスタントで使用される自然言語処理システムの効果的な動作は,ネットワーク接続に依存している.これらのアプリケーションがより洗練されるにつれて,信頼性の高い通信インフラストラクチャの必要性が高まり続けている.

    3GPP TSG SA(Technical Specification Group Service and System Aspects) WG2(以下,SA2)は,Release 18(以下,Rel-18)において,上記で述べたAI/MLと通信ネットワークの間の2つの関係を検討し,「AI for Network」と「Network for AI」の両方の側面に対処するために,次に示す2つの研究項目と対応する作業項目をそれぞれ定義した.

    • 研究項目①:FS_eNA_Ph3*6では,5Gコアネットワーク(5GC:5G Core network)*7の自動化を目的としたAI/MLを実現するため,主要な問題とそれを解決するソリューションを検討し,TR23.700-81[1]に文書化した.
    • 研究項目②:FS_AIMLsys*8では,AI/MLベースのサービスをサポートするための5GC拡張の主要な問題とそれを解決するソリューションを検討し,TR23.700-80[2]に文書化した.
    • 作業項目①:eNA_Ph3では,FS_eNA_Ph3で結論付けられた内容を主にTS23.288[3]に規定するための作業が行われた.
    • 作業項目②:AIMLsysでは,主にTS23.288[3],TS23.502[4],TS23.503[5]に記載されているFS_AIMLsysのソリューションを規定するための作業が行われた.

    本稿では,まず,Rel-18での5GCネットワーク自動化を実現する機能部の主な拡張の概要を示す.次に,5GCの新機能の紹介を通じて,AI/MLベースのサービスのサポートについて解説する.

    1. AI/ML:モデルを用いて推論すること,および,推論に用いるモデルを機械学習により生成すること.
    2. サービス品質(QoS):通信サービスの品質.帯域幅や遅延などが代表的な指標となる.
    3. アプリケーション層:OSI参照モデル第7層.アプリケーションが提供に必要な機能が定められている.
    4. リアルタイムアプリケーション:オンラインゲームやチャットアプリなど,即時更新やフィードバックが行われるアプリケーション.
    5. チャットボット:音声やテキストチャットを介して,人との会話を自動的に行うプログラム.
    6. FS_eNA_Ph3:Study on Enablers for Network Automation for 5G - phase 3.3GPP SA2 Rel-18における検討アイテムの1つ.
    7. 5Gコアネットワーク(5GC):5Gのアクセス技術向けに3GPPで規定された第5世代のコアネットワーク.
    8. FS_AIMLsys:Study on 5G System Support for AI/ML-based Services.3GPP SA2 Rel-18における検討アイテムの1つ.

02. 3GPP Rel-18 5GCネットワーク自動化を実現する機能部の機能拡張

  • 第5世代移動通信システム(5G)では,ネットワーク機能,OAM ...

    開く

    第5世代移動通信システム(5G)では,ネットワーク機能,OAM(Operations,Administration,Maintenance)*9などのさまざまなソースからデータを収集し,分析して統計や予測を提供する新しい機能として,NWDAF(Network Data Analytics Function)*10がRel-15で導入された.NWDAFのアーキテクチャと機能は,Rel-18以前のリリースで強化されている.Rel-17におけるネットワークデータ分析アーキテクチャを図1に示す.なお,Rel-18においても同様の分析アーキテクチャとなる.

    このアーキテクチャは,ネットワークの自動化を促進するためのいくつかの重要な機能をサポートしている.例えば,MLモデルの訓練と推論機能は,それぞれMTLF(Model Training Logical Function)*11とAnLF(Analytics Logical Function)*12という2つの分離された論理ネットワーク機能によってサポートされている.NF(Network Function)*13からのデータ収集とその調整は,DCCF(Data Collection Coordination Function)*14によって行われ,NWDAFなどのデータコンシューマがデータ収集に要するリソースを削減することができる.さらに,収集されたデータと分析結果は,5GCのデータレイク*15としてADRF(Analytics Data Repository Function)*16に格納され,データコンシューマがデータ収集に要するリソースを大幅に削減することができる.

    Rel-18では,Rel-17で仕様化されなかったいくつかの重要な機能の特定と対処が行われた.これらにはMLモデルの精度監視,複数のNWDAFによるMLモデルの連合学習(FL:Federated Learning),ローミング*17端末のためのPLMN(Public Land Mobile Network)*18間のデータおよび分析結果の交換のサポート,エンド・ツー・エンド転送遅延またはPDU(Protocol Data Unit)セッション*19トラフィック分析などが含まれる.以下では,NWDAFのサービスと機能のさらなる拡張について解説する.

    図1 Rel-17におけるネットワークデータ分析アーキテクチャ

    2.1 精度監視

    一般に,AI/MLを用いる利点は,ネットワークの性能と効率を向上させることである.しかしながら,AI/MLベースのソリューションの有効性は,MLモデルの性能に依存する.また,MLモデルが不正確な予測を提供する場合,予測に基づく決定によってネットワークの性能が低下する可能性がある.従って,AI/MLの利用が有効であり続けるには,MLモデルの精度を監視し,それを考慮することが重要である.このため,Rel-18では,MLモデルの精度監視と,分析の精度監視の2つの概念が導入された.

    前者は,MTLFを含むNWDAFによって提供されるMLモデルの精度指標を表す.これは,すべての予測の中でMLモデルによる正しい予測の数と,全予測に対応するサンプル数で構成される.

    同様に,後者は,AnLFを含むNWDAFによって提供される分析ID*20と呼ばれる特定の分析に対応した性能指標であり,すべての予測の中でその分析IDにおける正しい予測の数と,予測に対応するサンプル数で構成される.なお,分析については後述する.

    Rel-18における精度監視アーキテクチャを図2に示す.

    この精度監視アーキテクチャでは,デファクト機能であるNFコンシューマ*21でのAI/MLを活用した意思決定,AnLFでの推論,MTLFでのモデル訓練に加えて,新たにAnLFとMTLFにおける「精度確認」機能が提供される.

    AnLFでの精度監視および確認では,例えば,特定の分析IDに関連する予測と予測に対応する正解データをAnLFの精度確認機能が比較することで,NFコンシューマに提供されたAnLFによる分析結果の精度を監視する.この目的のため,NFコンシューマは,AnLFの分析結果に対するフィードバックを,AnLFに提供することができる.また,AnLFが精度の問題を検出した場合,NFコンシューマに提供した分析結果の使用を停止または一時停止するようNFコンシューマに通知し,分析結果の精度情報をMTLFに提供することができる.

    MTLFの精度確認機能を使用すると,例えば,AnLFが提供する精度情報を利用する精度確認機能のロジックに基づいて,MTLFはMLモデルの性能を監視できる.精度監視の結果に基づいて,MTLFはMLモデルを再訓練し,更新されたモデルをAnLFに送信することを決定する.

    図2 Rel-18における精度監視アーキテクチャ

    2.2 複数のNWDAF間のFL

    5GCでの複数のNWDAFの配備はRel-17でサポートされているが,NWDAF間の相互作用はない.NWDAFの訓練にあたって,このことは,各NWDAFがアクセス可能なデータベースの訓練データのみを使用してMLモデルを最初から訓練する必要があることを意味する.これにより,次の2つの問題が発生する.

    • 複数のNWDAFで同じMLモデルを訓練すると,計算資源が浪費される.
    • NWDAF間で訓練データの共有ができないことから,各NWDAFの訓練データが限られているため,許容可能な性能を達成するには,十分な訓練データを収集しなければならず,かなりの時間が必要になる可能性がある.

    これらの問題に対処するために,Rel-18において,NWDAF間のFLが導入された.FLとは,複数のクライアントが中央サーバの監視下で,訓練データを交換することなく,各クライアントが独自に保持するデータを使用してモデルを共同で訓練する分散型MLモデル訓練手法である.

    一般的なFLの訓練手順は,①FLサーバが複数のFLクライアントを選択し,モデルの現在のバージョンを共有する,②各FLクライアントがローカルの訓練データを使用してMLモデルを訓練し,MLモデルの更新情報をFLサーバに送信する,③FLサーバがFLクライアントからの更新情報を集約し,グローバルMLモデルの新しいバージョンを生成する,というステップで構成される.これらの3つのステップは,停止判定がなされるまで続く.

    NWDAF間のFLは,図3に示すように,3GPP仕様の3つの主要な手順によってサポートされている.具体的には,①登録と検出手順,②FL訓練手順,③FL保守手順である.

    1. まず,FL訓練に参加するFLサーバおよび/またはFLクライアントを含むNWDAFは,その能力をNRF(Network Repository Function)*22に登録する.
      次に,FLサーバはFL訓練手順を開始する前に,適切なFLクライアントを検出する必要がある.そのため,FLサーバはNRFに照会してFLクライアントを検出し,NRFに登録されているすべてのFLクライアントの中から訓練に用いるFLクライアントを選択する.
    2. 主なFL訓練のループがFLサーバによって実行される.まず,FLサーバは,選択されたFLクライアントにMLモデルの現在のバージョンを共有する.次に,FLクライアントのNWDAFは,各々が使用可能なローカル訓練データを使用してこのモデルを訓練し,モデルの更新情報をFLサーバのNWDAFに送信する.最後に,FLサーバのNWDAFは更新を集約し,グローバルMLモデルの新しいバージョンを作成する.
    3. さらに,FLクライアントがFL訓練(例えば,十分なリソースと訓練データがある)に適切に参加できるようにするために,FL保守手順もRel-18で導入された.この手順により,FLクライアントは訓練の状態をFLサーバに報告し,FLサーバはFLクライアントの追加/削除を決定する.

    なお,Rel-18においては特に,水平連合学習(HFL:Horizontal Federated Learning)*23をサポートしている.HFLでは,NWDAFなどのすべての訓練参加者が訓練データの同じ特徴セットをもつ,すなわち,FLクライアントとして機能するすべてのNWDAFは,データソースから同じ特徴/特性をもつデータを収集する.

    図3 Rel-18におけるNWDAF間のFL

    2.3 ローミングにおけるデータと分析結果の交換

    Rel-17では,分析機能は同一のPLMN内でのみサポートされており,VPLMN(Visited PLMN)*24にローミングアウトした端末のHPLMN(Home PLMN)*25観点での分析機能は提供されない.この問題を解決するため,Rel-18では,PLMN間のデータおよび分析機能の交換がサポートされている.全体のアーキテクチャを図4に示す.このアーキテクチャでは,各PLMNにRE-NWDAF(Roaming Exchange NWDAF)と呼ばれる専用のNWDAFを配置し,他のPLMNとデータおよび分析結果を交換する.

    ローミングシナリオでの全体的なデータと分析結果の交換の流れを次に述べる.

    PLMN(HPLMNなど)のNFコンシューマは分析結果を必要とし,H-RE-NWDAF,またはHPLMNにデプロイ*26された他のNWDAFに,特定の分析IDと分析対象のスライス選択のための補助情報を含む分析結果の要求を送信する.後者の場合,デプロイされたNWDAFは,分析結果を提供するには他のPLMNからのデータが必要であるか,データを別のPLMNで生成する必要があると判断する.その結果,データまたは分析結果の要求をH-RE-NWDAFに送信する.前者・後者いずれの場合も,H-RE-NWDAFが別のPLMNのNWDAF(V-NWDAF)との連携を介して提供すべきデータまたは分析結果の要求を行う.

    このため,H-RE-NWDAFはH-NRFを介して対応するV-RE-NWDAFを検索する.その後,H-RE-NWDAFはデータまたは分析結果の要求を該当のV-RE-NWDAFに送信する.VPLMNでは,V-RE-NWDAFは要求されたデータや分析結果をH-RE-NWDAFに提供する.V-RE-NWDAF自身がこれらのデータや分析結果を提供できない場合,VPLMN内の別のNWDAFへデータまたは分析結果を生成することをリクエストし,その結果をV-RE-NWDAFはH-RE-NWDAFに提供する.

    図4 Rel-18における分析結果およびデータ交換に関するローミングアーキテクチャ

    2.4 モデルの格納と検索

    Rel-17では,ADRFは分析結果やデータの格納先であったが,Rel-18では,MLモデルの格納先としても使用できる.MTLFを含むNWDAFは,MLモデルをADRFに格納でき,この格納されたモデルをそのNWDAFまたは他のNWDAFが取得できる.このことは,NWDAF間で間接的にMLモデルを共有することを意味する.

    Rel-18におけるADRFからのMLモデルの取得手順を図5に示す.この手順では,NFコンシューマからのMLモデル要求(ステップ①)を取得した後,MTLFを含むNWDAFは,要求されたモデルがADRFに格納されていることを確認し,MLモデルをADRFから取得するかどうかを決定する(ステップ②).NFコンシューマへの応答には2つのオプションがあり,NWDAFが,ADRFからMLモデルを取得して(ステップ③),NFコンシューマに返すか(ステップ④),ADRFからモデルを取得するために必要な情報をNFコンシューマに通知する(例えば,ADRFのID,ストレージ情報など).その後,NFコンシューマはADRFからモデルを取得する(ステップ⑤).

    図5 Rel-18におけるADRFからのMLモデルの取得

    2.5 ネットワーク分析の拡充

    Rel-18では,さまざまなNFがより知的な意思決定を行うために使用できる,多くの新しい分析が導入されている.分析の概要を以下に示す.

    (1)エンド・ツー・エンドのデータ量転送時間分析

    時間制約の厳しいアプリケーションに対するリソース割当てとポリシー制御のために,エンド・ツー・エンドのデータ転送遅延を予測することは有益である.Rel-18では,この問題に対する新たな分析が導入されている.

    この分析を提供するためにNWDAFは,OAMからRAN(Radio Access Network)*27側のリソースに関する情報を,主にSMF(Session Management Function)*28からQoSフロー*29情報などの端末通信に関する情報を,AF(Application Function)*30からアプリケーション情報を含むエンド・ツー・エンド遅延に影響を与える要因の情報を収集する.これらの情報を基に,アプリケーションID,端末位置情報,DNN(Data Network Name)*31,無線技術種別,S-NSSAI(Single-Network Slice Selection Assistance Information)*32などで指定された,特定の状況におけるUL(UpLink)*33/DL(DownLink)*34データ量とそれに対応する転送時間の統計・予測を提供する.

    (2)PDUセッションのトラフィック分析

    NWDAFは,PDUセッションのトラフィック分析により,単一または複数のPDUセッションを経由する端末のトラフィックが,サービスコンシューマから提供された情報と一致するかどうかの統計を提供する.

    この分析をサービスコンシューマに提供するためにNWDAFは,まず,特定のS-NSSAIやDNNに対して確立されたPDUセッション経由の端末トラフィックのトラフィックフロー情報を主にSMFやUPF(User Plane Function)*35から収集する,次に,サービスコンシューマから提供された情報(例:トラフィック記述内容,S-NSSAI,DNN)に従ってトラフィックをルーティングする端末と,サービスコンシューマから提供された情報によらずにトラフィックをルーティングする端末の統計情報を導出する.

    (3)移動行動分析

    Rel-17では,端末の通信や移動性に関する分析が導入されたが,それは主に特定の端末を対象とした分析である.資源配分とネットワーク運用の最適化のために,例えば,ネットワークのホットスポット*36に影響を与える群衆の動きといった,不特定多数の端末から収集された移動情報をもつことは有益であり,Rel-18では移動行動分析が導入された.移動行動分析では,分析対象地域における期間中の端末の数,移動方向,移動速度など,端末群の行動に関する統計または予測情報を提供する.

    この分析を提供するために,主にAMF(Access and Mobility management Function)*37とLCS(LoCation Service)*38から,NWDAFは特定地域における端末の移動に関する情報を一定期間収集する必要がある.そして,これらの情報を用いてNWDAFは端末の数などを予測する.

    (4)相対近接性分析

    ある端末が,近接する別の端末の情報を利用して位置推定精度を向上させるといった,端末間の近接性に基づくユースケースを容易に実現するために,端末間の相対近接性分析がRel-18で導入されている.これは,5GCのNFコンシューマが,端末間の相対近接性に関する統計情報や予測情報に基づいて,端末群の位置をより正確に特定するのを支援するために使用できる.さらに,この分析は,NFコンシューマが近傍端末の相対近接性を使用して端末の位置推定精度を向上させたり,別の端末の近くにある端末を特定したりするのに活用できる.

    この分析を提供するために,NWDAFはOAM,AF,AMF,LCSから端末の位置,移動,軌跡などのさまざまな情報を収集する.

    (5)パケットフロー記述(PFD:Packet Flow Description)*39決定分析

    5GCにおけるPFDは,従来AFによって与えられたルールを使用してUPFにて行われていたが,端末やAFが規定のルールと正確に一致しないトラフィックを生成する可能性があった.

    Rel-18では,トラフィックの生成を支援するため,既知のアプリケーション識別子に対するPFDの決定を支援するPFD決定分析が導入されている.

    この目的のために,NWDAFは既存のPFD情報とU-Plane*40のトラフィックに対してデータ分析を行い,分析結果を新規または更新されたPFD決定統計の形式(例えば,IP 3タプル*41リスト)で,5GCのNFコンシューマに提供する.なお,NEF(Network Exposure Function)*42(特にNEFのPFD機能*43)は,NWDAFによって提供される分析結果を受け取るNFコンシューマになる可能性がある.

    この分析を提供するために,NWDAFはUPFから現在のトラフィックフロー情報を,NEFから定義されたPFDルールを収集し,入力データを分析した後,新規または更新されたPFDルールを提供する.

    2.6 Rel-19におけるAI/ML

    5GC AIの強化はRel-19でも継続されている.FS_AIML_CNはRel-19で検討されている項目であり,4つの重要な課題を解決する.

    1. 1つ目は,AI/MLをRAN側に適用するための5GC側のサポートである.3GPP RAN WGでは,SA2と並行して,AI/MLを活用したNG-RAN(Next Generation-RAN)*44の性能向上の検討を行っている.CSI(Channel State Information)*45フィードバックの強化,ビームマネジメント,端末位置決定精度の向上など,さまざまなユースケースが特定されており,TR38.843[6]に文書化されている.これらのユースケースにAI/MLを利用するには,RANの強化に加えて5GCの拡張が必要になる可能性があり,Rel-19においてFS_AIML_CNの最初の重要課題で検討されている.
    2. 2つ目は,垂直連合学習(VFL:Vertical Federated Learning)*46のサポートである.前述のように,NWDAF間のHFLはRel-18でサポートされている.HFLの基本的な想定は,NWDAFなどのすべての訓練参加者が訓練データの同じ特徴セットをもつことである.これは,FLクライアントとして機能するすべてのNWDAFが,データソースから同じ特徴/特性をもつデータを収集可能である必要があることを意味する.しかし,FLにおいて常にその想定通りになるとは限らず,シナリオによっては,異なるNWDAFが異なる特徴をもつデータにアクセスする可能性がある.
      この場合に対応するため,VFLでは,NWDAFなどの訓練参加者が同じデータサンプルに対して異なる特徴をもつモデルをもつ場合においても共同で訓練することができる.例えば,とある参加者は特定の端末(データサンプル)の位置/移動に関する情報(特徴/特性)をもち,別の参加者は同じ端末のトラフィックに関する情報をもつ場合などが考えられる.
      このMLモデル訓練の手法は,QoE(Quality of Experience)*47に関連した分析において,NWDAFがAF側のユーザ体験のすべての詳細にアクセスできない場合,NWDAFとAFの間で使用することもできる.
    3. 3つ目は,PCF(Policy Control Function)*48に対するNWDAF支援によるQoSとポリシー制御の強化である.Rel-18では,PCFはQoSフローのQoSパラメータを決定するために,端末通信などの分析結果をNWDAFから購読することがあるが,PCFは過去の行動を考慮しない問題がある.すなわち,PCFは,QoSフローに適用されたQoSパラメータが実際に端末に期待された性能をもたらしたかどうかを考慮しない.そこで,過去に適用されたQoSパラメータもNWDAFが評価することで,PCFを支援するNWDAFによるQoSとポリシー制御の機能を向上させられる.
    4. 4つ目は,AI/MLを活用した,信号量過多の検出と信号量の緩和である.この目的のために,NWDAFの機能を拡充して,5GC内の他のNFが信号量過多を検出/予測するのを支援する情報を提供し,NFが適切な対策を講じることができるようにする.
    1. OAM:ネットワークにおける保守運用管理機能.
    2. NWDAF:5GCで規定されたネットワーク機能の1つ.ネットワーク内のさまざまなデータを収集,分析し結果を返す.
    3. MTLF:NWDAFにおいてモデル訓練や公開を行う論理機能部.
    4. AnLF:NWDAFにおいて推論や分析情報を導出する論理機能部.
    5. NF:5GCを構成するネットワーク機能.
    6. DCCF:NWDAFに代わって,データを収集し,また,データ収集を調整する,ネットワーク機能.
    7. データレイク:データを格納するストレージリポジトリ.
    8. ADRF:データや分析を保存および公開するリポジトリ.
    9. ローミング:利用者が契約している通信事業者のサービスエリア外でも,提携事業者のサービスエリア内であれば,契約している事業者と同様のサービスを利用できる仕組み.
    10. PLMN:移動通信システムを用いたサービスを提供するオペレータのこと.
    11. PDUセッション:端末とデータネットワーク間の論理接続.
    12. 分析ID:NWDAFが提供する分析を識別するためのID.
    13. NFコンシューマ:特定の機能を利用する側のNF.
    14. NRF:NFコンシューマによるNFプロデューサやNFサービスの発見,登録されたNFプロデューサの状態変更がある際の通知を実現するための登録・情報提供装置.
    15. 水平連合学習(HFL):FLの一種.異なるサンプルが共通の特徴をもつ.
    16. VPLMN:加入者がローミングした先のオペレータ(在圏オペレータ)のこと.
    17. HPLMN:加入者が契約している,ホームオペレータ.
    18. デプロイ:アプリケーションやコンテナ,VMなどをそれらの実行環境に配置して展開すること.
    19. RAN:3GPPにおいて,コアネットワークと端末の間に位置する,無線レイヤの制御を行う基地局などで構成されるネットワーク.
    20. SMF:5GCにおいてセッションを管理するネットワーク機能.
    21. QoSフロー:基地局とコアネットワーク間にセットアップされるPDU(Protocol Data Unit)session tunnelにQoSクラス(通信サービス品質(遅延許容時間,パケットロス率など)のこと)を区別するIPフロー単位.
    22. AF:アプリケーションを提供する,ネットワーク機能.
    23. DNN:端末の通信先.端末がコアネットワークを介して接続するデータネットワークの識別名.
    24. S-NSSAI:5GCにおいて用いられるNetwork Sliceを特定する識別子.
    25. UL:端末から基地局方向への情報の流れ.
    26. DL:基地局から端末方向への情報の流れ.
    27. UPF:5Gコアネットワークのネットワーク機能の1つ.ユーザパケットのルーティングおよび転送,パケット検査,QoS処理を担う機能.
    28. ホットスポット:屋内オフィスや駅前広場など,トラフィックが集中して発生する場所.
    29. AMF:5Gコアネットワークにおいて,基地局(gNB)を収容し,モビリティ制御などを提供する論理ノード.
    30. LCS:移動端末の位置を特定するサービス.
    31. パケットフロー記述(PFD):サードパーティのサービスプロバイダが提供するアプリケーショントラフィックフローの検出を可能にする情報セット.
    32. U-Plane:通信で送受信される信号のうち,ユーザが送受信するデータの部分.
    33. IP 3タプル:IPヘッダに格納されている宛先IPアドレス,送信元IPアドレス,プロトコル番号の3つの情報の総称.
    34. NEF:5GCで規定されたネットワーク機能の1つ.3GPP規定外の外部サーバやアプリケーションなどへのAPIを提供する.
    35. PFD機能:SMFへのPFD提供など,PFDの管理を行うNEFの機能.
    36. NG-RAN:5Gコアネットワークに接続されるRAN.無線アクセス技術としてNR,E-UTRA(Evolved Universal Terrestrial Radio Access)を用いる.
    37. CSI:基地局と端末を結ぶ無線チャネルの状態.
    38. 垂直連合学習(VFL):FLの一種.共通のサンプルが異なる特徴をもつ.
    39. QoE:ユーザの体感から導き出されるサービス品質.
    40. PCF:QoS制御,ポリシー制御,課金制御などを担う,5Gコアネットワークのネットワーク機能.

03. 3GPP Rel-18 5GC AI/MLベースサービスのサポート

  • AI/MLを基盤とするサービスは,医療,産業,教育を含むさまざまな領域で ...

    開く

    AI/MLを基盤とするサービスは,医療,産業,教育を含むさまざまな領域で急速に活用されている.これらのサービスは,非常に高い計算処理能力と大量の通信リソースを要求するため,通信ネットワークは,これらのサービスからの要求に適応する必要がある.

    ここでは,まず,AI/MLを基盤とするサービスをサポートするためにSA1によって特定されたユースケースを述べる.次に,5GCの機能拡充がこれらのAI/MLによるアプリケーションの,特定の要件にどのように対処するかについて,詳しく解説する.

    3.1 ユースケースと要件

    TR22.874[7]では,SA1は5GC上のAI/ML操作(ML訓練・デプロイなど)の主なユースケースとして,次の3つを特定した.

    (1)AI/ML操作の分割

    AI/ML操作の分割では,主な焦点は(ML訓練段階ではなく)推論段階にあり,AI/MLの操作およびモデルは,例えば一部分は端末に,他の部分はAFに,といったように現在のタスクと環境に従って複数の部分に分割される.例えば,AI/ML推論の計算集約的でエネルギー集約的な部分を5GCやAFにオフロード*49し,プライバシーや遅延に敏感な部分は端末に残すことができる.

    これらの端末やAF間で通信されるデータの量は非常に多く,アプリケーションによっては時間に敏感な場合がある.これらの条件でAI/MLを扱う場合は,5GCで対処する必要がある.さらに,AFによって実行されるべきAI/ML操作の適切な分割を決定するために,5GCに関する情報をAFに開示しなければならない場合もある.

    (2)AI/MLモデルのダウンロード

    AI/MLモデルについて,複数のAI/MLアプリケーションが端末上で動作することが想定されており,それぞれが固有のAI/MLモデルを必要とする可能性がある.さらに,1つのAI/MLアプリケーションが,状況に応じて異なるモデルを必要とする可能性がある.そのため端末は,タスクや環境の変化に応じてさまざまなモデルを切り替える必要がある.

    しかし,端末のストレージが限られており,継続的なモデル更新(再訓練)の必要性もあるため,すべてのモデルを端末に直接保存することは現実的ではない.従って,端末がタスクや環境の変化に適応できるようにするためには,5GシステムがAI/MLモデルをAFから端末にオンデマンドでオンライン配信する仕組みが必要である.

    しかし,このオンライン配信には,短時間で広い帯域幅が必要になる可能性がある.特に,自動運転のようなリアルタイムアプリケーションでは,端末の環境がリアルタイムで変動することから,大規模なモデルを非常に短い時間枠で配信する必要があり,5Gシステムに大量のネットワーク容量が必要になる可能性がある.さらに,アプリケーションの更新などの計画された定期的な更新を含むシナリオでは,適切な時間枠内で端末のグループに保存されているMLモデルを更新する必要がある.

    5GCは,これらの通信パターンを処理する必要がある.これがSA1で特定された2番目のユースケースである.

    (3)5Gシステム上のFL

    最後のユースケースは5Gシステム上のFLのサポートであり,ここには,FL訓練のサポートと促進が含まれる.ここでサポートされるFLは,前述のNWDAF間のHFLとは異なり,AFと端末で実行されるアプリケーションを含むアプリケーション層で行われる.

    5GCは,少なくとも2つの方法でFLの遂行に貢献できる.1つ目は,端末(すなわち,FLクライアント)の選択を円滑化することである.5GCは,AFに支援情報を提供し,FLプロセスに参加するのに適した端末の選択を支援する.2つ目は,MLモデルの配布である.前述のように,FLサーバは学習を行う予定のFLクライアントに現在のバージョンのモデルを配布する.5GCは,複数の端末へのMLモデルの配布をサポートする仕組みを提供できる.

    3.2 ネットワーク開示の拡充

    5GCでは,NEFはAFに5GC情報を開示する機能を担っている.AI/MLアプリケーションの場合,Rel-17ですでにサポートされた情報開示に加え,Rel-18では,例えば,適切なAI/ML操作の分割を決定する際に,アプリケーション層をサポートするためのいくつかの追加情報が,AFに開示される場合がある.この追加情報には,例えば,FLに参加する端末群のQoS,SMFから収集したPDUセッションの不活性時間,トラフィック量,UPFから取得したUL/DLデータレートが含まれる.

    3.3 AI/MLトラフィック転送サポート

    前述のように,AI/MLアプリケーションでは,AFから端末群へのMLモデルの配布と,MLモデルの計画的な更新という2つのトラフィックパターンが一般的である.これらのトラフィックパターンに対して,Rel-18の5GCでは,マルチメンバAFセッションと,QoS要件付計画的データ転送(PDTQ:Planned Data Transfer with QoS Requirement)ポリシー交渉を使用した計画的なデータ転送のサポートという2つの拡張機能が導入されている.

    (1)マルチメンバAFセッション

    Rel-17より前では,AFはNnef_AFsessionWithQoSサービス*50を使用して,特定の端末のQoSフローのQoSに影響を与える要求を行うことができる.しかしながら,FLに参加している端末群にMLモデルの現在のバージョンを配布するなど,AFが複数の端末にデータを送信する場合,各端末に対して同じ要求を繰り返す必要があり,5GCで大きなデータ送信の付帯的信号が発生する可能性がある.

    Rel-18では,このNnef_AFsessionWithQoSサービス操作が拡張され,単一の端末のアドレスだけでなく,端末群のアドレスも受け入れるようになった.新しいサービスの全体的な動作例を図6に示す.

    この例では,AFは最初に複数の端末(端末2および端末3)に対してQoS(5QI(5G network QoS class Identifier)*51=7,すなわちベストエフォートで指定)を使用したセッションを要求する.この要求は端末のリストとともにNEFに送信され,NEFはリストを処理し,リスト内の各端末に対して,5GC内における個々の要求を作成する.次に,NEFはこれらの要求をPCFに転送する.これにより,SMFに必要なPCC(Policy and Charging Control)*52ルールがPCFで導出され,これらのPCCルールに基づいて,SMFはUPFを構成する.最終的に,AFからの1つの要求は,AFが2つの端末と通信するための2つのU-Planeトラフィック経路(QoSフロー)のQoSに影響する.

    なお,AFは,1つの要求で複数のセッションのQoSに影響を与えるだけでなく,セッションのQoSとリソース使用状況の監視を要求する場合がある.この場合,端末群によるリソース消費が監視され,セッションQoSとともにAFに報告される.

    (2)PDTQ

    5GCでは,Rel-15以降,BDT(Background Data Transfer)*53ポリシー交渉がサポートされている.これにより,AFは5GCと交渉して将来の時間枠でデータを転送できる.ただし,BDTには,多くのAI/MLアプリケーションにとって重要なQoS要件のサポートが欠けていた.

    この制限に対処するために,Rel-18では,PDTQという新しいポリシー交渉が導入された.PDTQを使用すると,AFはデータ転送に必要なQoSを指定できる.この情報に基づいて,PCFは,指定されたQoS要件を満たしながら,要求されたデータを転送するための適切な時間枠を見つけるように努める.これを実現するために,PCFはNWDAFのネットワーク分析(例:ネットワーク・性能,デバイス・ネットワーク・性能)を利用して,ネットワークリソースの可用性を予測できる.全体的な交渉手順の例を図7に示す.

    この例では,ステップ①で,AFはNEFを通じてPDTQ交渉要求をPCFに送信し,対象端末(端末3),必要なQoS(例:5QI=7),および必要な時間枠(例えば,T1およびT2)を示す.

    ステップ②では,PCFは,可能性のある時間枠内でネットワークリソースの可用性を評価するため,NWDAFに分析を要求する.ステップ③では,得られた分析結果に基づいて,高い確率でQoS要件を満たす適切な将来の時間枠の一覧を,NEFを通じてAFに提供する.なお,AFは選択した時間枠が到来する前に,必要なQoS要件をもつQoSフローの要求を開始する.

    ステップ④では,PCFはポリシー交渉後もネットワークの状態を監視し続け,以前AFに提供した時間枠がもはや適切ではないと予測した場合(例えば,ネットワークリソースの可用性の変化),元の時間枠が開始される前に新しい時間枠(例えば,時間枠T3など)をAFに通知できる.

    図6 Rel-18におけるマルチメンバAFセッション、図7 Rel-18におけるQoSポリシー交渉を使用して計画されたデータ転送

    3.4 アプリケーション層におけるFLの支援

    Rel-18の5GCでは,AFがFLサーバとして機能し,端末がFLクライアントとして機能する場合において,アプリケーション層のFLを容易にするための拡張が導入されている.

    AFは,端末をFLクライアントのメンバとして選択するために,端末の位置,端末の移動性,端末の5Gシステムへの接続性能など,多くの要因を考慮する必要がある.このような多くのパラメータを収集することは,AFにとって複雑な作業であり,5GCとAFの間の付帯的信号も増加させる.

    これらの問題に対処するために,Rel-18では,NEFは「メンバ端末選択支援機能」と呼ばれる新しいサービスを提供している.この機能は,AFが提供する対象メンバ端末のリストの中から,1つまたは複数の候補端末のリストと,定義したフィルタリング基準に基づいて5Gシステムが生成した支援情報を基にした追加情報を,外部事業者が取得できるようにするものである.

    全体の手順を図8に示す.図8は5つのステップから構成されている.最初に,NEFはAFから,初期端末リスト,および必要に応じて時間枠,および1つ以上のフィルタリング基準(例えば,端末の現在位置,端末の移動方向,QoS要件,DNN,優先アクセス/RAT(Radio Access Technology)種別*54など)を含む要求を受信する(図8①).

    次に,AFによって提供されたフィルタリング基準に基づいて(図8②),NEFは関連する5GC NF(例:PCF,NWDAF,AMF,SMF)から,対象メンバ端末のリスト内のすべての端末の対応するデータを収集する(図8③).そして,NEFは,フィルタリング基準を満たす候補端末のリスト(すなわち,AFによって提供された初期端末のリストの中の端末)を導出する(図8④).

    最後に,NEFは,候補端末の1つまたは複数のリスト,および必要に応じて他の追加情報(例えば,アプリケーション操作を実行するための1つ以上の推奨時間枠,各対象端末のQoS,アクセス/RAT種別など)を含む,メンバ端末選択支援情報をAFに提供する(図8⑤).加えて,対応するフィルタリング基準を満たさない,フィルタリング基準ごとの端末数を提供することもできる.

    図8 Rel-18におけるメンバ端末選択支援手順
    1. オフロード:システムやサービス,ネットワークの処理を別の同様のサービスに振り分け本来のサービスの処理を軽減すること.
    2. Nnef_AFsessionWithQoSサービス:AFに対し,サービス要件やQoSモニタリング要件を提供するNEFのサービス.
    3. 5QI:5Gネットワークで特定のサービス品質(QoS)を達成するためのパラメータリストを参照する数値指標.
    4. PCC:5GシステムにおけるQoS制御などセッション管理や,サービスデータフローのためのポリシー制御やネットワーク利用に対する課金制御のこと.
    5. BDT:ユーザの直接操作なしにデータを受信するためのバックグラウンドデータ送信ポリシー.通常,ネットワークの負荷が低い期間に大量のデータを効率的に転送するために行われる.
    6. RAT種別:NR,LTE,3G,GSM,Wi-Fiなどの無線アクセス技術のこと.

04. あとがき

  • 本稿では,Rel-18で規定されている5GCのAI/MLに関する機能拡張について ...

    開く

    本稿では,Rel-18で規定されている5GCのAI/MLに関する機能拡張について解説した.具体的には,5GCの運用を最適化するためのAI/ML手法の機能拡充と,AI/MLベースのサービスをサポートするための5GCの拡張という2つのカテゴリについて述べた.

    最初のカテゴリには,精度監視機能,ローミングアーキテクチャ,複数のNWDAF間のFL,多数の新しい分析を含むNWDAFアーキテクチャ,機能およびサービスの拡張が含まれる.さらに,Rel-19のAI/MLに関する検討事項を簡単に解説した.

    2番目のカテゴリには,AI/ML操作分割を含むAI/ML操作,MLモデルのダウンロード,およびアプリケーション層FLをサポートするための5GCの拡張が含まれる.

    今後,通信ネットワークにおいてAI/MLはますます活用されることが想定されるため,ドコモは引き続きSA2での標準化活動を推進していく.

  • 文献

    開く

    • [1] 3GPP TR23.700-81 V18.0.0:“Study of Enablers for Network Automation for the 5G System (5GS); Phase 3,”Dec. 2022.
    • [2] 3GPP TR23.700-80 V18.0.0:“Study on 5G System Support for AI/ML-based Services,”Dec. 2022.
    • [3] 3GPP TS23.288 V18.5.0:“Architecture enhancements for 5G System (5GS) to support network data analytics services,”Mar. 2024.
    • [4] 3GPP TS23.502 V18.5.0:“Procedures for the 5G System (5GS); Stage 2,”Mar. 2024.
    • [5] 3GPP TS23.503 V18.5.0:“Policy and charging control framework for the 5G System (5GS); Stage 2,”Mar. 2024.
    • [6] 3GPP TR38.843 V18.0.0:“Study on Artificial Intelligence (AI)/Machine Learning (ML) for NR air interface,”Dec. 2023.
    • [7] 3GPP TR22.874 V18.2.0:“5G System (5GS); Study on traffic characteristics and performance requirements for AI/ML model transfer,”Dec. 2021.
このページのトップへ