NFVによる自動化とオーケストレーションの進化
- #5GE&6G
- #ネットワーク
Kostas Katsalis
Refik Fatih Ustok
Bertrand Souville
ドコモ欧州研究所
久野 友也(くの ゆうや)
中島 佳宏(なかじま よしひろ)
クラウドデザイン室
あらまし
NFVはネットワーク運用に大きな変革をもたらし,従来の静的でサイロ化された装置に対する手動のオペレーションから,オープンな仕様に基づく複数の装置に対する統一的な運用手法で構成が動的に変更される環境での自動化されたアプローチへと劇的に転換した.しかし,完全な自動化を実現するには,問題解析の手法確立,自動化システム自体の長期的な保守,自動化の精度向上など,多くの課題が伴う.
本稿では,NFVが完全な自動化とオーケストレーションに向けてライフサイクルとOAM運用をどのように進化させているかについて解説する.機械学習,人工知能,Closed-loop,統計解析,インテントドリブンな運用の導入など,標準規格やオープンソースソリューションによる継続的なNFVの技術進化により,モバイルネットワークに経済的かつ運用の効率性が向上する.
01.まえがき
ETSI(European Telecommunications Standards Institute)*1 ISG(Industry Specification Group) NFV(Network Function Virtualization)*2*3によって規定されたNFV-MANO(Management and Orchestration)*4を含むNFVフレームワークは,10年以上にわたる進化を遂げてきた(図1).NFVフレームワークは仮想化ネットワーク環境向けに設計され,当初の目的はネットワーク機能のソフトウェア部をハードウェアから分離し,計算リソース・ストレージリソース・ネットワークリソースを集約した基盤による経済性と運用性の向上であった.
NFVの仕様はおよそ2年おきに新バージョンがリリースされ,そのRelease 3(2020年)では,複数のNFVI(Network Functions Virtualization Infrastructure)*5-PoP(Point of Presence)*6や複数の管理ドメインにわたるネットワークサービスを管理する要求に対応するため,WIM(WAN Infrastructure Manager)*7機能ブロックやNFVO(NFV Orchestrator)*8間の参照点が導入された.NFV仕様のRelease 4(2022年)では,CISM(Container Infrastructure Service Manager)*9・CIR(Container Image Repository)*10・CCM(CIS Cluster Management)*11といったコンテナ*12管理およびオーケストレーション*13機能が追加され,クラウドネイティブ*14の設計原則に従い,コンテナベースのVNF(Virtualized Network Functions)*15とネットワーク機能を管理できるようになった.2022年以降,ETSI ISG NFVコミュニティはNFVフレームワークを次世代のアーキテクチャへ積極的に進化させる取組みを行っており,今後10年間に向けたビジョンとコンセプトを策定している.
6G通信の実現に向けて,NFVフレームワークは,従来のNFV-MANOから,エンド・ツー・エンドでのネットワーク自動化をめざした「NFV Telco Cloud」と呼ばれるアーキテクチャへと進化しつつある.その目的は,ネットワークにおけるアプリケーションとリソースのライフサイクル管理の改善,スケーラビリティ*16の向上,そしてAIエージェント*17によるインテントドリブン*18かつClosed-loop*19の自動化を可能にすることである.
本稿では,NFV Telco Cloudが,クラウドネイティブでモジュール化され,従来の各操作をシステムに具体的に指示する命令的な運用方法から要求する常態をシステムに宣言し実際の動作はシステムに委ねる宣言的な運用方法,そして期待する成果のみを伝えシステムに要求する状態やポリシーまですべて任せるインテントドリブンな運用方法へ変革(図2)したオーケストレーション機構を通じて,AIエージェントを管理する基盤を提供できることを明らかにする.また,AIエージェントがNFV Telco Cloud運用を拡張し,予測的障害管理*20,適応的リソース割当て,超分散インフラ*21の知的なオーケストレーションを可能にしたことについて解説する.
- ETSI:欧州電気通信標準化機構のこと.
- ETSI ISG NFV:ETSIに属するNFV ISGであり,NFV(*3参照)の標準仕様を推進する団体.
- NFV:通信事業者ネットワークのネットワーク機能を,仮想化技術によって汎用ハードウェアから分離する原理.
- NFV-MANO:仮想化環境におけるハードウェアリソース,ソフトウェアリソースなどのVNF(*15参照)管理機能とオーケストレーション(*13参照)機能を提供する仕組み.
- NFVI:ETSI NFVで定義された,VNF(*15参照)が展開される環境を構築するすべてのハードウェアおよびソフトウェアコンポーネント(*34参照)の総称.クラウドプラットフォームを構成する汎用サーバ,ストレージデバイス,ネットワークデバイス,およびそれらの物理リソースを仮想化するための仮想化レイヤ上のソフトウェアの総称.
- PoP:仮想化されたネットワーク機能であるTCAをデプロイ可能なデータセンタやリソースプール.
- WIM:WANをまたいでNFVIもしくはVIMを管理するコンポーネント(*34参照).
- NFVO:複数のVIMにまたがる仮想リソースのIMSを実行し,VNF(*15参照)やネットワークサービスを展開・管理するシステム.
- CISM:ETSI NFVで定義されたCISリソースを管理するシステム.
- CIR:ETSI NFVで定義されたコンテナ(*12参照)イメージを格納・保管する機能を提供するコンポーネント(*34参照).
- CCM:ETSI NFVで定義されたCISMやCISリソースを構築したり管理したりするシステム.
- コンテナ:ホストOS上に専用領域(コンテナ)を作成し,その中で必要なアプリケーションソフトウェアを動作させるコンピュータ仮想化技術.
- オーケストレーション:アプリケーションやサービスの運用・管理を自動化するために,必要なリソースやネットワークの接続を管理・仲介する技術.
- クラウドネイティブ:オンプレミスではなく,クラウド上での構築運用を前提として設計されたシステムやサービスを指す.
- VNF:仮想化された通信機能(通信システム).
- スケーラビリティ:運用中に新しい要件を満たすために,性能や容量の増加・減少や,機能の追加・削除を行える能力のこと.本稿では,システム全体での機能提供のために,マルチベンダで提供される製品やソリューション機能の組合せや最適化を行える能力のことを含む.
- AIエージェント:ユーザ・システム・アプリケーションの代理として自律的にタスクを実行する概念や仕組み.
- インテントドリブン:AIなどを利用し「意図(インテント(*22参照))」を入力することで装置やネットワークがインテントに従った振舞いをするように制御する仕組み.
- Closed-loop:運用の自動化の仕組みであり,人手を介することなく,ネットワークや装置の状態変更に対して対処を行い,ネットワークや装置を自動で制御し続ける仕組み.
- 障害管理:管理オブジェクトのアラーム(*40参照)一覧の取得,アラーム通知,アラーム削除などのシステムの障害や,その障害に対処するための手順や機能.
- 超分散インフラ:数台~数十台という少数のサーバで構築されたデータセンタやリソースプールが,数千~数万というオーダで分散構築されたインフラのこと.
02. Release 6におけるNFV Telco Cloudの仕様化とAIの活用
2.1 NFV Telco Cloudの仕様化
Release 6(2026年予定)では,ETSI GR NFV-IFA 054[1]に従い,NFV Telco Cloudが規定された(図1).このフレームワークはTCA(Telco Cloud Application)とTC-Infra(Telco Cloud Infrastructure)を対象とし,以下も含まれる.
・Telco Cloud Orchestrationサービス:インテント*22ベースのサービス要求と,その他NFV Telco Cloudが提供する命令型または宣言型のAPI(Application Program Interface)*23に対する要求を,OSS(Operation Support System)*24などのNFV Telco Cloud外の装置から受信し,それらの要求をネットワークレベル*25で解釈し管理運用する.
・Telco Cloud Platformサービス:モジュール型のサービス基盤であり,ライフサイクル管理(LCM:Life Cycle Management)およびOAM(Operations, Administration, Maintenance)*26サービスを含み,任意のTCAに対応する.
・TC-Infraサービス:物理インフラ,仮想化インフラ,OSコンテナインフラ,その他新しいインフラ形態を含むインフラストラクチャ*27である.
なお,アーキテクチャの構成要素,対応するサービスインタフェースおよびTCAディスクリプタ*28(以下,ディスクリプタ)はRelease 6にて策定中である.
2.2 AIエージェントの導入
新たに規定されたNFV Telco Cloudにより,AIエージェントが自律的な意思決定,インテントドリブン型のタスク実行,ソフトウェアエンティティ*29間の動的協調が可能になる.通信事業者にとって,この新しい機能は従来の指示や信号に対するワークフローベースの命令型アプローチによるネットワーク制御のシステムから,ネットワークと基盤が一体となったAI駆動の自律システムへのパラダイムシフト*30を意味する.
NFV Telco CloudにおけるAIエージェントは,そのAIの特性を利用した2つの考え方がある.1つはAIエージェントを効果的に実現するためにCloudがAIをサポートする考え方(Cloud for AI)であり,もう1つはAIがCloud運用のさまざまな課題を解決する考え方(AI for Cloud)である.NFV Telco CloudにおけるCloud for AIとAI for Cloudの構成を図3に示す.
(1)Cloud for AI
AIエージェントをCloudがサポートする方法として,NFV Telco Cloudは,ライフサイクル管理,スケーリング*31,オーケストレーションなどのNFVフレームワークを活用して,Telco Cloud内にAIエージェントをTCAとしてデプロイ*32できる.TCAとしてデプロイされたAIエージェントは,通信インフラストラクチャ内で管理可能なエンティティになり,他のネットワーク機能を制御するのと同じく,標準化されたディスクリプタ,自動化パイプライン*33,相互運用性メカニズムの恩恵を受けることができる.
このアプローチにより,通信事業者はAIエージェントをネットワークコンポーネント*34として扱うことができ,異種インフラストラクチャ間での移植やAIエージェントとOSS/BSS(Business Support System)*35システムとのシームレスな統合が実現できるようになり,AIエージェントを効果的かつ効率的に利用することができる.
(2)AI for Cloud
通信事業者は,AIエージェントを活用して,運用効率が向上し,信頼性が高く,自己最適化するネットワークを構築できる.従来の静的,サイロ化*36された,部分的に自動化された運用とは異なり,AIエージェントを利用した運用は,AIテクノロジにより,TCAとその基盤となるTC-Infraの完全に自動化されたAI駆動の運用管理とオーケストレーションが可能になる.
Release 5までは,自動化の取組みとして,主にポリシー管理,ETSI GS NFV-IFA 047[2]で規定されたデータ分析機能(MDAF(Management Data Analytics Function)*37)とETSI GS NFV-IFA 050[3]で規定されたインテント管理インタフェースに重点を置いていた.しかし,これらの仕様では,完全に自動化されたAI駆動の運用管理とオーケストレーションのような機能をAIエージェントとして実現する方法や,汎用的なモデルや生成AIを利用した一般的なAIエージェントとの関係,およびこれらエージェントがどのように連携できるかについては仕様化されていなかった.さらに,既存のワークフローに統合する方法も不明瞭であった.ETSI NFVでは,Telco Cloudの実現に向けてAIエージェントとポリシーの関係の明確化や,既存ワークフローとの関係の明確化をRelease 7に向けて検討する予定である.
- インテント:管理対象のネットワークに対する要件や最終形態,制約などの期待値のこと.自動化の一手法としてインテントを入力することで,システムが自動でネットワークを制御することができるようになる.
- API:アプリケーションから特定のサービスを利用するためのインタフェース.
- OSS:移動体通信ネットワークの障害や輻輳を発見し,制御や対策を行う通信事業者向けの運用支援システム.OSSは,通信事業者が提供するサービスを利用できるように,ネットワークやシステムの障害管理,構成管理,課金管理,性能管理,セキュリティ管理などを行う.
- ネットワークレベル:複数のTCAによって構成されたネットワークを基準とした考え方のこと.ここではTCAの1つひとつのコンポーネント(*34参照)ではなく,TCA同士のつながり同士のことを指す.
- OAM:装置やネットワークの運用,管理,保守を支援する機能やシステム.
- インフラストラクチャ:アプリケーションを実行するのに必要な物理的もしくは仮想的なデータセンタやサーバ,ネットワークなどの総称.
- TCAディスクリプタ:Telco Cloud Applicationの機能や振舞いを定義するテンプレート.VNFD(*58参照)の後継.
- エンティティ:ソフトウェアの本体やコンポーネント(*34参照)などの一意の識別子をもつ構成要素や概念などのまとまりのこと.ここではソフトウェアが機能する最小単位を指す.
- パラダイムシフト:コンセプトや考え方,原則などが根本的に変わること.
- スケーリング:通信ソフトウェアを構成するVM(*48参照)の処理能力がハードウェアやVMの負荷状況に応じて不足または過大になった場合に,そのVMを増減させて処理能力を最適化すること.
- デプロイ:アプリケーションとその実行環境を配置・展開し,利用可能な状態にすること.
- パイプライン:一連の手順に従ってデータや開発されたプログラムを順次処理する仕組みのこと.
- コンポーネント:システムを構成する部品.NFVにおいてはNFVO,VNFM,VIM,CISM,VNFなどの各機能部のことを指したり,VNFの中のVNFC(VNF Component)を指したりすることがある.
- BSS:ビジネス支援システム.通信事業者における顧客管理やオーダ管理などに利用される.
- サイロ化:装置やシステム,ベンダごとに分断された構成や状況のこと.
- MDAF:ETSI NFVで定義された機能部であり,運用系のデータを分析し統計的な結果を出力する.
03. 自動化に向けたNFV Telco CloudのAI活用と進化(AI for Cloud)
3.1 AIエージェントを利用したユースケース例
AIエージェントは,計算リソース・ストレージリソース・ネットワークリソースを横断して,TCAとリソースを自律的に管理することができる.また,システム状態を継続的に監視し,ワークロード*38配置を最適化し,SLA(Service Level Agreement)*39を遵守する.以下に運用効率を向上させる代表的なユースケースを示す.
・予防保全(Predictive Maintenance):AIエージェントは,リアルタイムにNFV Telco Cloudから収集したTC-Infraの計算リソース・ストレージリソース・ネットワークリソースに関する性能データ,アラーム*40,過去の障害パターンを分析することで,機器故障の予兆を検知し,予防保全を行うことで障害を未然に防ぐ.これによりダウンタイム*41を最小化,運用コストを削減し,サービスの信頼性を向上できる.
・自己修復(セルフヒーリング*42):AI駆動のオーケストレーションにより,TCAやTC-Infraの障害や性能劣化を検出し,再起動,スケーリング,マイグレーション,リソース再配分といった復旧処置を自動的に実行する.これによりサービス継続性を確保し,ダウンタイムを最小化し,運用上の信頼性を向上できる.
・ポリシー検証(Policy Verification):AIエージェントは,導入されたネットワーク構成とTCA構成が所定のポリシーに準拠しているかを検証する.NDT(Network Digital Twin)*43技術などを用いて工事や設定変更前にポリシー影響を分析し,誤設定や,複数回の設定変更や同時制御による操作の競合を未然に防ぐことができる.
・障害・リスク予測(Failure and Risk Prediction):AIエージェントは,TCAのテレメトリデータ*44,KPI(Key Performance Indicator)*45,過去の障害データを継続的に分析し,トラフィック変動や脅威などの外的要因によるサービスへの影響や,キャパシティ不足や性能限界などの内的要因によるボトルネックを予測し,TCAの限界をシミュレーションすることで潜在的なネットワーク拡張や規制などの事前措置を行う.これらテレメトリデータ,KPI,過去の障害データなどに対するデータ分析に基づいた支援によって,大規模なモバイル通信網の障害の事前回避が可能となる.
・エネルギー効率化(Energy Efficiency):AIエージェントは,ワークロードとTCA全体のインフラ利用を動的に監視することで,リソース割当てを最適化し消費電力を削減する.これによりサービスの性能を維持しながら環境への負荷を低減できる.
・動的リソース割当て(Dynamic Resource Allocation):AIエージェントは,トラフィックの負荷やアプリケーションの需要を監視し,需要ピーク時にロードバランサ*46や5GコアNF(Network Function)*47のスケールを予測する.逆に需要減少時にはリソースを解放・集約しコストを削減する.
・動的接続性(Dynamic Connectivity):AIエージェントは,ユーザ需要の変化やTCAの増減設定・マイグレーションに応じて,ネットワークパスや仮想化機能,TCAのConfig値を動的にオーケストレーションし,最適経路の設定や帯域制御を行う.
上記はAIエージェントの代表的な応用例であり,今後NFV Telco CloudとAIエージェントのさらなる進化により,AI駆動によるネットワーク管理のユースケースや効果は拡大していく.
3.2 NFV Telco Cloudにおける標準化の検討状況
AIエージェントは新しい技術であり,NFVを含め業界全体におけるAIエージェント技術の標準化は依然として発展途上であるが,NFV Telco Cloudにおいて検討されているAIエージェントは,エンド・ツー・エンドのサービスオーケストレーションを階層および機能部を横断して支援し,Closed-loopを実現する主要な自動化のキーテクノロジとして期待されている.より具体的には,AIエージェントはTelco Cloud Orchestrationサービスに加え,Telco Cloud PlatformサービスおよびTC-Infraサービスが提供する機能をインテリジェントに支援することが想定され,保守運用の完全自動化であるCCL(Closed Control Loop)やインテント管理に向けた標準化の策定が始まっている(図4).
①省電力のためのAIエージェント活用ユースケース
例えば,省電力のための動的リソースの割当てに対応する場合,Telco Cloud Platformサービスに存在するAI機能を備えた監視エージェントが,TCAの性能を継続的に追跡・分析するユースケースが提案されている.同様に,TC-InfraにおけるAIエージェントは,VM(Virtual Machine)*48/コンテナの利用率やコンピュート*49ノードのエネルギー消費を追跡するユースケースが検討されている.これらの情報は「性能最適化エージェント(POA:Performance Optimization Agent)」というAIエージェントに渡され,低需要時に稼働するサーバ数を減らすためにどのワークロードを集約できるかを決定する.さらに,別のAIエージェントは,集約可能なワークロードのライブマイグレーション*50を実行してサーバを空転させ,空転している未使用サーバを停止させる役割を担うユースケースも標準化で検討されつつある.
②インテント管理のためのAIエージェント活用ユースケース
もう1つの例はインテント管理に関連する.NFVにおけるAIエージェントを用いたインテント管理により,通信事業者は「10人の加入者向けのモバイル通信サービスが必要である」といった概念的な要求を,詳細な設定を指定せずにNFV Telco Cloudに要求できるようになる,という仕組みが標準仕様化で進められている(図2).AIエージェントは分析,予測モデリング,Closed-loopを活用して,これらのインテントを実行可能なポリシーへと翻訳する動作と,TCAやTC-Infraを継続的に監視してリソース割当てやオーケストレーションをリアルタイムに適応させる動作が標準化で検討され始めている.このアプローチは運用を簡素化し,機動性を高め,ネットワークが性能と効率の両面で最適化された状態を維持できるようにするユースケースを実現する.
NFV Telco CloudにAIネイティブ特性を組み込むためには,標準化されたインタフェースやディスクリプタの利用にとどまらず,AIエージェントがいくつかの機能的・非機能的要件を満たすことが求められる.要件例を以下に述べる.
(1)AIエージェントの機能要件例
・データ収集:CPU,メモリ,トラフィック,エネルギー消費などのリアルタイムテレメトリデータを収集し,NFV Telco Cloud・データ管理システムと連携する能力.
・意思決定:ユースケースごとに学習済みのAI/ML(Artificial Intelligence/Machine Learning)*51モデルを適用し,SLA遵守のためにさまざまな観点からネットワークを最適化する計画を立案し,その計画に沿って制御内容を決定する能力.
・復旧処置:ほぼリアルタイムで復旧処置を実行する能力.ただし,これはTCAの種類に依存する(インネットワークコンピューティング*52アプリケーションやクラウド化RAN(Radio Access Network)*53管理機能などはほぼリアルタイムで措置可能).
・ポリシー管理:通信事業者が定義したポリシー(QoS(Quality of Service)*54,省エネ,コスト制約など)を施行し,ポリシー更新に動的に適応する能力.
・AIエージェント間通信:標準化インタフェースを用いてAIエージェント同士が相互通信できる能力.
・自動化とオーケストレーション:サービス監視ワークフローと統合され,Closed-loopを実現できる能力.
・学習と適応:テレメトリデータに基づきMLモデルを継続的に更新し,新しいMLモデルを自動化やオーケストレーションに適用する能力.
・セキュリティ:AIエージェント間通信を認証・認可する能力.AI/MLモデルの信頼性を保証し,AIエージェントや悪意のある学習データ提供者からの敵対的操作を防ぐ.さらに要求に応じて意思決定の根拠を説明できる能力.
(2)AIエージェントの非機能要件例
・性 能:重要ユースケースにおいては,AIエージェントのミリ秒~秒単位の低遅延意思決定を支援し,テレメトリストリームの高スループット処理を行う.
・信頼性と可用性:冗長性やフェイルオーバー*55機構を備える.
・相互運用性:業界標準に準拠し,マルチベンダ環境において相互運用可能である.
・セキュリティ:テレメトリデータおよび制御信号をエンド・ツー・エンドで暗号化する.
・透明性:オペレータからの信頼性向上を目的とし,各種意思決定や動作の透明性を高めるために,監査やトラブルシューティング用として動作ログを記録する.
・拡張性:モジュラーアーキテクチャを採用し,新たなMLモデルや最適化アルゴリズムを容易に追加できる.
なお,NFV Telco Cloudの対象範囲はモバイルコアネットワーク*56やRANに限定されず,エンド・ツー・エンドの管理・オーケストレーション機能を可能にすることにある.例えば図5に示すように,運用システムの観点からはRAN管理システム,クラウド化コアネットワーク管理システムだけでなく,さらに両者を接続するコアネットワークとの相互作用も想定されている.
ETSI NFVではこれらの機能要件や非機能要件の抽出のガイダンスになるように,基本的なコンセプトや機能分担を定義し,必要となるインタフェースやディスクリプタを標準化しつつあるが,現状では通信事業者やベンダがAIを利用する場合はAIエージェントの実装に依存するところが大きくマルチベンダ化が難しい.このため,新しい技術であるAIエージェントの技術動向と標準化は,協調しながら業界全体の発展に貢献していく責務がある.
3.3 AI for Cloudの実現に向けた要件
長年にわたり,ETSI NFVは3GPP(3rd Generation Partnership Project)*57が定義したネットワーク機能の運用管理に重点が置かれてきている.AIエージェントの導入を支援するためには,両者の共通フレームワーク内でこれらネットワーク機器の構築や運用ができるよう,以下のように,いくつかの要件の追加が必要となる(図6).
(1)MLモデルの仕様化に向けたディスクリプタに関する要件
NFV-MANO Release 5までは,MLモデルがVNFD(VNF Descriptor)*58やNSD(Network Service Descriptor)*59の一部として考慮されてこなかった.NFV Telco CloudでMLモデルを対応できるように,以下のいずれかの仕様化が必要となる.
•ETSI GR NFV-IFA 046[4]の分析のとおり,標準化されたモデリングの一部として,MLモデルをディスクリプタ内で完全に定義する.
•標準化されたモデリングの一部として,TCA用のMLモデルをディスクリプタから参照する.
•MLモデルをTCAパッケージ内に成果物(artifact)として含めるが,標準化されたディスクリプタ内に定義しない.
(2)リアルタイムなAIエージェントの収容可能なインフラの要件
AIエージェントの動作がリアルタイム性を伴うといった特有の運用特性に対応するため,TC-Infraサービスは新しいタイプのインフラを管理する必要がある.リアルタイムなAIエージェントを効果的に収容するためには,TC-Infraサービスはクラウドネイティブ・プラットフォームの柔軟性と,キャリアグレードネットワークの厳格な性能を組み合わせた以下の要件が必要となる.
•Kubernetes*60などのインフラ管理技術に基づく分散コンテナ化したインフラが必要であり,コアネットワーク,エッジ*61,ファーエッジサイト*62にわたりAIワークロードを動的にスケーリング・配置できる基盤が求められる.このインフラは,特にRANやユーザプレーン機能*63などのユースケースにおいて,リアルタイムで意思決定を支援する低遅延・高スループットのネットワーク接続を提供しなければならない.
•大規模かつ高性能なAI推論を実現するためにGPU(Graphics Processing Unit)*64,FPGA(Field Programmable Gate Array)*65,SmartNIC(Network Interface Card)*66といったアクセラレータ*67ハードウェアのインテグレーション*68が必要となる.
•マルチテナンシー*69,相互運用性,安全なAPIをサポートし,異なるベンダのAIエージェントが安全に共存・相互運用し,情報交換をシームレスに行えるようにする必要がある.
- ワークロード:CPU使用率などのシステムの負荷の大きさを表す指標.特にパブリッククラウドの分野では,クラウド上で実行されるOSやアプリケーションコードなどを含めたシステム自体を表すこともある.本稿では後者の意味で用いる.
- SLA:サービス提供者とサービス消費者との間のサービスの信頼性の契約事項.本稿ではサービス消費者から期待される信頼性要件という意味で利用している.
- アラーム:物理機器や仮想化ネットワーク機器などの障害(アラーム).
- ダウンタイム:障害やメンテナンスなどで機能やサービスが停止する時間.
- ヒーリング:ハードウェア障害やVM(*48参照)障害が発生した際に,正常なハードウェア上にVMを移動または再生成することで通信ソフトウェアとして正常な状態に復旧する手続き.
- NDT:通信ネットワークを構成するソフトウェアやハードウェアや仮想リソースを仮想的に再現し,設計やメンテナンスなどの運用をサポートする技術.
- テレメトリ:遠隔で測定・観測を行い,観測対象からデータを取得し,収集したデータを分析したり監視したりする技術.
- KPI:ユーザやシステム性能を測るための主な指標.
- ロードバランサ:外部からの要求を一元的に管理して同等の機能を有するサーバに要求を転送する装置.負荷分散のために用いる.
- NF:システムを構成する基地局,スイッチ,中継装置などの個々のネットワーク機能を識別する論理単位.
- VM:物理計算機の内部にソフトウェアによって仮想的に構築された計算機.
- コンピュート:仮想化基盤において計算リソースを提供するマシンであり,サーバなどのこと.
- ライブマイグレーション:仮想リソース上のアプリケーションを,動作した状態で他の物理サーバに移動させること,またはそのための技術.
- AI/ML:モデルを用いて推論すること,および,推論に用いるモデルを機械学習により生成すること.
- インネットワークコンピューティング:端末またはクラウドが担っていた計算処理の一部を,ネットワークの中の計算リソースで実行すること.
- RAN:コアネットワーク(*56参照)と移動端末の間に無線基地局などを配置し,無線レイヤを制御するネットワーク.
- QoS:ネットワークにおいて,パケットにマーキングして優先的に処理するなどの方法により,通信品質を適切に管理するための技術.音声通話などにおいて通話が途切れないようにデータ転送よりも優先するなどの処理を行う.
- フェイルオーバー:システムに障害が発生した際に自動的に冗長化された待機システムに切り替える仕組み.
- コアネットワーク:パケット転送装置や加入者情報管理装置などで構成されるネットワークで,通常は他のネットワークと相互に接続される.移動端末はRANを介してコアネットワークと通信する.
- 3GPP:移動通信システムの規格策定を行う標準化団体(*73参照).
- VNFD:VNFの機能や振舞いを定義するテンプレート.
- NSD:VNFとの接続性やネットワークトポロジなどのネットワーク全体の機能や振舞いを定義するテンプレート.
- Kubernetes:複数のサーバで構成される大規模環境に向けて,コンテナを管理するコンテナオーケストレーションツール.Kubernetes®はオープンソースソフトウェアである.
- エッジ:通信事業者のデータセンタのうち,基地局などよりお客さまの近いところに設備を設置するために,広範囲に分散されて提供されたデータセンタの形態.電源や空冷などの都合で数台のサーバしか設置できないことが多い.
- ファーエッジサイト:エッジサイトよりもさらに分散されたデータセンタ.
- ユーザプレーン機能:5Gコアネットワークのネットワーク機能の1つ.ユーザパケットのルーティングおよび転送,パケット検査,QoS処理を担う機能.
- GPU:並列的な計算処理に優れたプロセッサ.並列計算を要する深層学習と相性が良い.
- FPGA:アレー状に並んだセルと配線用素子で構成されている書換え可能で,論理回路を自由に設計することができる大規模集積回路.
- SmartNIC:特殊なプロセッサを搭載することで,サーバのCPUの処理をオフロードし,高度なデータ送受信機能を実現するNIC.
- アクセラレータ:コンピュータ(CPU)や画像表示などの処理性能を向上させるための周辺機器や付加装置のこと.本稿では,通信用CPUの処理速度を向上させるために追加したLSIをいう.
- インテグレーション:装置,またはシステムを,通信事業者が運用しているネットワークに組み込むこと.
- マルチテナンシー:物理的,仮想的またはサービスとしてそれぞれ区切られた領域にデプロイされたアプリケーションを分離し,相互にアクセスできないようにする機能.
04. 標準化やエコシステムから見たAIエージェントの課題
実装の観点から見ると,AIエージェント設計の柔軟性は,通信事業者ニーズに合わせ,高度にカスタマイズされたソリューションを可能にするため,メリットが大きいように見える.しかし,そのような柔軟性は隠れたリスクが存在する.
最も顕著なリスクは,ベンダロックイン*70の可能性である.エージェントが独自のインタフェース,非公開API,標準化されていない意思決定フレームワークで開発された場合,通信事業者は複数ベンダのソリューションをインテグレーションしたり,コンポーネントを置き換えたりすることが難しくなり,それらの対応に多大なコストや労力を伴う.このことは,NFV Telco Cloud環境において不可欠なオープン性や相互運用性を損なう.従って,柔軟性が価値をもつ一方で,真のマルチベンダ・エコシステム*71を長期的・持続的に確保するためには,柔軟性とオープンな標準仕様,モジュラーアーキテクチャ,標準化APIに基づいた設計とのバランスが必要である.
さらに,追加的な課題として,AIエージェントの意思決定を統一的に支える統合データプラットフォームを確立することが挙げられる.加えて,GitOps*72のような新しいタイプの宣言型アプローチと,AIエージェントベースのオートメーションを整合させることも課題として残っている.そのほか,堅牢なAIエージェントのLCMや明確に分離定義された機能ブロックの必要性も指摘されている.最後に,柔軟性とスケーラビリティを実現するには,MLモデルをTCAライフサイクル管理から分離し,知能をコンポーネント化し,開発・デプロイ・維持をそれぞれ独立して行えるようにする必要がある.
- ベンダロックイン:基地局や各種周辺装置を構成する装置が同一ベンダにより提供され,かつベンダ独自のインタフェースにより接続されることで,通信事業者が他ベンダ装置の導入をすることが困難になる状態.
- エコシステム:複数の企業が連携して,お互いの技術や資産を活かし,社会を巻き込んで,技術開発から導入へと普及に至る一連の流れを形作る共存共栄の仕組み.
- GitOps:バージョン管理システムであるGitを拡張し,アプリケーションなどのライフサイクルの管理を自動で実現する仕組み.Gitに格納された設定や状態を最も正しい状態(source of truth)として,各システムはGitに格納された設定や状態に合わせようとする.
05. あとがき
NFV-MANOアーキテクチャは急速に進化しつつあり,今後の6Gユースケースの要求に対応可能な運用管理,およびオーケストレーションを具備するNFV Telco Cloud・アーキテクチャへと発展している.運用管理の観点から,この進化はRANやコアネットワークなどのさまざまなドメインや,オンプレミスやパブリッククラウドなどのさまざまなインフラにおける自動オーケストレーションによって,統一的な運用と拡張性の高いオーケストレーションを実現している.重要なことは,NFVが世代間を越えてシームレスなオーケストレーションを支援し,4G,5G,そして将来の6Gネットワークの円滑な共存と最適化を可能にすることである.
このフレームワークの中でAIエージェントを用いることは,先進的なオートメーションと知的な意思決定を実現するため,事業的に大きな価値をもたらす.応用例としては,障害検出,エネルギー最適化,トラフィック予測,セルフヒーリング,QoS最適化,脅威検出などが挙げられる.重要なのは,AIエージェントの機能的能力が,Closed-loop,インテント,MDAFなど既存の自動化機能のワークフローを補完する点であり,AIエージェントの機能的能力と既存の自動化機能のワークフローの関係の明確化は関連する標準化団体*73においても議論される必要がある.標準化されたソリューションを用いることで,これらのユースケースは,AI駆動オーケストレーションが運用効率とレジリエンスを強化するだけでなく,多様かつ動的なサービス需要や,通信事業者固有の要件に応じた俊敏性と知能を確保できることを示すことができる.今後NFVは,AIエージェントという新しい技術を柔軟に取り入れることで,さまざまなユースケースにおいて自動化に対応し,複雑化する6Gのネットワークを効率的に収容できるように進化を続けていく.
- 標準化団体:3GPP,ETSI,O-RANなどの業界標準を作成・維持するグループ.
文献
- [1] ETSI GR NFV-IFA 054 V6.1.1:“Network Functions Virtualisation (NFV) Release 6; Architecture; Report on architectural support for NFV evolution,”Feb. 2025.
- [2] ETSI GS NFV-IFA 047 V5.1.1:“Network Functions Virtualisation (NFV) Release 5; Management and Orchestration; Management data analytics Service Interface and Information Model Specification,”Jun. 2024.
- [3] ETSI GS NFV-IFA 050 V5.2.1:“Network Functions Virtualisation (NFV) Release 5; Management and Orchestration; Intent Management Service Interface and Information Model Specification,”Nov. 2024.
- [4] ETSI GR NFV-IFA 046 V5.2.1:“Network Functions Virtualisation (NFV) Release 5; Architectural Framework; Report on NFV support for virtualisation of RAN,”Dec. 2024.