自律運用ランドスケープ

自律型ネットワーク運用を取り巻く標準規格、オープンソースツール、製品の概観 — テレコムと IT が交差する領域。

標準規格 & フレームワーク

テレコム業界は自律運用の成熟度モデルを標準化してきました。これらは a10y が目指す自律性のレベルを定義しています。

TM Forum — Autonomous Networks

自動運転車に類似した 6段階の自律性レベル (L0–L5) を定義しています。L0 (完全手動) から L5 (完全自律、ゼロタッチ) まで。各レベルは Intent、Awareness、Analysis、Decision、Execution の5つの認知能力で評価されます。2025年現在、業界は L3–L4 に向けて推進中です。

L0完全手動の運用
L1手動介入を伴う基本的な自動化
L2中間的な自動化、大幅な人的監視
L3高度な自動化、最小限の人的介入
L4予測的自動化、自己修復
L5完全自律、ゼロタッチ

ETSI ZSM — Zero-touch Service Management

5G およびネットワークスライシングに最適化された、エンドツーエンドのクローズドループ自動化のためのアーキテクチャフレームワーク。Closed Control Loops (CCL) と Intent-Based Networking (IBN) に基づき、設計、デプロイ、監視、最適化にわたって人的介入ゼロを目指しています。

IETF ANIMA & RFC 9315

IETF ANIMA ワーキンググループはプロトコルレベルから Autonomic Networking Infrastructure (ANI) を定義しています。RFC 9315 は Intent-Based Networking の概念と用語を標準化しています。TMF がビジネス要件からトップダウンで取り組む一方、IETF はプロトコルプリミティブからボトムアップで取り組み、両者は同じビジョンに収束しています。

オープンソーススタック

a10y は実績あるオープンソースコンポーネントの上に構築されています。各コンポーネントは運用ループのフェーズに対応します。

OpenObserve
ログ、メトリクス、トレースの統合オブザーバビリティプラットフォーム。Rust で書かれ、Elasticsearch の140倍のストレージ効率。
Observe — テレメトリ収集・保存
Vector
テレメトリの収集、変換、ルーティングのための高性能データパイプライン。柔軟なデータ整形のための VRL (Vector Remap Language)。
Observe → Orient — 正規化・エンリッチメント
Keep
オープンソースの AIOps プラットフォーム。アラートの集約、重複排除、相関分析、宣言的修復ワークフローのための110以上のインテグレーション。
Orient + Decide — アラート相関・判断
Qdrant
過去のインシデント、ランブック、ネットワーク状態のエンベディングを保存するベクトルデータベース。パターンマッチングのための高速類似検索を実現。
Orient — ナレッジベース・類似検索
NATS
pub/sub、ストリーミング、キーバリューストアを単一バイナリで提供するクラウドネイティブメッセージング。サブミリ秒のレイテンシ、20 MB 未満の RAM。
神経系 — 全コンポーネントを接続
correlation-engine
マルチソース相関エンジン。統計的 ML (異常検知、予測モデル) と LLM (因果推論、RAG) を組み合わせ、自律型クローズドループ実行を実現。
全フェーズ — 頭脳

なぜ Keep か?

PagerDuty や Opsgenie はアラート通知ルーティングに焦点を当てています。Keep はさらに踏み込み、集約 → 重複排除 → 相関分析 → 自動修復を単一プラットフォームで実現します。

a10y にとって、Keep は「アラートの交差点」です。110以上のインテグレーションを通じて既存の監視ツールからアラートを収集し、AI 相関分析で関連アラートをグループ化し、宣言的ワークフローとして修復を実行します。オープンソースかつセルフホスト可能なため、テレコム事業者のデータ主権要件も満たします。

既存の Awesome リスト

いくつかのキュレーションリストがこの領域の一部をカバーしていますが、テレコムと IT の境界を橋渡しするものはありません。

リストフォーカス
awesome-AIOpsAIOps 全般 — 異常検知、RCA、障害予測
awesome-LLM-AIOpsLLM × AIOps の論文とツール
awesome-network-automationネットワーク自動化ツール (Ansible, NAPALM, Nornir 等)
awesome-sreサイトリライアビリティとプロダクションエンジニアリング
awesome-observabilityログ、メトリクス、トレース — オブザーバビリティの三本柱

これらのリストはそれぞれ全体像の一部をカバーしていますが、

テレコムの自律運用標準 (TMF / ETSI ZSM) と IT/クラウドネイティブ運用 (AIOps / SRE) を橋渡しするリストは存在しません。

それが awesome-autonomous-operation の目的です。