AI는 네트워킹 산업 종사자를 포함한 모든 사람의 상상력을 사로잡았습니다. Tim Pearson 부사장과 Kailem Anderson 부사장이 Ciena의 혁신적인 AIOps(IT 운영을 위한 인공 지능) 사용 사례와 ML(머신 러닝) 및 GenAI(생성형 AI)를 포함한 AI가 고객의 네트워크 및 서비스 운영을 크게 향상시키는 방법에 대해 설명합니다.
AI에 대한 관심은 지난 몇 년 동안 폭발적으로 증가했으며 이미 사람들이 정보를 검색하고 소통하는 방식을 변화시키고 있습니다. 네트워크 및 서비스 운영을 개선하고 자동화하기 위해 AI 기술을 적용하는 것은 이제 일반적으로 AIOps로 알려져 있습니다. Ciena는 수년 동안 강력한 분석과 정교한 알고리즘을 Navigator NCS(Network Control Suite)와 Blue Planet Intelligent Automation 소프트웨어 포트폴리오에 통합하여 AIOps 혁신의 최전선에서 왔습니다. 아래 다이어그램에서 보여주듯이 Blue Planet과 Navigator NCS는 상호 보완적이면서도 독립적인 소프트웨어 포트폴리오이며 고객의 AIOps 전략을 실현하기 위해 긴밀하게 연동합니다.
그림 1: AIOps를 지원하는 Ciena의 보완 소프트웨어 제품군
우리는 최근 Ciena에서 Navigator NCS 제품라인관리를총괄하는 Tim Pearson 부사장과 Ciena 사업부인 Blue Planet에서포트폴리오및엔지니어링을담당하는 Kailem Anderson 부사장을 만나 현재 Ciena가 지원하는 혁신적인 AIOps 애플리케이션에 대해 토의하고 최근 AI 발전으로 새로운 기회가 어떻게 열리고 있는지 의견을 공유했습니다.
서비스 공급자는 AI가 수명 주기 운영을 획기적으로 개선할 수 있는 잠재력을 가지고 있다고 생각합니다.
질문: 전 세계 IT 및 통신 담당자를 대상으로 실시한 최근 설문 조사에서 응답자의 약 60%가 AI를 사용하면 네트워크 운영 효율성이 40% 이상 향상될 것이라고 답했습니다. 이 수치가 놀랍지 않나요?
그림 2: 응답자의 대다수는 AI가 네트워크 운영 효율성을 40% 이상 개선할 것이라고 생각함
Pearson 부사장: 전혀 놀랍지 않습니다. 우리는 일상 생활에서 AI 애플리케이션의 엄청난 활용도를 보아왔으며 네트워킹 업계도 다르지 않습니다. 최적화, 문제 해결 및 모니터링 자동화를 비롯한 다양한 사용 사례에 AI를 적용하면 네트워크 운영에 큰 이점을 얻을 수 있습니다.
Anderson 부사장: 저도 그 결과가 놀랍지 않습니다. 지난 몇 년 동안 고객 기반 전반에서 분석, AI 및 ML(머신 러닝)의 도입이 증가하는 것을 목격했습니다. 특히 서비스 보장 및 근본 원인 분석 효율성을 개선하기 위해 사전 구축되어 즉시 사용 가능한 사용 사례를 지원합니다.
핵심 사용 사례와 기술을 선택하면 AIOps의 가치를 극대화할 수 있습니다.
질문: 실질적인 비즈니스 가치를 제공할 수 있는 최고의 AIOps 기술 및 사용 사례에는 어떤 것이 있나요?
Pearson 부사장: ML은 특히 다중 계층 네트워크에서 서비스 보장에 확실히 도움이 될 수 있습니다. 통신 사업자는 장비에서 과거 및 실시간 네트워크 원격 분석 자료를 수집하여 경로, 채널, 대역폭 또는 스펙트럼을 최적화하고 이를 통해 SLA(서비스 수준 계약)를 충족시키고 있습니다. 그리고 이제 고급 AI 기술을 통해 더 정확하고 실행 가능한 통찰력을 제공하여 지능적인 최적화 결정을 내릴 수 있습니다.
예를 들어 Ciena의 Fiber Health Assurance 앱은 ML을 사용하여 광 케이블 측정 시 발생하는 편차의 가능한 원인을 식별하므로 사업자는 문제를 예방적으로 해결할 수 있습니다. 다른 예로는 광 경로를 조정하여 오버레이 IP 링크가 자주 경로를 변경하는 것을 방지할 수 있는 방법이 있습니다. 또는 SNR(신호 대 잡음비) 측정값이 높으면 광 매개 변수를 조정하여 더 높은 IP 링크 용량을 사용할 수 있습니다. 이러한 방법을 통해 서비스 공급자는 네트워크 자산에서 더 많은 용량을 확보하고 그 결과 CAPEX(자본 지출)를 줄일 수 있습니다.
그림 3: 실제 작동하는 Fiber Health Assurance 앱
Anderson 부사장: ML은 장애를 선제적으로 감지하고 완화하는 데에도 유용합니다. Blue Planet의 SFD(Silent Fault Detection)는 장비에서 알람을 생성하지 않지만 느슨한 커넥터, 구부러진 광 패치 코드 등으로 인해 성능 저하가 흔히 발생하는 PON(수동 광 통신망) 환경과 같은 '운영 사각지대'에서 서비스 문제의 원인을 정확히 파악할 수 있도록 도와줍니다.
SFD는 중단의 가장 유력한 근본 원인을 파악하기 위한 ML 알고리즘을 활용하며 정상 및 불량 서비스 경로의 차단을 분석합니다. 또한 복수의 증상이 있는 이벤트를 상호 연관시키고 억제하여 실행 가능한 단일 '스마트 알람'으로 범위를 줄입니다. 이를 통해 사업자가 복잡한 다중 도메인 및 다중 공급업체 네트워크에서 문제를 더 신속하게 파악할 수 있도록 지원합니다. 고객과의 시험 사용을 근거로 보면 서비스에 영향을 미치는 네트워크 문제가 정량적으로 감소하는 것과 같은 매우 긍정적인 결과를 확인했습니다.
그림 4: PON 환경에서 장애를 감지하는 데 도움을 주는 SFD
질문: 모두가 GenAI(생성형 AI) 유행에 뛰어들고 있는 것 같습니다. 네트워크 및 서비스 운영에서 GenAI의 역할이 있나요?
Anderson 부사장: 그렇습니다. 운영을 최적화하고 고객 경험을 개선하기 위해 GenAI와 LLM(대규모 언어 모델)을 도입하려는 사업자들의 관심이 매우 높습니다. 현재 많은 기업이 특정 하이퍼스케일러 LLM과의 제휴와 같은 옵션을 검토하고 있으며, 통신사별 LLM에 대한 비전을 제시하는 GTAA(글로벌 통신사 AI 연합)와 같은 이니셔티브도 있습니다.
이러한 결정을 간소화하기 위해 Blue Planet은 최근 사업자가 운영 및 OSS를 최적화할 수 있는 BYO(Bring Your Own) AI 모델을 유연하게 구현할 수 있는 개방형 프레임워크를 도입했습니다. AI Studio는 사업자가 제약 없이 AI 모델을 통합할 수 있는 호스팅 및 실행 환경을 제공합니다. 따라서 특정 LLM에 종속되지 않고, 위에서 설명한 SFD와 같은 Blue Planet의 AI 사용 사례, 사업자의 자체 데이터 과학 팀 또는 타사에서 개발한 사용 사례를 관리할 수 있습니다. 다양한 AI 모델을 관리할 수 있는 이 기능은 AI 기반 운영으로의 전환을 가속화하고 새로운 모델이 개발될 때 미래 경쟁력을 보장하는 성능을 제공합니다.
Pearson 부사장: 각 서비스 공급자나 클라우드 공급자는 새로운 기술을 통해 가장 큰 이점을 얻을 수 있는 주요 사용 사례를 신중하게 선택하여 조직에 가장 적합한 결과를 얻는 것이 중요합니다. 고객과의 대화를 통해 알아보면 고객들은 운영 작업 흐름을 가속화하고 자동화하기 위해 GenAI를 적용하기를 원하며, 운영 작업자가 최종 결정을 내리는 경우가 많습니다. 이를 HITL(Human In The Loop) 자동화라고 합니다. 여기에는 GenAI와 NLP(자연어 처리)를 사용하여 특정 작업 흐름의 일부로 상황에 따라 도메인별 데이터를 통합하여 정확한 응답을 제공하는 것이 포함됩니다.
GenAI 엔진은 이를 기반으로 API 호출을 통해 네트워크와 직접 상호 작용할 수도 있습니다. 이는 기존의 DevOps(개발 운영) 방식을 뛰어넘는 완전히 새로운 운영 자동화 방식입니다. 현재 자동화 애플리케이션의 작성 속도를 크게 높이기 위해 GenAI 기반 도구를 개발 중입니다.
흥미로운 점은 자동화가 증가함에 따라 사용자 인터페이스에서 고급 시각화에 대한 필요성도 커지고 있다는 점입니다. 이를 통해 운영 팀은 다단계 자동화 흐름의 진행 상황을 추적하고 비즈니스 의도를 충족시킬 수 있습니다.
질문: 이 GenAI 사용 사례의 주요 이점은 무엇인가요?
Pearson 부사장: 주로 OPEX(운영 비용)를 줄이는 것이 큰 이점입니다. 문제 해결, 프로비저닝 및 계획 작업 흐름을 가속화하기 위해 GenAI 도구를 사용하는 운영 담당자는 업무를 더 빠르게 완료할 수 있습니다. 그 결과 전체 비즈니스가 더 민첩하게 이루어집니다. 고객들은 이를 매우 중요하게 생각합니다.
그 뿐만 아니라 팀은 시간이 많이 걸리는 반복적인 업무에서 벗어나 고객 기반을 위한 새로운 서비스를 만들고 도입하는 데 시간과 노력을 집중할 수 있습니다. 이 또한 고객에게 큰 이점입니다!
그림 5: 네트워크 운영에서 대화형 지원을 위해 GenAI를 활용하는 방법
질문: 서비스 공급자 및 클라우드 공급자가 AIOps 전략을 실행하려고 할 때 어디서부터 시작해야 할까요?
Anderson 부사장: 기본적인 출발점은 운영 사용 사례를 파악하고 적절한 AI 기술을 활용하여 원하는 비즈니스 결과를 도출하는 것입니다. GenAI가 최근 가장 많은 관심을 받고 있지만 확인된 사용 사례에 가장 적합한 솔루션을 제공하지는 못할 수도 있습니다. 좋은 소식은 AIOps가 이미 몇 년 동안 Blue Planet의 자동화 포트폴리오 전반에서 입증되었으며, 현재 사전 구축된 여러 사용 사례를 활용할 수 있다는 것입니다. 따라서 공급자들은 이러한 사용 사례를 활용하고 거기서 더 확장할 수 있습니다.
Pearson 부사장: 다중 계층 및 다중 공급업체 사용 사례에서 AI를 활용하여 대량의 네트워크 데이터를 상호 연관시키고 분석함으로써 사전 장애 감지, 서비스 보장 및 성능 최적화를 통해 상당한 이점을 얻을 수 있다는 소식을 듣고 있습니다. 지금은 여러 계층에서 이러한 분석을 수행하는 것은 많은 수작업이 수반되고 시간이 많이 소요됩니다. 하지만 AI 모델은 학습과 검증을 거치면 최적의 솔루션을 매우 빠르게 추론할 수 있습니다. 전반적으로 이러한 상황은 서비스 및 클라우드 공급자가 빠르게 변화하는 시장 수요에 맞춰 네트워크를 발전시키기 위해 더 나은 통찰력을 더 빠르게 확보할 수 있음을 의미합니다.
질문: 네트워크 및 서비스 운영에 AI 기술을 통합하는 시장의 방향성에 대한 의견을 공유해 주신 두 분께 감사드립니다. 정말 유익한 시간이었습니다!
AI에 대한 저희의 생각과 네트워크에 미칠 영향에 대해 자세히 알고 싶다면 AI 인사이트 페이지를 방문하여 최신 소식을 받아보세요.