Qualquer um de nós que vive em grandes áreas metropolitanas enfrenta este desafio: ao fim de um dia de longas reuniões, temos que dirigir nosso carro alugado até o aeroporto, em horário de pico, para pegar o voo para casa. E, claro, nossas reuniões terminam tarde e não temos tempo de reserva suficiente para levar em conta acidentes nas rodovias.  A quem recorremos?

Recorremos ao Waze, o aplicativo de software de navegação por GPS, para identificar em tempo real a rota mais rápida até o aeroporto.  Em caso de mudança nas condições de trânsito, o Waze propõe automaticamente uma nova rota para chegar ao destino no menor tempo.  E conseguimos chegar ao voo justamente quando o portão de embarque está fechando.

As redes IP/MPLS de concessionárias de serviços públicos encaram uma realidade mais dura. Em um mundo onde as concessionárias de energia elétrica devem ser 99,999% confiáveis, a continuidade da rede é muito importante.  As redes de energia nacionais e mundiais dependem dos sensores de teleproteção e SCADA para fornecer dados em tempo real sobre o estado delas. Esses dados são essenciais para identificar pontos problemáticos na rede e para ativar relés que desligam as linhas de energia que poderiam desestabilizar a rede e propagar interrupções amplas, por exemplo, o evento ocorrido em 2003 que interrompeu a energia para 50 milhões de clientes no nordeste dos EUA durante dois dias.  Esses dados dos sensores precisam ser fornecidos com a mais baixa latência e tempos de comutação. Caso contrário, os problemas de energia passam despercebidos, causando interrupções.

Da mesma forma que os profissionais no trânsito precisam chegar ao aeroporto a tempo de pegar seus voos para casa, os dados de teleproteção/SCADA precisam ser transportados dentro dos estritos limites de latência para permitir o autodiagnóstico da rede de energia.

Muitas concessionárias de serviços públicos usam redes IP/MPLS para transportar esses dados essenciais de teleproteção/SCADA entre suas subestações e centros de controle. Da mesma forma que os profissionais no trânsito precisam chegar ao aeroporto a tempo de pegar seus voos para casa, os dados de teleproteção/SCADA precisam ser transportados dentro dos estritos limites de latência para permitir o autodiagnóstico da rede de energia.  Em virtude da natureza dinâmica das redes IP/MPLS, o congestionamento de tráfego pode ocorrer a qualquer momento, impactando a capacidade de transportar esse tráfego essencial dentro das especificações desejadas de latência.  Dada a amplitude e a complexidade das redes IP da grade de serviços públicos, os sistemas tradicionais de gerenciamento de rede não estão à altura da tarefa.

Problemas reais

Existem inúmeros exemplos reais de problemas de serviços e aplicativos do serviço público que resultaram da falta de entendimento sobre o modo lógico como o tráfego e o roteamento da rede IP operam: 

Configurações incorretas da rede lógica: dois prédios adjacentes de uma concessionária de energia estavam trocando tráfego por meio de um link WAN de baixa velocidade devido a uma configuração incorreta, resultando em desempenho precário do aplicativo. 

Redundância comprometida: após a implantação de um link WAN de backup caro em um local, descobriu-se que o link primário falhou e o backup não estava configurado corretamente para transportar o tráfego. 

Brechas na segurança: uma concessionária ficou sem a proteção da porta externa da rede por conta da rede de um contratado. 

Perda de dados de aplicativo: Uma concessionária de energia elétrica perdeu a conectividade crítica com os dados de controle da rede elétrica devido a uma configuração incorreta do roteamento. Isso só foi detectado quando uma operação de manutenção de rotina gerou a perda dos dados de controle. 

Serviços degradados: um provedor de serviços não detectou a causa principal (instabilidades de roteamento) de semanas de interrupções intermitentes dos serviços em um local do cliente de serviços públicos. Uma operadora de serviços regionais que está integrando sistemas TDM à sua nova rede IP/MPLS enfrentou dificuldades porque o aplicativo de proteção de linha usado para monitorar a corrente CA nas subestações era altamente sensível ao atraso e à flutuação de fase nos túneis RSVP-TE. 

Uma característica comum em todos esses exemplos são os problemas que envolvem a lógica de roteamento na rede, em vez do status de dispositivos individuais. As soluções tradicionais de gerenciamento de dispositivos e de desempenho de aplicativos de ponta a ponta, embora necessárias, não fornecem informações sobre a operação lógica do tráfego e roteamento. Como resultado, os departamentos de TI dos serviços públicos geralmente não têm visibilidade das principais causas das degradações de aplicativos. Para as empresas com aplicativos menos críticos, essa falta de visibilidade não tem tanta importância, mas nas concessionárias de serviços públicos não há espaço para erros.

Uso de análises baseadas em dados

Exatamente do mesmo modo que contamos com o Waze para nos informar a rota mais rápida e mais eficaz para nos levar ao destino, a Blue Planet, uma divisão da Ciena, usa análises baseadas em dados para fornecer às concessionárias a visibilidade em tempo real das redes IP/MPLS e para ajudar a identificar as mudanças necessárias que otimizem os fluxos do tráfego da rede.  A tecnologia de análise de rotas, usada por várias grandes empresas, operadoras de rede, provedores de serviços e agências governamentais, é a resposta para entender a operação lógica das redes IP.

A análise de rota funciona com o uso de uma ferramenta de rede virtual que executa um software especializado, que atua como um roteador passivo, mas escuta ativamente as atualizações de protocolo de roteamento enviadas por todos os roteadores da rede e calcula o estado do roteamento em toda a rede, em tempo real.

O Route Optimization and Assurance (ROA) Explorer Suite, do Blue Planet, foi amplamente implantado pelas equipes de rede em todo o mundo responsáveis pela manutenção da disponibilidade e desempenho de aplicativos SCADA essenciais, incluindo:

  • Concessionárias de energia elétrica nacionais e regionais
  • Organizações de logística e transporte público e privado
  • Grandes sistemas de engenharia de tráfego municipal baseados na rede IP 

Nesses exemplos, os departamentos de TI usam análises de roteamento e tráfego do ROA Explorer Suite para garantir que a rede IP que oferece suporte a aplicativos SCADA de serviço público esteja sempre disponível. Os três principais benefícios relacionados à garantia do SCADA são: 

1. 1. Os engenheiros podem simular uma série de mudanças com alta precisão

Por exemplo, os engenheiros de redes de concessionárias de serviços públicos podem modelar o aumento previsto no tráfego de dados SCADA de alta prioridade oriundo da implantação de novas RTUs. O novo tráfego simulado é sobreposto não em um modelo abstrato, mas na matriz de tráfego e roteamento da rede em tempo real ou em momento específico (p. ex., período de pico) escolhido pelos engenheiros de rede. O novo cenário de tráfego e roteamento mostra se a CoS do novo tráfego SCADA ou qualquer outra classe de tráfego é afetada em algum link na rede de núcleo IP. Em caso negativo, e se as previsões de uso fornecidas estiverem corretas, os engenheiros poderão continuar a implantação com segurança. 

2. 2. Adicione um DVR como recurso à sua rede, reduzindo o tempo de solução de problemas e elevando a qualidade do serviço da rede.

Devido à falta de visibilidade das operações lógicas da rede e à carência de dados de investigações para a solução de problemas, muitos problemas de aplicativo (principalmente problemas intermitentes) ficam sem solução, caindo na classificação "Nenhum problema encontrado". Com a combinação de análises de rota e tráfego, os engenheiros das concessionárias de serviços públicos podem retroceder o estado registrado do roteamento e tráfego para o momento em que o problema ocorreu e localizar rapidamente o domínio do problema rastreando a rota/caminho que um determinado serviço percorreu na rede. Eles podem determinar facilmente se havia uma causa raiz de roteamento. Em caso negativo, eles podem ver se algum link, o tráfego do aplicativo SCADA ou uma CoS relevante violou os limites de volume. Se havia congestionamento no link, uma análise mais detalhada mostrará se o problema de roteamento causou mudança no tráfego, ou se houve tráfego inesperado, inclusive sua origem, destino e a rota que incluía o link problemático.

3. Garantia de continuidade da rede

Os engenheiros de rede podem visualizar as tendências de utilização do fluxo de tráfego relativas a todos os links da rede, detalhadas por CoS ou até por grupos de aplicativos, caso eles possam ser classificados usando informações de análises de fluxo. Projeções de utilização e relatórios de tendências fáceis de usar identificam links ou classes de serviço que sofrem congestionamento quando as tendências atuais persistem.

Os insights necessários para as concessionárias de serviços públicos terem êxito

Para ter êxito nos ambientes de concessionárias de serviços públicos em que redes IP grandes e complexas criam variabilidade na forma como o tráfego de aplicativos é fornecido, os gerentes de rede precisam ir além das ferramentas tradicionais de gerenciamento de rede e entender as operações do plano de controle das redes. Com a telemetria de roteamento em tempo real sobreposta com dados de fluxo do tráfego, as investigações retroativas e os recursos de modelagem de cenários hipotéticos, os gerentes da rede de concessionárias de serviços públicos ganham a visibilidade necessária para garantir que os aplicativos SCADA operem com a mais alta continuidade possível dos serviços da rede.