25.2 C
New York
Monday, June 24, 2024

Redefinindo a sala de guerra de TI com observabilidade de ponta a ponta


A transformação da sala de guerra começa com o Monitoramento da Experiência Digital do Cliente (CDEM) para quebrar silos com insights correlacionados entre domínios e eficiência para soluções rápidas.

Tempo é dinheiro e confiscar muito tempo de muitas das pessoas mais inteligentes e caras da sua organização, muitas vezes a curto prazo, pode ser inimaginavelmente caro.

Existe o custo por hora do seu tempo. Além disso, o custo das oportunidades perdidas relacionadas ao trabalho que estão realizando, que agora está adiado. Isso está longe de ser a história completa. Os custos vão muito além da sua própria contribuição, pois todos precisam de tempo para falar, ouvir, considerar e trabalhar com as possibilidades.

E, no entanto, quando surge um novo lançamento de software program, é exatamente assim que muitas organizações respondem. Eles não têm certeza do que pode dar errado com o lançamento de um software program, então garantem que todas as pessoas certas estejam disponíveis, só para garantir.

Quando é óbvio que algo está errado no ambiente de tempo de execução do aplicativo, ou um aplicativo de missão crítica começa a apresentar problemas de desempenho e precisa ser corrigido imediatamente, esse mesmo grupo amplo é reunido para descobrir o problema e determinar a melhor maneira. para fixar isso.

Enquanto isso, os danos à reputação da empresa aumentam a cada minuto de interrupção, e o relógio financeiro avança a cada minuto gasto na identificação e correção de problemas, enquanto os clientes e usuários finais têm acesso limitado ou nenhum acesso aos aplicativos que fazem os negócios modernos funcionarem.

Continua após a publicidade..

A sala de guerra é um instrumento contundente que lança uma ampla rede

A convocação de uma sala de guerra de TI nasce da falta de visibilidade. A equipe deve aproveitar seu conhecimento coletivo para determinar a provável causa raiz de um problema que afeta o desempenho, porque normalmente não é óbvio para ninguém, no início, exatamente onde está o problema.

O tempo necessário para identificar o problema pode ser significativo, mesmo quando a sala de guerra está repleta de especialistas qualificados e inteligentes no assunto. Isso ocorre porque os aplicativos modernos são construídos em arquiteturas nativas da nuvem e podem ser acessados ​​de qualquer lugar usando diferentes dispositivos. Eles aproveitam o código empacotado e as dependências implantadas como microsserviços para aumentar a velocidade e a flexibilidade do desenvolvedor.

Isso inclui contêineres, bibliotecas de terceiros e interfaces de programação de aplicativos (APIs), que criam um ambiente complicado no qual atualizações, alterações e conflitos entre dependências precisam ser gerenciados constantemente para garantir que os aplicativos funcionem de maneira best. Se o aplicativo ficar lento, não funcionar como deveria ou travar, o resultado será uma experiência ruim para o usuário e até mesmo perda de negócios.

As dependências de aplicativos também podem afetar a segurança de um aplicativo. Isto é particularmente verdadeiro quando um aplicativo depende de código ou bibliotecas de terceiros que podem conter vulnerabilidades que oferecem um caminho de ataque. Isso coloca em risco não apenas o aplicativo, mas também os dados do usuário.

Por exemplo, a configuração incorreta e até mesmo os ataques de ransomware ou de negação de serviço distribuída (DDoS) podem apresentar sintomas confusamente semelhantes aos da perda de pacotes de rede em termos de degradação do desempenho, sem nenhuma indicação clara da causa raiz.

Considere o cenário de um grande supermercado no auge das compras de fim de ano. Os produtos estão saindo das prateleiras e precisam de reabastecimento frequente ao longo do dia. É elementary saber a disponibilidade do estoque ao minuto, para que as prateleiras permaneçam cheias. Estoque impreciso ou falta de estoque prejudica a confiança que a empresa trabalhou duro para construir, sem mencionar a perda de vendas.

Continua após a publicidade..

Nesse ponto, os scanners manuais usados ​​para inventário começam a falhar. Eles não fazem uma varredura confiável, o que significa que o movimento dos produtos do estoque para as prateleiras não está sendo registrado com precisão. A equipe não consegue mais ter certeza do que está nas prateleiras, do que resta no estoque, do que precisa ser reordenado e quando precisa chegar.

Uma ligação é feita para a equipe de TI e uma sala de guerra é convocada para investigar a causa do problema. A rede Wi-Fi é a culpada óbvia, mas com o passar do tempo, a equipe de rede não consegue encontrar nenhum problema de Wi-Fi. Eventualmente, eles percebem que é o firmware do scanner. Os próprios scanners precisam ser substituídos e, quando isso acontecer, o serviço regular será retomado.

O Monitoramento da Experiência Digital do Cliente (CDEM) muda tudo

Esta história é uma das muitas que ilustram as deficiências do monitoramento da infraestrutura, que carece de visibilidade da experiência digital.

Neste exemplo, os participantes da sala de guerra devem classificar sequencialmente todas as diferentes dependências do scanner de acordo com sua experiência coletiva para identificar o culpado mais provável, no menor tempo possível. O esforço envolve equipes multifuncionais, cada uma investigando sua área de responsabilidade, portanto, há um nível semelhante de esforço e tempo exigido de todos. O resultado é que a maioria das equipes normalmente consegue provar sua “inocência” – isto é, elas podem mostrar que sua área de responsabilidade abriga ou não a causa raiz.

Na verdade, por não terem uma visão clara, cada equipe gasta muito tempo procurando um problema que não cabe a eles encontrar. Existe uma maneira melhor. O Cisco Full-Stack Observability permite que as equipes operacionais mudem completamente sua perspectiva de solução de problemas.

Continua após a publicidade..

O Buyer Digital Expertise Monitoring (CDEM), um recurso das soluções Cisco Full-Stack Observability (FSO), permite que as equipes rastreiem a própria jornada do usuário, começando pelo dispositivo e passando por todos os pontos de contato, incluindo dependências como APIs e microsserviços.

Se tivessem usado o CDEM, as equipes do nosso exemplo teriam visto a jornada do usuário falhar na primeira etapa. Eliminar o culpado teórico mais provável – a rede Wi-Fi – levaria apenas alguns minutos em vez de horas, e a atenção teria se concentrado imediatamente nos próprios scanners.

É fácil ver como a observabilidade neste nível muda fundamentalmente a sala de guerra de TI e acelera dramaticamente o tempo médio de resolução (MTTR) ao contornar muitas das etapas que as equipes teriam que realizar de outra forma.

As respostas estão em dados de telemetria observáveis

As salas de guerra são complicadas por vários conjuntos de dados diferentes apresentados por ferramentas de monitoramento separadas. Por exemplo, Community Ops analisa dados da rede, DevSecOps analisa dados do aplicativo e dependências de terceiros.

Alcançar uma visão completa de todos os dados de aplicativos relevantes das operações comerciais normais é uma tarefa enorme. Pior ainda, é impossível correlacionar esses fluxos intermináveis ​​de dados recebidos dentro de um prazo viável usando ferramentas e sistemas diferentes que nunca foram projetados para esse trabalho. Isso torna praticamente impossível detectar anomalias em toda a pilha, e muito menos priorizá-las e agir sobre elas, em um prazo razoável.

As soluções Cisco Full-Stack Observability democratizam o acesso aos dados, eliminando silos multifuncionais e reunindo equipes para colaborar na próxima melhor etapa para resolver problemas. O Buyer Digital Expertise Monitoring combina os recursos de observabilidade de aplicativos da Cisco com a inteligência de rede líder do setor, permitindo que as equipes de TI identifiquem rapidamente a causa raiz dos problemas antes que eles prejudiquem o desempenho geral do aplicativo, afetem o usuário last e, em última análise, os negócios.

Continua após a publicidade..

A solução da Cisco fornece insights sobre o aplicativo e a rede, com métricas de conectividade à Web para operações de aplicativos e mapeamento de dependência de aplicativos em tempo actual para operações de rede. Essa visão combinada de aplicativo e rede reduz significativamente o MTTR com recomendações práticas que ajudam as equipes a priorizar atividades de correção com base no impacto e na criticidade dos negócios.

Por exemplo, as equipes podem ver em que ponto do caminho do usuário está ocorrendo degradação do desempenho ou em que ponto a comunicação está falhando completamente. Fundamentalmente, eles têm visibilidade contextual que os ajuda a identificar, fazer a triagem e resolver problemas de forma colaborativa, porque todos trabalham com os mesmos dados provenientes de todos os pontos de contato possíveis, incluindo a rede, que é uma área que muitas vezes falta em outras soluções.

O resultado é o fim das salas de guerra como as conhecemos. Em vez disso, as equipes têm visibilidade de ponta a ponta, insights correlacionados e ações recomendadas, tudo vinculado ao contexto de negócios, em aplicativos, segurança, rede e Web. Somente a Cisco combina os pontos de vantagem de aplicativos, redes e segurança em escala para potencializar a verdadeira observabilidade em todo o patrimônio de TI.

Compartilhar:

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles