Reduza o tempo de inatividade para aumentar o ROI: três ações que executivos podem fazer agora

Introdução

Calcular o potencial retorno do investimento de um novo servidor ou aplicação é relativamente simples: se permite fazer mais em menos tempo, o lucro provavelmente subirá, fazendo o produto valer a compra. No entanto, quando não há benefícios óbvios e ganhos imediatos, o cálculo é mais desafiador. Esse sempre foi o caso no setor de backup e recuperação, no qual o principal benefício é a capacidade de manter as operações (medida em tempo de atividade) em vez de aumento dos lucros. O problema é que, embora sejam essenciais para a continuidade dos negócios, sistemas de backup e recuperação são muitas vezes negligenciados porque não geram renda nem reduzem custos diretamente. No entanto, podemos calcular o que o tempo de inatividade significa para sua organização:

O custo total de oito horas de tempo de inatividade para este exemplo é de US$ 62.568. Além disso, se o tempo de inatividade afetar um site ou aplicação, estes números não incluirão o custo da frustração do cliente, a enxurrada de chamadas para suas equipes de suporte ou a oportunidade de seu cliente pensar em alternativas. O resultado de seu cálculo será diferente, mas os princípios básicos de como calcular o valor da DR serão os mesmos.

Causas do tempo de inatividade

 No geral, definir o tempo de inatividade é relativamente simples: é o tempo durante o qual um ou mais recursos (nesse caso, relacionados ao ambiente de TI) estão indisponíveis. Mas a principal causa do tempo de inatividade pode assumir muitas formas. Alguns cenários, como desastres naturais, falhas elétricas, alterações de equipamento ou manutenção, podem ser planejados devidamente, mas outros não. Isso confere ao planejamento um grau de incerteza, mas a identificação das causas do tempo de inatividade é essencial para estabelecer um plano inteligente e detalhado para reduzi-lo. A maioria das organizações estabeleceu planos ou procedimentos para recuperar-se de coisas como desastres naturais, falhas elétricas ou mesmo malware e ataques maliciosos.

No entanto, muitas fontes afirmam que a principal causa do tempo de inatividade é o erro humano. (O Uptime Institute, por exemplo, afirma que o erro humano é a causa de mais de 70% do tempo de inatividade em data centers.) A lição aqui é: "cuidado com as coisas pequenas". Você provavelmente está preparado para um desastre natural, mas está também preparado para o prestador de serviço que esbarra em um botão de desligar com pouca proteção e desliga todo o data center? Ou está preparado para animais roendo fios? Ou a polícia fechando o quarteirão e impedindo o acesso aos racks? Nós já vimos todos esses cenários, e eles são apenas a ponta do iceberg da lista de possibilidades que podem deixar você na mão.

Soluções

 Para balancear uma equação de ROI, mesmo a equação hipotética que sugerimos aqui, também precisamos de uma perspectiva de solução. Há vários diferentes tipos de soluções tecnológicas a se considerar para reduzir o tempo de inatividade e maximizar o ambiente de proteção de dados, backup e recuperação: software de backup de servidor, appliances de backup, máquinas físicas, máquinas virtuais, cloud. Quase todas as organizações têm necessidades diferentes e precisam de recursos diferentes. Não existe tamanho único que sirva para todos, mas há coisas a se considerar ao procurar soluções:

  • Facilidade de uso: autoexplicativo, mas se a equipe passa menos tempo instalando, conhecendo e mantendo um dado sistema, passam mais tempo realizando funções mais importantes. Tempo é dinheiro, e economizar tempo economiza dinheiro.
  • Automação: conforme a tecnologia amadurece, mais e mais funções estão sendo automatizadas. Novamente, se você conseguir automatizar processos que eram manuais, estará economizando o tempo de sua equipe.
  • Velocidade: a velocidade de recuperação é essencial para reduzir o tempo de inatividade. Sejamos francos: você terá tempo de inatividade. O tempo que você leva para se recuperar determina a diferença entre uma "leve inconveniência" ou um "desastre em potencial".
  • Maturidade da solução: uma coisa comum do tempo de inatividade, muitas vezes ignorada, são bugs de software ou perda de funcionalidade. Backup e recuperação são tão essenciais para a continuidade dos negócios que as soluções precisam ser perfeitas.
  • Recursos específicos: ao planejar seu ambiente, entenda suas necessidades e preste atenção às tecnologias e características que ajudam a maximizar os recursos. Recursos como a compactação e a desduplicação de dados podem reduzir a pressão sobre outros elementos da infraestrutura e ajudar a gerenciar o crescimento dos dados, o que simplifica o ambiente e reduz os custos.

Três etapas que você pode realizar agora

 Considerando tudo que leu até agora, o que você, um líder de TI, pode fazer hoje para ajudar a reduzir o tempo de inatividade e garantir que sua equipe esteja bem posicionada para o sucesso? Aborde seu ambiente de proteção de dados como faria com qualquer sistema importante e estabeleça um caminho claro para melhorias. Avalie seu ambiente de forma objetiva e meticulosa, crie um plano definitivo com objetivos específicos e alcançáveis e execute esse plano.

Avaliação:

  • Identifique pontos de falha: como discutimos anteriormente, você não pode se planejar para cada infortúnio que possa causar tempo de inatividade, mas pode se planejar para os tipos mais previsíveis que podem ocorrer.
  • Analise as operações existentes: analise cuidadosamente o que está funcionando e o que não está, tanto no dia a dia como no longo prazo. Correções improvisadas podem ajudar a continuar operando, mas esse tipo de solução frequentemente torna a recuperação mais difícil em caso de falha elétrica ou eventos imprevistos.
  • Determine circunstâncias especiais: entenda bem as circunstâncias especiais que sua organização pode enfrentar. Existem ou existirão regulamentos de conformidade que você precisa seguir? A área em que a empresa se encontra está sujeita a falhas elétricas frequentes? Você trabalha com dados críticos regulamentados?
  • Avalie os dados com criticidade: é necessário avaliar, com um olhar crítico, a importância de cada conjunto de dados para a organização. Classifique os aplicativos e os tipos de dados pelo tempo em que a empresa poderia funcionar sem eles. De fato, todos os dados são importantes, mas alguns são críticos para a operação hora a hora (ou seja, geram receita).

Planeje:

  • Defina metas: crie metas específicas e com prazos. O que é preciso imediatamente? O que é preciso em um ano? Em três anos? Em cinco anos?
  • Anote: executivos de TI descobrem com frequência o que querem e precisam e mantêm a informação para si. Escreva um plano e compartilhe com sua equipe. E não o negligencie: atualize-o conforme as metas são atingidas e novas metas são adicionadas.

Execute:

  • Comunique: seja honesto com sua equipe ao estabelecer os planos.
  • Dê pequenos passos: seu plano pode ser bem amplo. Prossiga uma etapa de cada vez para evitar problemas de implantação. A redução do tempo de inatividade é um esforço contínuo, e para obter os melhores resultados, é necessário planejar para o longo prazo.

Saber mais