A análise do Gartner disponível abaixo, visa detalhar a melhor forma de mensurar o custo de serviços de TI.
Mas em um âmbito mais simplista, é possível seguir as seguintes dicas na hora de calcular o custo dos serviços de TI:
- Calcule os custos diretos da empresa (mão de obra – salários) – Um indivíduo que ganha R$ 2.000,00 e custe em média, com impostos, R$ 3.500,00 à empresa, trabalha 180 horas no mês. Seu custo de hora bruto é de R$ 19,44 (3500/180 = 19,44)
- Alinhe minuciosamente os custos indiretos – Os custos indiretos compreendem aluguel, contabilidade, serviços administrativos e etc. Supondo que o custo gire em torno de R$ 15.000,00 para uma empresa que tenha 6 técnicos. Nesse caso, é necessário realizar um rateio entre os técnicos e as horas que eles trabalham, a fim de saber quanto a mais é o custo hora deles. Fazendo esse cálculo, chega-se a R$ 13,89 ( (15.000 indiretos/ 6 func.) / 180 horas) que devem ser cobrados a mais nas horas trabalhadas dos profissionais, a fim de bancar os custos operacionais da empresa.
- Calcule os impostos e o lucro – É importante lembrar que os impostos devem ser quitados em sua forma integral e que uma empresa, tal como seus colaboradores, precisam ser recompensado pelo trabalho ao longo do mês. Se a uma carga tributária for de 15% e a empresa desejar ter um lucro de 15%, deve-se cobrar por hora trabalhada R$ 47,61. ((19,44 Dir. + 13,89 Ind. )/ 0,7)
Análise Gartner, por Bill Malik e Donna Scott
Frequentemente, companhias cometem equívocos ao calcular o custo de serviços de TI contínuos em várias sedes. Essa prática prejudica não só o alinhamento de expectativas de gastos junto aos seus provedores de TI. Ela também acaba por criar eventuais problemas de relacionamento com as mesmas. Dessa forma, é importante levar em consideração vários fatores que podem auxiliar o empreendedor a aperfeiçoar suas estimativas de custo.
Considerações básicas sobre o custo de serviços de TI
O custo de serviços de TI aumenta significativamente com o suporte a sistemas disponíveis continuamente. Por sua vez, um serviço de TI continuamente disponível exige um substancial investimento em tecnologia e processos. Os três tipos de disponibilidade de serviços de TI são: alta disponibilidade, operação contínua e disponibilidade contínua em várias sedes.
Recomendações
É possível equilibrar o custo de serviços de TI com disponibilidade contínua. Para isso, basta compartilhar a infraestrutura ou reduzir o desempenho em alguns ambientes. Contudo, essa prática pode causar uma interrupção do serviço.
Rastrear tendências de disponibilidade para sistemas fundamentais é importante. Isso consiste em rastrear a frequência de interrupção, tempo para restaurar o serviço e causa do tempo ocioso. É viável não destinar tempo nem capital para medir todos os serviços de TI. Entretanto, conforme surgir o aprimoramento no gerenciamento de disponibilidade, vale compreender que incidentes raros não evidenciam tendências estáveis.
Atualmente, paga-se mais de oito vezes o custo de serviços de TI inapropriados à alta disponibilidade ou operações contínuas. Isso porque isso demanda um investimento maior para aprimorá-los e capacitá-lo para entregar disponibilidade contínua em várias sedes. Contudo, se a arquitetura de aplicação precisar ser revisada, o custo de serviços de TI poderá ser ainda maior.
Hipótese de planejamento estratégico
Até 2014, menos de um em 100 serviços de TI esteve continuamente disponível em várias sedes. Isso aconteceu devido ao alto custo de serviços de TI e à complexidade de manutenção.
Análise
Um serviço de TI formado por todos os componentes de um sistema corporativo, como e-commerce ou ERP, é considerado “altamente disponível” quando funciona ao menos 99,3% do tempo durante sua operação programada. Isso apesar de interrupções imprevistas, como falha de hardware, bug de software ou mudanças de configuração incorretas. Isso equivale a aproximadamente 61 horas anuais de interrupção de serviço em uma operação 24/7.
Técnicas de alta disponibilidade geralmente envolvem hardware e software duplicado. Ou seja, elas fornecem os elementos do componente redundantemente junto a um mecanismo para transferir o fluxo de trabalho de um elemento ativo. Esses elementos consistem em servidor, dispositivos de rede e de armazenamento, além de componentes de software que coletivamente entregam o serviço de TI. Falhas que não provoquem interrupções são a meta. No entanto, interrupções curtas frequentemente ocorrem e esses minutos são contados no cálculo de disponibilidade do serviço de TI.
Falhas vs. Tempo ocioso
Falhas humanas e de processos causam aproximadamente 80% do tempo ocioso de serviços fundamentais. Por isso, companhias devem investir em maturidade de processos do ciclo de vida de desenvolvimento de software (SDLC), no processo de aquisição de software não desenvolvido internamente e nos processos operacionais contínuos. Entre eles, destacam-se problemas, mudanças, lançamentos e gerenciamento de configuração.
O Gartner considera níveis de disponibilidade sofisticados aqueles em torno dos 99,95% do tempo. Isso ou os que somam menos de cinco horas de tempo ocioso por ano para cada serviço de TI, em operações do tipo 24/7. Quando se gerencia o acordo de nível de serviço (SLA) da disponibilidade de serviço de TI, é essencial analisar o tempo para restaurar o serviço após um incidente e sua disponibilidade geral. Por exemplo, se uma empresa dedica quatro horas para MTRS, ela provavelmente não atingirá os 99.95% de disponibilidade. Isso porque só dois incidentes de quatro horas cada já resultam em uma falha de SLA para o ano todo. Um serviço de TI é considerado continuamente operável se ele não precisa ser suspenso e reiniciado para manutenção programada.
Princípios de arquitetura
Os serviços de TI direcionados a operações contínuas possuem quatro princípios de arquitetura:
- Eles e seus componentes são permutáveis. Ou seja, podem ser introduzidos em um ambiente de produção em funcionamento sem a necessidade de forçar um reinício;
- Eles têm tolerância de lançamento. Ou seja, o nível atual do software e do hardware e os níveis de lançamento anteriores podem coexistir;
- Eles são orientados por comando. Ou seja, qualquer parâmetro de inicialização pode ser alterado sem implicar tempo ocioso;
- Eles não têm limites com códigos complexos ou contadores que exigirão um reinício para limpar ou restaurar o sistema.
Além do mais, quando aplicações e bases de dados não seguem todos esses critérios, elas são quase continuamente operáveis. Isso acontece por meio do fornecimento de um ambiente completamente redundante onde um lançamento do serviço de TI pode entrar em cena simultaneamente ao serviço de TI de produção ativa e sincronizado com os usuários. Com isso, migra-se para o novo serviço de TI durante um período de menor uso causando apenas alguns minutos de tempo ocioso.
Mensurando o tempo ocioso
O Gartner considera o menor tempo ocioso possível para um caso deste tipo aproximadamente 12 horas por ano por serviço de TI. Um serviço de TI é continuamente disponível se demonstra alta disponibilidade e operações contínuas. Às vezes é útil combinar alta disponibilidade e métricas de operações contínuas para uma única métrica de disponibilidade contínua. Por exemplo, a melhor disponibilidade contínua possível seria de cinco horas de tempo ocioso imprevisível, mais 12 horas de tempo ocioso programado. Portanto, o total somaria 17 horas de tempo ocioso, ou 99,81%. Entretanto, todos esses três fatores são focados em disponibilidade para uma única sede. Vale ressaltar que eles não incluem mitigação de incidentes de desastre.
A razão disso é que a maioria das empresas especifica níveis de serviço separados para eventos de desastre por meio de objetivos de tempo de recuperação (RTOs) e objetivos de ponto de recuperação (RPOs), separados e independentes do tempo produtivo planejado e da disponibilidade do serviço de TI. As organizações devem estabelecer um nível de serviço para alta disponibilidade, operabilidade contínua, além de RTO e RPO para cada serviço de TI. Além disso, devem controlar a dedicação a essas metas.
Como proceder?
Quando medem a disponibilidade, organizações devem adotar métricas apropriadas à magnitude das interrupções pelas quais costumam ser afetadas. Basta medir um sistema que falha frequentemente rastreando a disponibilidade agregada durante um período de registro significativo. Por exemplo, se um serviço crítico falha diariamente, deve-se medir a disponibilidade como uma porcentagem do tempo produtivo semanal. Após a análise do problema e subsequente reparo, devem ser implementadas métricas de porcentagens para as principais fontes de interrupção.
Por exemplo, interrupções que ocorrem frequentemente e têm tempo de restauração do serviço medido em minutos podem não exibir tendências no rastreamento de porcentagens. Neste nível de disponibilidade, deve-se rastrear e registrar situações de interrupções individuais indicando períodos de tempo para detecção, diagnóstico, restituição e restauração. A restauração pode incluir, além do reparo da causa principal do problema, o aperfeiçoamento do gerenciamento do desempenho de aplicação. Além disso, quando as interrupções são resultado de uma falha no processo, uma mudança da cultura corporativa pode ser necessária.
Em algumas organizações o incidente inicial é completamente descrito e documentado na resolução. Mas, ainda assim, o cliente pode escolher criar um segundo relatório de incidente para documentar o problema com os processos, treinamentos e comportamentos que contribuíram para o incidente inicial.
Exemplificando
Por exemplo, imagine que um sistema falhe por causa da interrupção de armazenamento. O problema é que a quantidade de armazenamento era inadequada. Dessa forma, a correção é fornecer mais armazenamento. O segundo relatório descreveria a falha do software de monitoramento para detectar e alertar a equipe de operações sobre a interrupção de armazenamento. Isso antes do sistema falhar. Pode haver um terceiro problema: o alerta existiu, mas foi enviado à pessoa errada. Ou o alerta foi obscuro, confuso ou direcionado à equipe de operações de outro sistema. A organização deve adotar essa prática quando gerenciar sistemas continuamente disponíveis.
Algumas organizações têm níveis extraordinários de disponibilidade para serviços de TI hospedados em um único data center. No entanto, têm RTOs relativamente longos e medidos em horas, como de quatro a 24 horas, porque seus planos de continuidade corporativa especificam as atividades relacionadas. Já outras estão percebendo que seus MTRS para incidentes de interrupção local são equivalentes ao seu RTO de incidentes de desastre para serviços de TI fundamentais.
Como esses sistemas exigem alta disponibilidade e operabilidade contínua em sedes diversas, é possível chamá-los de “disponibilidade contínua em várias sedes”. Quando múltiplas sedes podem contar com serviços de TI, aumenta a flexibilidade do desempenho durante o tempo ocioso enquanto o serviço de TI é operacional na sede alternativa.
Conclusão
O custo de serviços de TI em múltiplas sedes com sistemas continuamente disponíveis pode ser quase oito vezes o custo de serviços de TI padrão. Entretanto, esse valor compreende somente infraestruturas de hardware e software. Os custos com recursos humanos e processos também aumentam proporcionalmente.
Consequentemente, apenas as organizações de serviços de TI podem justificar o custo significativamente elevado. Isso com base no custo corporativo do tempo ocioso ou devido a mandatos regulatórios específicos.
Quando tentarem otimizar o custo da disponibilidade contínua e em múltiplas sedes por meio do compartilhamento ou da redução do desempenho de alguns ambientes, as companhias devem lidar com riscos operacionais. Afinal, elas precisarão realizar a mudança levando em conta o custo de serviços de TI versus a disponibilidade contínua.