Início meu primeiro artigo falando de um mal que toma conta de algumas áreas de T.I. Hoje com o crescimento dos sistemas e networking cada vez mais robustos precisam ter uma excelente qualidade. Tudo isso começa pela parte mais baixa de qualquer estrutura. A parte física. É aí onde começa a aparecer o famoso arranjo técnico, o famoso jeitinho, coloca isso aqui no lugar… não dá pra perceber…, e assim por diante.
A famosa gambiarra pode funcionar por certo período, mas cedo ou mais tarde, ela vai ser descoberta e vai causar grandes problemas. Muita gente pode achar um saco, mas as normas técnicas foram feitas justamente para se evitar esses tipos de problemas. A norma TIA 942 (hoje em fase de nacionalização pelo Subgrupo 4 – Telecomunicações – da ABNT) define os critérios para a construção de Datacenters, com a especificação dos requisitos para a construção civil, energia elétrica, ar condicionado, cabeamento estruturado, sistemas de proteção contra fogo, etc. No campo das soluções de hardware e software, o mercado apontou soluções para clusterização, replicação de bases de dados e processos de recuperação de desastres, com tempos de recuperação cada vez menores. E finalmente, no campo do desenvolvimento de software, foram incorporadas ferramentas para a monitoração dos processos e aplicações, possibilitando a avaliação dos tempos de processamento e gargalos, com vistas ao controle dinâmico dos Acordos de Níveis de Serviço.
Há alguns anos, os requisitos para a implantação de uma solução possuíam uma dependência restrita com o gestor no tocante à especificação do modelo de negócio a ser utilizado. Os requisitos do negócio se refletiam praticamente no processo de desenvolvimento da aplicação, através da construção de um modelo computacional que atendesse às especificações funcionais da solução. As demais necessidades eram geradas pela área de TI, a qual mapeava os requisitos de hardware, software e infra-estrutura, segundo critérios estritamente tecnológicos e bem focados em custo.
Hoje, os requisitos de projeto para a implantação das soluções estão intimamente ligados à natureza do negócio e ao valor que ele representa para a empresa. Fatores de risco que podem causar interrupção nos negócios, tais como incêndios, tempestades, enchentes, falhas na infra-estrutura, problemas de hardware, erros humanos, vírus, hackers, etc, necessitam ser mapeados para a definição dos requisitos necessários para infra-estrutura, contingenciamento de hardware, balanceamento de cargas, técnicas de replicação de bases de dados, etc.
Várias empresas do setor financeiro que operavam no World Trade Center, simplesmente desapareceram, uma vez que todos os ativos tecnológicos foram perdidos e consequentemente toda a base de informação necessária para a sustentabilidade da empresa não pode ser recuperada.
A necessidade de implementação dos Planos de Continuidade de Negócios (PCN), para definição de estratégias e planos de recuperações viáveis e que assegurem a continuidade dos processos de negócios críticos das empresas se tornou imperativa.
Para a avaliação da criticidade dos processos e determinação das soluções de missão crítica de uma instituição, várias metodologias foram desenvolvidas para se estimar os impactos financeiros e operacionais com a interrupção significativa de um processo crítico na empresa.
Cada uma delas utiliza um aproach para a avaliação, porém todas produzem um relatório final denominado BIA (Business Impact Analysis). É o BIA que vai produzir os insumos necessários para a especificação dos requisitos técnicos de infra-estrutura, hardware, software, contingenciamento e robustez das aplicações, segurança, etc.
Um dos pontos fundamentais, considerado na primeira camada da pirâmide de segurança e disponibilidade dos sistemas, compreende a infra-estrutura. A quantificação e qualificação da infra-estrutura necessária para o ambiente onde os sistemas serão instalados estão hoje bem especificadas pela normalização TIA 942. Este ambiente, antigamente chamado de CPD (Centro de Processamento de Dados), é hoje chamado de Datacenter e difere grandemente daquele ambiente que hospedava soluções e aplicações há poucos anos atrás.
O ambiente Datacenter é definido como um prédio inteligente, construído sob normas internacionais e melhores práticas construtivas, dotado de mecanismos para segurança de acesso, detecção preventiva e combate a situação de riscos, com vistas a manter um ambiente propício à hospedagem de equipamentos que compõem a infra-estrutura de Tecnologia da Informação. A TIA 942 define 4 níveis, denominados Tiers (camadas) os quais correspondem à uma classificação progressiva de disponibilidade da infra-estrutura de um Datacenter. Os Tiers foram originalmente definidos pelo Uptime Institute e correspondem aos seguintes níveis de classificação de riscos:
TIER 1: Básico
Susceptível a interrupções planejadas ou não planejadas. Erros operacionais ou falhas espontâneas da infra-estrutura do site podem provocar a interrupção dos serviços. Permite uma indisponibilidade (downtime, ou seja, tempo que uma aplicação ou sistema permanece indisponível para utilização) anual máximo de até 28,8 horas.
TIER 2: Componentes Redundantes
Em face da redundância nos equipamentos, esta categoria é menos susceptível a falhas. O ambiente possui piso elevado e planejamento N+1 (“Need plus one”). A distribuição de circuitos não é redundante. Permite uma indisponibilidade (downtime) anual máximo de até 22 horas.
TIER 3: Manutenção Concorrente
Permite atividades planejadas de manutenção sem a necessidade de interrupção dos serviços. Permite uma indisponibilidade (downtime) anual máximo de até 1,6 horas.
TIER 4: Tolerante a Falhas
Além de possuir infra-estrutura e capacidade para operar sob qualquer tipo de ação de manutenção programada, o ambiente é também é tolerante a falhas, garantindo o fornecimento de recursos de energia elétrica, ar condicionado, mesmo durante a ocorrência de pior caso intempestivo (enchentes, falta de energia elétrica, falta de água, queda de pequenas aeronaves, etc.). Permite uma indisponibilidade (downtime) anual máximo de até 0,4 horas.
Acredito que se os setores de T.I. seguirem essas especificações, as tolerâncias as falhas serão bem menores do que temos passado em nossas estruturas.
Espero que tenham gostado. Até o próximo!
Julio Cesar Lima.