Processo de lançamento do WatchGuard Endpoint
As mais recentes notícias sobre uma interrupção global de TI causada por uma atualização de conteúdo de um fornecedor de segurança impulsionaram conversas importantes sobre os processos de garantia de qualidade para produtos de endpoint e atualizações de conteúdo.
Na WatchGuard, com mais de 30 anos de experiência neste sector, conhecemos bem a sensibilidade do processo de atualização e quisemos aproveitar esta oportunidade para destacar os processos que temos em vigor para proteger a nossa valiosa comunidade de parceiros e clientes dos impactos de uma implementação de atualização defeituosa.
Os produtos de segurança para endpoints estão intimamente ligados ao sistema operativo (SO), pelo que exigem processos de qualidade mais rigorosos. A singularidade destes produtos e os requisitos de acesso privilegiado ao SO tornam o processo de desenvolvimento e de garantia de qualidade (QA) mais difícil do que noutros tipos de desenvolvimento de software. Devido ao facto de este tipo de software ser executado em dez a centenas de milhões de endpoints e em ambientes extremamente diversificados, não podemos testar todos os ambientes exatamente iguais nos quais o produto acabará por ser executado. Para resolver esse problema, as equipas técnicas da WatchGuard implementaram um processo que, enquanto mantém o ritmo dos lançamentos, limita a possibilidade de perturbar as operações normais.
Processo de atualização de produtos para endpoints da WatchGuard
Fase 1 - Antevisão de Amigos e Família:
O processo, que é explicado neste artigo técnico, começa depois de a equipa de Qualidade concluir todos os procedimentos internos de testes alfa e beta de uma nova versão. Assim que o software é certificado, começamos com uma fase a que chamamos internamente de testes Friends & Family; essencialmente, porque começou por ser exatamente isso, amigos e família a testar a nova solução em produção.
Originalmente, há quase 10 anos, começámos por atualizar os nossos sistemas pessoais, tanto os sistemas empresariais como os dispositivos pessoais em casa. Nossos sistemas WatchGuard internos estão entre os primeiros a serem incluídos na implementação do Friends & Family - não apenas os computadores pessoais, mas também os servidores de produção.
Ao longo do tempo, este ambiente tornou-se muito mais diversificado, com centenas de contas e milhares de endpoints. Alguns dos nossos parceiros mais estratégicos e alguns administradores de clientes quiseram juntar-se à adoção antecipada das nossas novas versões, o que adiciona estes ambientes de clientes aos nossos primeiros testes Friends & Family.
Todos os sistemas incluídos nesta fase são altamente monitorizados. Adicionámos uma telemetria alargada para verificar se a nova versão não se comporta de forma diferente da que está a ser atualizada. Entre os dados alargados, carregamos e monitorizamos potenciais falhas e erros, mas também dados de saúde, como a memória consumida ou a utilização média da CPU.
Dependendo das alterações, mantemos esta fase durante tempo suficiente para verificar se a implementação inicial foi bem-sucedida e se também funciona corretamente durante um período suficiente.
A nossa equipa de suporte também está muito ativa durante esta fase para identificar quaisquer potenciais novos problemas. De facto, são eles que dão o principal contributo para decidir se podemos avançar para o passo seguinte do processo de lançamento da atualização. Quando a nossa equipa de suporte estiver satisfeita com a versão e todas as métricas estiverem dentro dos parâmetros definidos, avançamos.
Fase 2 – Visualização controlada:
O próximo passo é notificar na consola do Cloud que está disponível uma nova versão. A intenção é fornecer aos nossos parceiros e clientes um aviso de que podem começar a implementar a nova versão. É possível, como descrito neste artigo técnico, efetuar a atualização dos seus sistemas de forma controlada.
Permanecemos nesta fase durante várias semanas, monitorizando o número de novos dispositivos que estão a ser atualizados. Tal como na fase Friends & Family, as nossas equipas de suporte estão muito ativas na identificação de comportamentos anómalos que possam estar relacionados com a nova versão.
Fase 3 – Processo de atualização automática:
Quando nos sentimos confortáveis com a nova versão, damos início às fases de atualização automática. Mais uma vez, o número de fases depende das alterações, mas são normalmente divididas em três ou quatro fases, durante as quais começamos a enviar a atualização aos clientes nessas fases.
Processo de atualização de conteúdo da WatchGuard:
O processo de fornecimento de atualizações de conteúdo é semelhante. Neste caso, temos um ambiente de teste semelhante ao nosso Friends & Family, com centenas de contas e milhares de dispositivos. Assim que o conteúdo é certificado, publicamos primeiro a atualização neste ambiente. À semelhança da fase Amigos e família, este ambiente é altamente monitorizado em termos de dados de saúde. Qualquer desvio em relação à linha de desempenho anterior é avaliado e testado novamente neste ambiente. Só quando esse processo estiver concluído - sem que sejam comunicados quaisquer novos problemas - é que enviamos a atualização aos nossos parceiros e clientes.
Quero aproveitar esta oportunidade para reconhecer o esforço e o valor resultante do trabalho que as nossas equipas internas de Desenvolvimento, Garantia de Qualidade, DevOps e Suporte fazem diariamente para garantir que mantemos a solução atualizada contra novas ameaças e evitar problemas para os nossos parceiros e clientes. Também quero reiterar o compromisso contínuo da WatchGuard de revisitar, revisar e evoluir esses processos conforme apropriado para continuar conquistando sua confiança.
Por fim, estou no setor há mais de vinte e cinco anos e conheço a dor causada por uma implementação fracassada, e não gosto de ver isso acontecer com outras empresas. Quando isso acontece, o nosso impulso é redobrar o esforço para verificar se mantemos os nossos parceiros e clientes a salvo de ameaças reais e mantermo-nos vigilantes na reavaliação constante dos nossos processos internos.