Please enable JavaScript.
Coggle requires JavaScript to display documents.
Caso de estudo: Falha no DataCenter Joyent (Responsabilidade da Joyent…
Caso de estudo: Falha no DataCenter Joyent
Correções
A nível dos procedimentos operacionais
Limitar as ferramentas a usar pelos operários e as devidas permissões
Minimizar o trabalho a realizar no caso de falha
Reforçar o suporte com o cliente
A nível de software e hardware
Aumentar a complexidade do processo de reboot em simultâneo
Tornar o processo mais demorado sem risco de falha humana
Permitir a recuperação de cada nó sem intervenção humana no caso de apagão
Implementar o uso de ferramentas sem poder absoluto para tarefas de rotina
Plataformas desatualizadas
Comunicar com cada cliente individualmente durante o processo de migração
Investir na migração para plataformas mais recentes
Melhorar o sistema de validação ao
Adicionar passos extra na execução de instruções
Reforçar a rigidez de modo a evitar acidentes na escrita de instruções remotas
Fator Humano
Aspetos Negativos
Falta de atenção por parte do operário que levou ao erro
Falta de rigor durante o desenvolvimento do serviço e da sua arquitetura
Aspetos Positivos
Boa comunicação e suporte com os clientes
Comunicação com os clientes na migração do hardware antigo de modo a prevenir os impactos negativos deste
Promessa de maior rigor na arquitetura do seu serviço de modo a que não aconteçam casos semelhantes
Publicação de um "Postmortem" a esclarecer a situação
Decisões corretas por parte da administração
Ao procurar de imediato investir na melhoria das suas ferramentas de modo a prevenir falhas semelhantes
Ao admitir que existiam outras falhas na arquitetura do serviço e procurar resolvê-las de imediato
Ao reconhecer que o operário que cometeu o erro não deve ser castigado, e aproveitar para aprender com a falha
Com um pedido de desculpas público
No esforço e eficácia para restaurar os sistemas
Os sistemas onde o processo de restauração foi mais longo aconteceu devido a hardware desatualizado e não ineficácia técnica
Cerca de 80% dos sistemas foram restaurados em 32 minutos
Infraestruturas na Cloud
Vantagens
Flexibilidade
Escalabilidade
Necessidades de segurança adaptadas
Controlo do serviço na cloud
Eficácia
Acessibilidade
Segurança de dados (backups)
Poupança em hardware (sistemas remotos)
Vantagem estratégica
Fácil colaboração global entre empresas
Fácil gestão de infraestrutura que permite o foco por parte da empresa noutras áreas
Atualizações Regulares
Riscos
Dados
Staff da empresa que fornece os serviços cloud pode aceder a estes dados
A eliminação de dados é incompleta, e o consumidor não tem noção onde estes estão armazenados
Segurança
Perda de credenciais
Possíveis falhas e perda de informação e dados
Falta de controlo e visibilidade
Perda de visibilidade e de responsabilidade sob os serviços
Os consumidores perdem controlo total dos serviços e operações a ser transferidos para a cloud
Responsabilidade da Joyent perante os clientes
Desempenho na cloud
Assegurar-se que os serviços são desempenhados pelo tempo exigido pelo cliente, sem "down time"
Garantir que os serviços desempenham de acordo com as especificações dos clientes
Fornecer atualizações e manutenção regular
Fornecer segurança
Com encriptação dos dados
Com proteção da infraestrutura de rede
Prestar suporte no caso de falha
Ao garantir a segurança e backup da informação
Ao assegurar-se da resolução e prevenção futura do problema
Ao comunicar com o cliente
Inovar e melhorar os seus serviços
Fornecer a devida segurança da informação
Garantir o backup dos dados
Garantir que não há vulnerabilidades na rede
Condicionar o acesso por parte do staff aos dados dos clientes