À medida que o mundo trabalha em direção a metas vitais de carbono líquido zero, a digitalização se tornou essencial para fornecer estratégias verdes e eficientes. Os dados são essenciais para gerar melhores resultados de negócios e garantir um futuro sustentável. Por outro lado, no entanto, nosso novo mundo orientado por dados apresenta seus próprios desafios de sustentabilidade. Os data centers que abrigam nossas reservas digitais exigem grandes quantidades de energia. Prevê-se que as emissões globais da computação em nuvem, por exemplo, representem mais de 3,5% das emissões de gases de efeito estufa, ainda mais do que voos comerciais.
Na última década, esforços foram feitos para garantir que os data centers sejam mais sustentáveis. No entanto, embora a infraestrutura possa se tornar mais ecológica, a questão do armazenamento desperdiçado dificulta os esforços. O armazenamento contínuo de dados inúteis drena recursos preciosos.
De acordo com a pesquisa da Veritas, o poder necessário para armazenar esses dados escuros desperdiça até 6,4 milhões de toneladas de CO2 anualmente. Os analistas preveem que até 2025 haverá cerca de 91ZB de dados obscuros sendo mantidos desnecessariamente - mais de quatro vezes o volume atual.
Dados Obscuros
Em média, nossa pesquisa descobriu que 52% dos dados armazenados pelas organizações são “escuros”; seu conteúdo e valor são desconhecidos e é essencialmente inútil até que seu valor (se houver) seja determinado. Ao mesmo tempo, estima-se que cerca de um terço dos dados organizacionais sejam Redundantes, Obsoletos e Triviais (ROT).
Em suma, faixas de dados estão sendo armazenadas sem motivo. Os dados ROT são os principais contribuintes para altos custos de armazenamento; pesquisas globais recentes sugerem que mais de nove em cada dez organizações excedem seus orçamentos de nuvem, gastando em média 43%, principalmente em armazenamento, backup e recuperação.
Muito já foi dito sobre o custo financeiro dos dados obscuros, mas o custo ambiental é frequentemente negligenciado. A eliminação de enormes quantidades de desperdício de dados pode ajudar a reduzir drasticamente a pegada de carbono das organizações, levando a uma maior sustentabilidade e a custos mais baixos. Como tal, as empresas devem controlar suas estratégias de gerenciamento de dados, usar as ferramentas certas para identificar dados valiosos e livrar seus data centers de dados obscuros desnecessários e que consomem energia.
Gerenciamento de dados é crucial
O gerenciamento de dados é um primeiro passo crucial para que as organizações analisem dados em escala com eficiência.
Isso começa com o mapeamento e a descoberta de dados, entendendo como as informações fluem por uma organização. Obter visibilidade e informações sobre onde os dados e informações confidenciais são armazenados, quem tem acesso e por quanto tempo eles são retidos é o primeiro porto de escala ao identificar dados obscuros.
No entanto, é importante que as organizações invistam em um programa contínuo de gerenciamento proativo de dados. Isso permite que as organizações obtenham visibilidade de seus dados, armazenamento e infraestrutura de backup e tomem decisões baseadas em insights relacionados à exclusão de dados continuamente. Dados escuros e ROT acumulados drenam todos os recursos.
Além disso, a minimização de dados e a limitação da finalidade podem reduzir a quantidade de dados armazenados e garantir que o que é retido esteja diretamente relacionado à sua finalidade. O uso de classificação, políticas flexíveis de retenção de dados e mecanismos de política compatíveis significa que pode haver exclusão confiável de informações não relevantes. Isso não apenas reduz a quantidade de dados obscuros que alimentam os recursos do data center, mas também pode garantir a conformidade com os regulamentos de proteção de dados, como o GDPR.
Para muitas organizações, a redução de dados escuros e ROT não é uma tarefa simples, especialmente quando manuseada manualmente. O processo pode ser complexo, com muitas soluções de gerenciamento de dados corporativos retendo uma abordagem manual de implantação e manutenção, diminuindo a agilidade operacional.
Com a quantidade de dados criados e armazenados explodindo, essa não é uma tarefa que as empresas possam realizar manualmente. A automação de análises, rastreamento e relatórios de dados obscuros é essencial ao lidar com potencialmente petabytes de dados e bilhões de arquivos. Além disso, a necessidade de estratégias multinuvem exigiu o desenvolvimento de uma nova abordagem para o gerenciamento de dados.
Gerenciamento autônomo de dados
A ferramenta definitiva para as organizações agora é o gerenciamento autônomo de dados. Aqui, as tecnologias de inteligência artificial (IA) e machine learning (ML) permitem a automação dos processos de gerenciamento de dados e minimizam a intervenção e a supervisão humana. Ao automatizar o provisionamento, otimização, recuperação e configuração de tecnologias de gerenciamento de dados em ambientes multinuvem, as empresas podem obter uma imagem muito mais clara e precisa de seus dados em um espaço de tempo muito mais curto, não importa o que seja ou onde esteja está armazenado.
Por exemplo, as plataformas de gerenciamento de dados corporativos agora podem classificar autonomamente dados baseados em nuvem, desduplicar dados desnecessários e redundantes na nuvem e arquivar ou excluir dados obsoletos e triviais. Essa abordagem automatizada de percepção de dados também deve ser integrada a soluções de arquivamento, backup e segurança cibernética para evitar a perda de dados e garantir a retenção de dados baseada em políticas.
A transformação digital contínua torna os requisitos das organizações para conteúdo e contexto de dados uma prioridade, principalmente quando muitos desses projetos transformadores buscam oferecer maior sustentabilidade. A energia usada para armazenar dados inúteis é puro desperdício. Imagine se pudéssemos remover automaticamente 85% desses dados inúteis dos data centers - isso permitiria um grande salto em direção ao zero líquido.
Reduzir o impacto ambiental de nossa pegada de armazenamento de dados será imperativo se quisermos evitar a criação de uma massa ainda maior de dados residuais à medida que a nuvem evolui. As estratégias verdes impulsionadas pela digitalização não podem ser abandonadas pela sombra de dados obscuros que consomem energia em segundo plano, desfazendo silenciosamente um bom trabalho. A jornada para uma nuvem sustentável depende do combate ao desperdício de dados. A melhor solução para gerenciar o desperdício de dados em um ambiente complexo de nuvem híbrida e multinuvem é a operação autônoma, minimizando a dependência de processos manuais ao combinar hiperautomação com inteligência orientada por dados.