Melhores práticas em segurança de dados: Backup em Nível de Bloco

Melhores práticas em segurança de dados: Backup em Nível de Bloco

Em mais uma publicação sobre a nossa solução de backup (clique aqui e tenha uma visão geral da solução que trabalhamos), falaremos de outro recurso que contempla o melhor tratamento da segurança de dados. Lembrando que já falamos sobre backup em tempo real.

Imagine um grande armário de arquivo com 50 gavetas em um escritório, diariamente vários gavetas são abertas e informações retiradas, adicionadas ou alteradas. Ao final do dia o estagiário responsável pelo setor precisa fazer um backup via digitalização apenas das informações que não faziam parte desse mesmo arquivo no final do dia anterior, o estagiário tem duas opções:

  • verificar todas as gavetas buscando o que há de novo e então digitalizar;
  • de alguma maneira verificar apenas as gavetas com novas informações e então digitalizar.

É num cenário como esse, porém digital, que o recurso Backup em Nível de Bloco é muito importante.

Introdução

O backup em nível de bloco é uma ótima maneira de agilizar e eliminar certas ineficiências na execução do backup. Quando você executa backups regulares, os arquivos estão sendo totalmente carregados para a nuvem a partir do seu computador, embora seja bom para o primeiro backup, carregar arquivos grandes repetidas vezes não é nada eficiente, ainda mais se os arquivos forem apenas pouco modificados.

Processo de backup em bloco

Uma melhor abordagem é  dividir esses arquivos em pequenos blocos e fazer backup apenas dos blocos modificados desse arquivo, isso é o que o recurso backup em nível de bloco faz, ele divide o arquivo em blocos compatíveis com o tamanho do arquivo.

Como funciona

A divisão funciona assim: arquivos de 1 MB a 512 GB são divididos em blocos de 128 kilobytes, de 512 GB a 1 TB em 256 kilobytes e arquivos maiores que 1 TB são divididos em 512 kilobytes, lembrando que arquivos abaixo de 1 MB são ignorados por esse recurso.

A diferenciação dos blocos ocorre através dos chamados hashes, que são calculados separadamente para cada bloco e, em seguida, comparados com o valor anterior, havendo uma falta de correspondência, o bloco é carregado para a nuvem. Esses hashes, por sua vez, são copiados e guardados no armazenamento local, portanto é importante notar que a adição de novos arquivos exigirá um pouco mais de espaço de armazenamento e recursos de CPU para cálculos de hash.

Também é possível especificar o limite de porcentagem no qual outro backup completo será iniciado.

Aplicações

O backup em nível de bloco é uma ferramenta poderosa para certos cenários, funciona de forma eficiente com backups baseados em imagens mas não em documentos do Microsoft Office®.

Como explicamos anteriormente, o backup em nível de bloco basicamente compara os blocos com seu estado anterior e os carrega se forem feitas alterações. O que ocorre é que alguns arquivos são estruturados de maneira a que, quando modificá-los mesmo que de forma pequena, todos os blocos serão modificados, em outras palavras, sua representação binária é inteiramente diferente cada vez que você a modifica, fazendo com que o backup copie todos os blocos de maneira desnecessária. Da mesma forma, o backup em nível de bloco não é a melhor opção para arquivos estáticos que nunca mudam, como documentos PDF.

Além de arquivos PDF e documentos do Microsoft Office (.doc, .xls, .ppt, .docx, .pptx, .xlsx etc.), arquivos criptografados ou compactados, fotos, músicas e vídeos não são indicados para serem salvos com esse recurso.

Por outro lado, em outros tipos de arquivos o funcionamento é diferente, neles apenas um certo número de blocos são modificados quando o arquivo é alterado. Sã eles arquivos de texto (.txt), base de dados do Outlook (.pst), bancos de dados diversos (SQL®, Firebird®, Access® etc.), imagens de disco e arquivos de log.

Se você ainda tiver alguma dúvida em relação ao recurso, sinta-se à vontade para nos enviar um comentário abaixo ou falar conosco.

 Referências

  1. Centralizing Customer Profile Data: What You Need to Know – LoginRadius. Acessado em 28/06/2017.
  2. Why CCS – CCS. Acessado em 28/06/2017.