Desduplicación

Desduplicación

La desduplicación de datos es un método de reducción de las necesidades de almacenamiento mediante la eliminación de datos redundantes. En realidad, sólo una única instancia de datos se retiene en medios de almacenamiento, como el disco o la cinta Los datos redundantes se reemplazan con un indicador en la única copia de datos Por ejemplo, un típico sistema de correo electrónico puede contener 100 instancias del mismo archivo adjunto de un megabyte Si la plataforma del correo electrónico tiene copia de seguridad o está archivada, todas las instancias están guardadas; se requiere 100 MB de espacio de almacenamiento En realidad, con la de-duplicación de datos sólo una instancia del adjunto se almacena. Cada instancia posterior hace referencia a la copia original guardada En este ejemplo, una demanda de almacenamiento de 100 MB se puede reducir en sólo un MB.

http://www.recall.es/why-recall/data-protection-terminology

(en) Data deduplication

Data deduplication looks for redundancy of sequences of bytes across very large comparison windows. Sequences of data (over 8 KB long) are compared to the history of other such sequences. The first uniquely stored version of a sequence is referenced rather than stored again. This process is completely hidden from users and applications so the whole file is readable after it's written.

http://www.emc.com/images/common/spacer.gif http://www.emc.com/corporate/glossary/index.htm

Temas relacionados

Términos