La desduplicación de datos es un método de reducción de las necesidades de almacenamiento mediante la eliminación de datos redundantes. En realidad, sólo una única instancia de datos se retiene en medios de almacenamiento, como el disco o la cinta Los datos redundantes se reemplazan con un indicador en la única copia de datos Por ejemplo, un típico sistema de correo electrónico puede contener 100 instancias del mismo archivo adjunto de un megabyte Si la plataforma del correo electrónico tiene copia de seguridad o está archivada, todas las instancias están guardadas; se requiere 100 MB de espacio de almacenamiento En realidad, con la de-duplicación de datos sólo una instancia del adjunto se almacena. Cada instancia posterior hace referencia a la copia original guardada En este ejemplo, una demanda de almacenamiento de 100 MB se puede reducir en sólo un MB.
http://www.recall.es/why-recall/data-protection-terminology
Data deduplication looks for redundancy of sequences of bytes across very large comparison
windows. Sequences of data (over 8 KB long) are compared to the history of
other such sequences. The first uniquely stored version of a sequence is
referenced rather than stored again. This process is completely hidden from
users and applications so the whole file is readable after it's written.
http://www.emc.com/corporate/glossary/index.htm
Temas relacionados