Almacenamiento Distribuido

Resumen

Un problema fundamental del almacenamiento es cómo guardar los datos de manera redundante, de modo que incluso si falla un elemento de la arquitectura en particular, los datos se pueden recuperar a partir de otras fuentes. Una de las estrategias consiste en contener múltiples copias de todo, aunque esto funciona, exige considerablemente un mayor almacenamiento para un nivel particular de fiabilidad (o, por contraposición lógica, proporciona una fiabilidad considerablemente menor para una cantidad particular de almacenamiento). Existe diferentes arquitecturas de almacenamiento distribuido los cuales algunos son muy efectivos por su amplio rendimiento, aquí se muestran algunas ideologías de las arquitecturas de almacenamiento.


Palabras clave: Almacenamiento, datos de recuperación

Abstract

A fundamental problem with storage is how to store data redundantly, so that even if a particular architecture element fails, the data can be retrieved from other sources. One strategy is to cote multiple copies of everything, although this works, it requires considerably more storage for a particular level of reliability (or, by logical contrast, provides considerably less reliability for a particular amount of storage). There are different distributed storage architectures which some are very effective for their broad performance, here are some ideologies of the most effective architectures.


Keywords: Storange, data recovery

Introducción

El almacenamiento y recuperación de la información representan uno de los problemas a los que la humanidad se ha tenido que enfrentar desde la invención de la escritura. El abastecimiento de datos puede verse desde dos perspectivas. La primera observación se puede hacer desde el punto de las estructuras de sistemas de almacenamiento con opciones como DAS (Direct Attached Storage o Almacenamiento de Conexión Directa), NAS (Network Attached Storage o Almacenamiento Conectado en Red), SAN (Storage Area Network o Red de Área de Almacenamiento) y sistemas de almacenamiento en la nube, que incluye capacidades de espacio en unidades de discos duros tradicionales y sólidos, así como la tecnología de la Memoria de Cambio de Fase (PCM: Phase Change Memory). (Vázquez-Moctezuma, 2015). [5]

Algunas de sus características son las siguientes:

Desarrollo

Los sistemas de almacenamiento vienen en todas las formas y tamaños, pero una cosa que todos tienen en común es que los componentes fallan, y cuando un componente falla, el sistema de almacenamiento hace lo único que se supone que no debe hacer: perder datos. Las fallas son variadas, desde sectores de disco que se corrompen silenciosamente hasta discos enteros o sitios de almacenamiento que se vuelven inutilizables. Los componentes de almacenamiento están protegidos de ciertos tipos de fallas. Por ejemplo, los sectores de disco están incrustados con información de corrección adicional, por lo que pueden tolerarse algunos bits invertidos; sin embargo, cuando se vuelcan demasiados bits o cuando los componentes físicos fallan, el sistema de almacenamiento lo ve como una eliminación.

Algunos tipos de sistemas de almacenamientos son los siguientes:

Almacenamiento de Conexión Directa (DAS).

Las unidades de disco se encuentran conectadas directamente con los servidores o host a través de una interfaz de datos SCSI o IDE, como se muestra en la figura 1. De acuerdo con Zhao (2006) las conexiones en DAS tienen muchas ventajas, tales como:

Sin embargo, su deficiencia aparece en cuatro aspectos:

 

Figura 1.- Almacenamiento de Conexión (DAS). Figura propia.

El entorno de uso de este tipo de arquitectura de almacenamiento es ideal para el intercambio de archivos localizados en ambientes con un único servidor o unos cuantos servidores, por ejemplo, pequeñas instancias que no necesitan compartir información a través de largas distancias.

Almacenamiento Conectado en Red (NAS).

El almacenamiento en red se caracteriza por el depósito fiabilidad y seguridad en los datos, y así como el simplificado y unificado en la gestión de datos. Aunque su principal bondad es la capacidad de expansión, donde se proporcionan tasas de transmisión de la información de acuerdo con el volumen de datos.

El almacenamiento conectado en red o NAS (Network Attached Storage) es un dispositivo que se conecta a la red y provee un almacén de datos que permite a varios hosts acceder al mismo lugar de almacenamiento a través de una red IP. El espacio de almacenamiento se presenta en la red con un nodo dedicado a través de un servidor de archivos, aunque en sistemas recientes este dispositivo puede ser un dispositivo inmerso en la red, ejemplo en la figura 2. [1]

El almacenamiento NAS tiene 2 características:

 

Figura 2.- Almacenamiento Conectado en Red (NAS). Figura propia.

Los principales beneficios de NAS son la facilidad de comunicación entre una computadora y el sistema de almacenamiento en comparación con una conexión de computadora a computadora. El intercambio y recuperación de datos mediante una sola fuente de almacenamiento genera menos errores, menos trabajo al tratar de mantener copias de seguridad, y mayor precisión en la búsqueda de información. Estos sistemas son más seguros porque en lugar de almacenar los datos en un solo disco duro distribuyen copias de los datos entre distintos discos duros que actúan como uno solo. Cuando un disco duro falla, se alerta al administrador de redes, y la información continúa estando disponible para todos los usuarios. [3]

El sistema NAS tiene ventajas tales como:

La escalabilidad se presenta como desventaja a causa de la capacidad se limita por los equipos y dispositivos conectados, así mismo NAS no podrá ser integrado cuando no esté bien configurado, por lo tanto, el sistema de archivos no podrá formarse. [2]

Red de Área de Almacenamiento (Storage Area Network, SAN).

Este proceso se enfoca en el almacenamiento de datos utilizando una topología de red flexible, además, con conexiones de fibra óptica que permiten alta velocidad en la transferencia de datos, ofreciendo la conmutación entre múltiples nodos como se muestra en la figura 3. La red de área de almacenamiento es otro modo de almacenamiento compartido que a menudo se usa en la nube. La gestión de almacenamiento de datos se encuentra relativamente independiente a la red de área local, con el fin de lograr el máximo grado de intercambio de datos, así como la extensión del sistema. [4]

 

Figura 3.- Red de área de almacenamiento (SAN). Figura propia.

La tecnología SAN, se orienta en la alta velocidad de procesamiento de datos masivos, algunas de sus ventajas son las siguientes:

Utilizando esta arquitectura junto con un canal de fibra óptica o FC es de gran fiabilidad, además de tener un mayor rendimiento, pero al momento de gestionar el sistema de almacenamiento SAN será complejo por la gran cantidad de información. Por otra parte, esta arquitectura es la indicada para grandes unidades de información.

Conclusión

La arquitectura mas eficiente para el amplio almacenamiento de información seria la red SAN, ya que proporciona una mayor fluidez en el trafico de datos masivos, así mismo tiene una menor perdida de datos, ya que esta diseñado para el respaldo de datos y en caso de que se ocurra una falla en un nodo, ese dato se pueda recuperar, así mismo es relativamente independiente a una red local, puesto que la red NAS solo es para tráfico de datos menores, y su arquitectura es local, pero si hablamos de compartir información a diferentes lugares con una distancia mínima la arquitectura DAS sería una de las mejores recomendaciones, pero una de su desventaja es que todo depende del servidor ya que estará recibiendo las solicitudes de trafico de datos y su rendimiento provoca que reduzca y sea pésimo. Por lo que se recomienda utilizar la arquitectura SAN y para que esta arquitectura sea aun más productiva se recomienda utilizar algunos de los diferentes tipos de borrado (erasure code), el cual ayudan a recuperar los datos perdidos de los diferentes nodos, un ejemplo de código de borrado seria: Reed-Solomon el cual es uno de los más eficientes y costoso, además, su rendimiento es muy alto, es bien conocido que se puede usar para la corrección de errores para fallas múltiples ya que la recuperación de datos se basa en matrices.

Referencias

[1] J., L. S. (2012). Research of network mass storage mode based on san. En Advances in Electronic Commerce, Web Application and Communication (págs. 279-284). Springer Berlin Heidelberg.

[2] Cunhe, L. (2002). Approach to the Information Storage Technologies under Network Environment. Journal of the China Society for Scientific and Technical Information, 1, 48-51.

[3] Edelson, E. (2004). Security in network attached storage (NAS) for workgroups. Network Security, 4, 8-12.

[4]Sadlier, G. (2003). Storage Area Networks:An Information Security Perspective. Information Systems Security, 12(5), 29-41.

[5] Vázquez-Moctezuma, S. E. (22 de junio de 2015). Information storage technologies in the digital environment. Obtenido de Tecnologías de almacenamiento de información en el ambiente digital: https://revistas.ucr.ac.cr/index.php/eciencias/article/view/19762/23190

[6] Xu, J. y Zhu, S. (2006).Research on the Application of SAN in Digital Library. Library and Information Service of Zhejiang Universities and Colleges, 3, 20-21.

 

[a] Alumno de la Licenciatura en Ciencias Computacionales-Escuela Superior de Huejutla eduard030696@gmail.com

[b] Alumno de la Licenciatura en Ciencias Computacionales-Escuela Superior de Huejutla alaguerrero96@gmail.com

[c] Docente de la Universidad Autónoma del Estado de Hidalgo- Escuela Superior de Huejutla raul_palacios@uaeh.edu.mx

[d] Docente de la Universidad Autónoma del Estado de Hidalgo- Escuela Superior de Huejutla felipe_nunez@uaeh.edu.mx