Almacenamiento Distribuido

Resumen

Un problema fundamental del almacenamiento es cómo guardar los datos de manera redundante, de modo que incluso si falla un elemento de la arquitectura en particular, los datos se pueden recuperar a partir de otras fuentes. Una de las estrategias consiste en contener múltiples copias de todo, aunque esto funciona, exige considerablemente un mayor almacenamiento para un nivel particular de fiabilidad (o, por contraposición lógica, proporciona una fiabilidad considerablemente menor para una cantidad particular de almacenamiento). Existe diferentes arquitecturas de almacenamiento distribuido los cuales algunos son muy efectivos por su amplio rendimiento, aquí se muestran algunas ideologías de las arquitecturas de almacenamiento.

Palabras clave: Almacenamiento, datos de recuperación

Abstract

A fundamental problem with storage is how to store data redundantly, so that even if a particular architecture element fails, the data can be retrieved from other sources. One strategy is to cote multiple copies of everything, although this works, it requires considerably more storage for a particular level of reliability (or, by logical contrast, provides considerably less reliability for a particular amount of storage). There are different distributed storage architectures which some are very effective for their broad performance, here are some ideologies of the most effective architectures.

Keywords: Storange, data recovery

Introducción

El almacenamiento y recuperación de la información representan uno de los problemas a los que la humanidad se ha tenido que enfrentar desde la invención de la escritura. El abastecimiento de datos puede verse desde dos perspectivas. La primera observación se puede hacer desde el punto de las estructuras de sistemas de almacenamiento con opciones como DAS (Direct Attached Storage o Almacenamiento de Conexión Directa), NAS (Network Attached Storage o Almacenamiento Conectado en Red), SAN (Storage Area Network o Red de Área de Almacenamiento) y sistemas de almacenamiento en la nube, que incluye capacidades de espacio en unidades de discos duros tradicionales y sólidos, así como la tecnología de la Memoria de Cambio de Fase (PCM: Phase Change Memory). (Vázquez-Moctezuma, 2015). [5]

Algunas de sus características son las siguientes:

Concurrencia: Permite que los recursos disponibles en la red puedan ser utilizados simultáneamente por los usuarios y/o agentes que interactúan en la red.
Carencia de reloj global: Las coordinaciones para la transferencia de mensajes entre los diferentes componentes para la realización de una tarea, no tienen una temporización general, está mas bien distribuida en los componentes.
Fallos independientes de los componentes: cada componente del sistema pudiera fallar de manera independiente, y los demás continuar ejecutando sus acciones. Esto permite el logro de las tareas con mayor efectividad, pues el sistema en su conjunto continúa trabajando.

Desarrollo

Los sistemas de almacenamiento vienen en todas las formas y tamaños, pero una cosa que todos tienen en común es que los componentes fallan, y cuando un componente falla, el sistema de almacenamiento hace lo único que se supone que no debe hacer: perder datos. Las fallas son variadas, desde sectores de disco que se corrompen silenciosamente hasta discos enteros o sitios de almacenamiento que se vuelven inutilizables. Los componentes de almacenamiento están protegidos de ciertos tipos de fallas. Por ejemplo, los sectores de disco están incrustados con información de corrección adicional, por lo que pueden tolerarse algunos bits invertidos; sin embargo, cuando se vuelcan demasiados bits o cuando los componentes físicos fallan, el sistema de almacenamiento lo ve como una eliminación.

Algunos tipos de sistemas de almacenamientos son los siguientes:

Almacenamiento de Conexión Directa (DAS).

Las unidades de disco se encuentran conectadas directamente con los servidores o host a través de una interfaz de datos SCSI o IDE, como se muestra en la figura 1. De acuerdo con Zhao (2006) las conexiones en DAS tienen muchas ventajas, tales como:

Su instalación es fácil.
El software es poco complejo.
El costo en mantenimiento es bajo.
La tecnología presenta madurez y técnica, buena compatibilidad y relativamente es de menor gasto.

Sin embargo, su deficiencia aparece en cuatro aspectos:

La capacidad de almacenamiento está limitada por el servidor.
Su rendimiento de almacenamiento es directamente afectado por el servidor.
Los servidores dispersos geográficamente se limitan al intercambio de información y gestión cuando se tiene un servidor aislado.
La carga de almacenamiento de datos y el acceso en el servidor hará en general tener un pobre rendimiento.

Figura 1.- Almacenamiento de Conexión (DAS). Figura propia.

El entorno de uso de este tipo de arquitectura de almacenamiento es ideal para el intercambio de archivos localizados en ambientes con un único servidor o unos cuantos servidores, por ejemplo, pequeñas instancias que no necesitan compartir información a través de largas distancias.

Almacenamiento Conectado en Red (NAS).

El almacenamiento en red se caracteriza por el depósito fiabilidad y seguridad en los datos, y así como el simplificado y unificado en la gestión de datos. Aunque su principal bondad es la capacidad de expansión, donde se proporcionan tasas de transmisión de la información de acuerdo con el volumen de datos.

El almacenamiento conectado en red o NAS (Network Attached Storage) es un dispositivo que se conecta a la red y provee un almacén de datos que permite a varios hosts acceder al mismo lugar de almacenamiento a través de una red IP. El espacio de almacenamiento se presenta en la red con un nodo dedicado a través de un servidor de archivos, aunque en sistemas recientes este dispositivo puede ser un dispositivo inmerso en la red, ejemplo en la figura 2. [1]

El almacenamiento NAS tiene 2 características:

La conexión física, puesto que se conecta el servidor de archivos directamente al equipo de almacenamiento y otro punto a la red, evitando así la carga de entrada y salida de datos en el servidor. [3]
Se reducen los movimientos de la unidad del disco y por lo tanto se reduce el desgaste. [3]

Figura 2.- Almacenamiento Conectado en Red (NAS). Figura propia.

Los principales beneficios de NAS son la facilidad de comunicación entre una computadora y el sistema de almacenamiento en comparación con una conexión de computadora a computadora. El intercambio y recuperación de datos mediante una sola fuente de almacenamiento genera menos errores, menos trabajo al tratar de mantener copias de seguridad, y mayor precisión en la búsqueda de información. Estos sistemas son más seguros porque en lugar de almacenar los datos en un solo disco duro distribuyen copias de los datos entre distintos discos duros que actúan como uno solo. Cuando un disco duro falla, se alerta al administrador de redes, y la información continúa estando disponible para todos los usuarios. [3]

El sistema NAS tiene ventajas tales como:

Facilidad en la instalación.
Complemento o extensiones (plugs).
Precio.
Flexibilidad de conexión.
Fácil mantenimiento.
Seguridad de autenticación.
Administración de espacio en disco y escalabilidad.

La escalabilidad se presenta como desventaja a causa de la capacidad se limita por los equipos y dispositivos conectados, así mismo NAS no podrá ser integrado cuando no esté bien configurado, por lo tanto, el sistema de archivos no podrá formarse. [2]

Red de Área de Almacenamiento (Storage Area Network, SAN).

Este proceso se enfoca en el almacenamiento de datos utilizando una topología de red flexible, además, con conexiones de fibra óptica que permiten alta velocidad en la transferencia de datos, ofreciendo la conmutación entre múltiples nodos como se muestra en la figura 3. La red de área de almacenamiento es otro modo de almacenamiento compartido que a menudo se usa en la nube. La gestión de almacenamiento de datos se encuentra relativamente independiente a la red de área local, con el fin de lograr el máximo grado de intercambio de datos, así como la extensión del sistema. [4]

Figura 3.- Red de área de almacenamiento (SAN). Figura propia.

La tecnología SAN, se orienta en la alta velocidad de procesamiento de datos masivos, algunas de sus ventajas son las siguientes:

Alta velocidad en el acceso
Almacenamiento seguro
Intercambio de datos
Respaldo de datos
Migración de los datos
Conexión con cable UTP y fibra óptica [6]

Utilizando esta arquitectura junto con un canal de fibra óptica o FC es de gran fiabilidad, además de tener un mayor rendimiento, pero al momento de gestionar el sistema de almacenamiento SAN será complejo por la gran cantidad de información. Por otra parte, esta arquitectura es la indicada para grandes unidades de información.

Conclusión

La arquitectura mas eficiente para el amplio almacenamiento de información seria la red SAN, ya que proporciona una mayor fluidez en el trafico de datos masivos, así mismo tiene una menor perdida de datos, ya que esta diseñado para el respaldo de datos y en caso de que se ocurra una falla en un nodo, ese dato se pueda recuperar, así mismo es relativamente independiente a una red local, puesto que la red NAS solo es para tráfico de datos menores, y su arquitectura es local, pero si hablamos de compartir información a diferentes lugares con una distancia mínima la arquitectura DAS sería una de las mejores recomendaciones, pero una de su desventaja es que todo depende del servidor ya que estará recibiendo las solicitudes de trafico de datos y su rendimiento provoca que reduzca y sea pésimo. Por lo que se recomienda utilizar la arquitectura SAN y para que esta arquitectura sea aun más productiva se recomienda utilizar algunos de los diferentes tipos de borrado (erasure code), el cual ayudan a recuperar los datos perdidos de los diferentes nodos, un ejemplo de código de borrado seria: Reed-Solomon el cual es uno de los más eficientes y costoso, además, su rendimiento es muy alto, es bien conocido que se puede usar para la corrección de errores para fallas múltiples ya que la recuperación de datos se basa en matrices.

Referencias

[1] J., L. S. (2012). Research of network mass storage mode based on san. En Advances in Electronic Commerce, Web Application and Communication (págs. 279-284). Springer Berlin Heidelberg.

[2] Cunhe, L. (2002). Approach to the Information Storage Technologies under Network Environment. Journal of the China Society for Scientific and Technical Information, 1, 48-51.

[3] Edelson, E. (2004). Security in network attached storage (NAS) for workgroups. Network Security, 4, 8-12.

[4]Sadlier, G. (2003). Storage Area Networks:An Information Security Perspective. Information Systems Security, 12(5), 29-41.

[5] Vázquez-Moctezuma, S. E. (22 de junio de 2015). Information storage technologies in the digital environment. Obtenido de Tecnologías de almacenamiento de información en el ambiente digital: https://revistas.ucr.ac.cr/index.php/eciencias/article/view/19762/23190

[6] Xu, J. y Zhu, S. (2006).Research on the Application of SAN in Digital Library. Library and Information Service of Zhejiang Universities and Colleges, 3, 20-21.

^[a] Alumno de la Licenciatura en Ciencias Computacionales-Escuela Superior de Huejutla eduard030696@gmail.com

^[b] Alumno de la Licenciatura en Ciencias Computacionales-Escuela Superior de Huejutla alaguerrero96@gmail.com

^[c] Docente de la Universidad Autónoma del Estado de Hidalgo- Escuela Superior de Huejutla raul_palacios@uaeh.edu.mx

^[d] Docente de la Universidad Autónoma del Estado de Hidalgo- Escuela Superior de Huejutla felipe_nunez@uaeh.edu.mx