ALMACENAMIENTO, INTRODUCCIÓN Y TERMINOLOGÍA

serverIntroducción:

NOTA: El siguiente articulo es un extracto y traducción del website:

http://whatis.techtarget.com/glossary/Storage-area-network-SAN

En este post, vamos a tratar el tema de almacenamiento a nivel básico, introduciremos los principales conceptos, arquitecturas, tecnologías más usadas, etc. Este articulo pretende ser también un glosario de términos referente a dichos medios, tales como:

SAN, NAS, DAS, NFS, SMB, CIFS, “Fibre Channel”, HBA, “Switch Fabric”, iSCSI, IQN, MPIO, LUN, “Switch Zoning”, “LUN Masking”, WWN, WWNN, WWPN, FCIP, iFCP.

Por consiguiente intentaremos explicar, qué son y qué significa cada una de estas terminologías.

 

Arquitecturas de Almacenamiento:

Empezaremos con los términos DAS (“Direct Attached Storage”), NAS (“Network Attached Storage”), y SAN (“Storage Area Network”), sus ventajas e inconvenientes, diferencias y similitudes, así como su relación con otros conceptos y tecnologías (SCSI, “Fibre Channel”, RAID, NFS ó “Network File System”, CIFS ó “Common Internet File System”, iSCSI, MPIO, “SecurePath”, “LUN Masking”, “Zoning”, etc).

  • DAS (“Direct Attached Storage”):

Se trata de dispositivos de almacenamiento directamente conectados a la máquina, como es el caso de discos duros internos, cabinas de disco o unidades de cinta para “backup”.

Suelen basarse en tecnologías SCSI (“Small Computers System Interface”) y FC (“Fiber Channel”). Esta arquitectura de almacenamiento, se relacionaba principalmente con la época de los “Mainframe” de IBM. Sin embargo, hoy en día, los PC’s de sobremesa utilizan arquitectura de almacenamiento DAS, mientras que en los servidores de las empresas, empieza a caer en desuso, utilizándose únicamente para el almacenamiento del sistema operativo.

La arquitectura de almacenamiento DAS (“Direct Attached Storage”), presenta muchos inconvenientes, como es la dispersión del almacenamiento, que implica una dificultad en la gestión de los “Backups”, así como una baja tolerancia a fallos (sólo posible a través de soluciones RAID), y un alto TCO (“Total Cost of Ownership”)debido a las dificultades de mantenimiento.

  • NAS (Network Attached Storage):

Con la introducción de las redes locales (LAN), se empezaron a utilizar servidores de almacenamiento conectados a la red, a los cuales se podía acceder directamente a través de la propia infraestructura mediante protocolos específicos como NFS (“Network File System”) en entornos UNIX y CIFS (“Common Internet File System”) en entornos Microsoft (antes conocido como SMB, protocolo original de IBM que fue mejorado por Microsoft en CIFS) o incluso mediante FTP, HTTP, etc.

Actualmente las soluciones NAS se basan en TCP/IP, con protocolos NFS o CIFS por encima. En consecuencia, un dispositivo NAS será una máquina dedicada con una o varias direcciones IP y además estará dotado de una conexión de alta velocidad a la red LAN. De esta forma, los equipos clientes en una arquitectura de almacenamiento NAS, delegan la gestión del sistema de ficheros al propio dispositivo NAS, que se limita a montar las unidades de red exportadas o compartidas, de tal modo que los usuarios y aplicaciones utilizan estos sistemas de ficheros como si fueran locales, aunque para el sistema operativo se trate claramente de sistemas de ficheros remotos.

El problema de esta arquitectura de almacenamiento, es que la red LAN puede actuar de cuello de botella “Bottle neck”. Actualmente, siguen utilizándose masivamente las arquitecturas NAS (Carpetas Compartidas o “Shared Folder”, las cuales se usan en las empresas para el almacenamiento de ficheros).

Los principales beneficios de las Arquitecturas de Almacenamiento NAS son que proporcionan un mejor TCO (“Total Cost of Ownship”), resultando fácilmente escalable y capaces de ofrecer una alta disponibilidad.

 

  • SAN (Storage Area Network):

Esta arquitectura implica disponer de una infraestructura de red de alta velocidad dedicada sólo para almacenamiento y “Backup”, optimizada para mover grandes cantidades de datos y consistente en múltiples recursos de almacenamiento geográficamente distribuidos o no, además de otros elementos (cables, “switches” de fibra FC, “routers”, adaptadores HBA, etc).

Las redes de almacenamiento SAN han facilitado enormemente la creación de Centros de Procesos de Datos (CDP) distribuidos, Clusters Geográficos, creación de centros de respaldo (BDC), etc.

La utilización de una arquitectura de almacenamiento SAN implica la existencia y mantenimiento de al menos dos redes: la red LAN y la red SAN. En la práctica, las redes de almacenamiento SAN suelen basarse en la tecnología FC (“Fibre Channel”), aunque también pueden basarse en “Gigabit Ethernet” (iSCSI).

Cuando se habla de redes conmutadas en “Fibre Channel”, suele utilizarse el término “Switch Fabric”. Se emplean múltiples “switches” y múltiples puertos para ofrecer alta disponibilidad basada en la existencia de un gran número de caminos “Paths”, apoyándose para ello en soluciones y protocolos como MPIO (“Multipath Input Output”) y “SecurePath” (solución propietaria de HP).

Además de la alta disponibilidad relativa a la redundancia de caminos, también se utilizan soluciones de alta disponibilidad del almacenamiento (“Mirroring” o RAID1, RAID5, RAID10, etc).

Los beneficios o ventajas de las redes de almacenamiento SAN, son evidentes: mayor velocidad de acceso a datos, menor tiempo de recuperación ante desastres (los tiempos de “Backup” y “Restore” se minimizan), escalabilidad (siempre es posible añadir más discos, o incluso, más cabinas de discos y “Switches”), y sobre todo, una gestión centralizada, compartida y concurrente del almacenamiento (indiferentemente de la plataforma y sistema operativo de los “Hosts”).

Como inconveniente, las redes de almacenamiento SAN tienen un elevado coste. Una de la principales alternativas es la utilización de soluciones de almacenamiento SAN basadas en iSCSI, que funcionan con tarjetas Ethernet, no haciendo falta HBA (Hot Bus Adapter), que no es más que una tarjeta hardware que se instala en el equipo (normalmente en el puerto SCSI) y que permite conectar mediante “fibre cannel” (canal de fibra) el equipo con un sistema de almacenamiento en fibra (SAN).

Las diferencias entre NAS y SAN son principalmente que un “Host” o Servidor accede a un disco NAS a través de la red, siendo el sistema operativo consciente de que se está accediendo a un recurso remoto. Sin embargo, un “Host” o Servidor accede a un disco SAN como si fuera un disco local, de forma transparente para el sistema operativo, siendo las tarjetas HBA y sus drivers quienes se encargan de que dicho acceso a la SAN sea de esta forma.

 

¿Qué es Fiber Channel (FC)?

Es una tecnología de red Gigabit utilizada principalmente para redes de almacenamiento SAN y para la conexión de cabinas de discos DAS, capaz de funcionar sobre cables de fibra óptica y sobre cables de cobre de par trenzado (“twisted pair copper wire»), aunque la gran mayoría de las veces se suele usar cableado de fibra óptica.

“Fibre Channel Protocol” (FCP) es un protocolo de transporte para la transmisión de comandos SCSI sobre redes “Fibre Channel”. Es el más usado en redes de almacenamiento basadas en conexiones de fibra óptica.

La tecnología “Fibre Channel” (FC) ofrece tres posibles topologías:

  • FC-P2P, Point-to-Point:

Se utiliza en soluciones de almacenamiento DAS, en las cuales, se conecta una cabina de almacenamiento o un robot de cintas directamente a las tarjetas HBA del servidor.

  • FC-AL:

Permite conectar hasta 126 dispositivos en anillo, compartiendo el ancho de banda, de forma análoga a las redes Token Ring. No tiene mucho uso.

  • FC-SW, Switch Fabric:

Aprovecha la utilización de conmutadores o “switches” de “Fibre Channel” (FC) para la conexión de múltiples dispositivos, sin compartir el ancho de banda. Se utiliza habitualmente en arquitecturas de almacenamiento SAN.

Suelen utilizarse múltiples “switches” y múltiples puertos tanto en las cabinas de almacenamiento “Storage” y librería de cintas, como en los equipos cliente (en este caso servidores), de tal modo, que puedan definirse múltiples caminos entre ellos. Esto proporciona un mecanismo de alta disponibilidad, vital en las actuales infraestructuras de almacenamiento SAN corporativas. Los protocolos más usados para la gestión de caminos múltiples al almacenamiento, son MPIO (“Multi Path Input Output”) y “SecurePath” (protocolo propietario de HP).

Comentar que “Fibre Channel” es un Protocolo Multicapa:

  • FC0, la capa física (“physical layer”). Cables, conectores, etc.
  • FC1, la capa de enlace (“data link layer”). Realiza la codificación-decodificación.
  • FC2, la capa de red (“network layer”). Es el corazón de “Fibre Channel”. Define los principales protocolos.
  • FC3, la capa de servicios comunes (“common services layer”). Puede implementar funcionalidades como encriptación y RAID.
  • FC4, la capa de mapeo de protocolos (“protocol mapping layer”). Es la capa, en la que otros protocolos son encapsulados para su entrega a FC2.

 

Componentes de la Arquitectura de Almacenamiento SAN:

  • Dispositivos Cliente:

Los Servidores realizarán un acceso transparente al almacenamiento SAN, como si se tratase de discos locales DAS, siendo esta la principal diferencia entre SAN y NAS (ya comentada). Para poder conectarse a la red de almacenamiento SAN, necesitarán de tarjetas HBA (Host Bus Adapter). Las tarjetas HBA, son dispositivos de conexión “Fibre Channel” (FC), que permitirán la conexión de estos equipos clientes a los “switches” de la red de almacenamiento SAN mediante cables de fibra.

Múltiples puertos “Fibre Channel”, facilitarán disponer de alta disponibilidad a través de un mayor número de caminos, consiguiendo así ser menos vulnerables a la caída de un “Switch de Fibra” o de un puerto de la cabina de almacenamiento, todo ello gracias a la utilización de protocolos como de MPIO (“Multi Path Input Output”) y “SecurePath” (protocolo propietario de HP).

En el caso de iSCSI, existen tarjetas HBA específicas, pero también pueden utilizarse tarjetas de red tradicionales, a poder ser de alto rendimiento (Gigabit Ethernet o más, pues actualmente ya existe tecnología Ethernet de 10Gbps), pudiendo del mismo modo disfrutar de alta disponibilidad.

  • Equipos de Almacenamiento:

Las cabinas de almacenamiento suelen disponer de múltiples puertos para ofrecer alta disponibilidad, como ya hemos comentado. Del mismo modo suelen utilizar tecnologías RAID como RAID1 y RAID5 para ofrecer redundancia en el almacenamiento. Esto conlleva, que la pérdida de un disco, no ocasione pérdida de datos. Actualmente, en las cabinas de almacenamiento se suele configurar un RAID y sobre este crear las LUN (“Logical Unit Number”).

¿Qué es una LUN? Una LUN (“Logical Unit Number”) es una parte de este RAID, el cual, se presentará o asignará a un servidor para su utilización. Es decir, una LUN es un disco lógico, desde el punto de vista de la cabina de almacenamiento (Storage).

El servidor la verá como un disco más, aunque realmente se almacene físicamente repartido entre 45 discos físicos de la cabina de almacenamiento. Una LUN (“Logical Unit Number”) es una dirección que identifica dicha parte del RAID o disco lógico.

El término LUN (“Logical Unit Number”) es originario del protocolo SCSI. De hecho, una red de almacenamiento SAN utiliza el protocolo SCSI, trasportándolo a través de “Fibre Channel” (FC).

  • Dispositivos de interconexión:

Los “switches” “Fiber Channel” (FC), son una de las partes más importantes de una red de almacenamiento SAN, al igual que ocurre en las redes Ethernet. Estos dispositivos son los que permitirán interconectar al resto de equipos de la red de almacenamiento SAN, como los “Hosts” o servidores, las cabinas de almacenamiento y las librerías de cintas. Sobre estos “switches” se realiza la configuración de “Zoning”. Evidentemente, en el caso de redes de almacenamiento SAN basadas en iSCSI, hablaremos de “Switches Ethernet” (utilicen fibra o cobre, como medio de transporte), y en vez de “Zoning” utilizaremos VLAN.

 

¿Qué es el “World Wide Name” (WWN)?

  • “World Wide Name” (WWN):

Un “World Wide Name” (WWN) o “World Wide Identifier” (WWID) es un identificador único dentro de una red de almacenamiento SAN, es decir, es una dirección de 64 bits para identificar elementos en una red “Fibre Channel” (FC), similar a una dirección MAC.

Con este WWN hay que introducir dos conceptos “World Wide Node Name” (WWNN), y “World Wide Port Name” (WWPN).

  • “World Wide Port Name” (WWPN):

Un “World Wide Port Name” (WWPN) es un “World Wide Name” (WWN) asignado a un puerto de fibra en una red de almacenamiento SAN, similar a lo que es una dirección MAC en una red Ethernet.

  • “World Wide Node Name” (WWNN):

Un “World Wide Node Name” (WWNN) es un “World Wide Name” (WWN) asignado a un Nodo o Dispositivo “Fibre Channel” (FC) de una red de almacenamiento SAN.

Como consecuencia de lo anterior, un servidor habitualmente tendrá varios puertos de fibra, cada uno con su WWPN además del propio “World Wide Node Name”. Lo mismo ocurre con el resto de Dispositivos “Fibre Channel” (FC) de la red de almacenamiento SAN, como es el caso de las cabinas de almacenamiento y las librerías de cintas.

 

“Switch Zoning” y “LUN Masking”

  • “Zoning” o “Switch Zoning”:

Los conmutadores o “switches” “Fibre Channel” (FC), permiten segmentar sus puertos en diferentes zonas, de forma similar a como ocurre con las VLAN en los conmutadores o “switches” Ethernet, de tal modo, que cada dispositivo sólo podrá comunicarse con el resto de dispositivos de su zona. Es importante tener en cuenta que cada puerto de fibra puede ser miembro de múltiples zonas.

Existen principalmente dos métodos de “Zoning”, por “Hardware” y por “Software”. Así, en el “Zoning” por “Software” (“Soft Zoning”) se restringe el acceso por nombre, sin embargo, cualquier servidor podrá acceder a cualquier dispositivo por su dirección de red. Por el contrario, el “Zoning” por “Hardware” (“Hard Zoning”) restringe las comunicaciones en los “switches” a través de filtrado de tramas, resultando mucho más seguro que el “Zoning” por “Software”.

Del mismo modo, suelen emplearse con dos tipos de atributos, el Puerto y el “World Wide Name” (WWN). Así, el “Zoning” por Puerto (“Port Zoning”) permite restringir a un puerto de un “switch” con que otros puertos puede comunicarse. Por el contrario, el “Zoning” por Nombre (“Name Zoning”) restringe el acceso entre dispositivos en función del “World Wide Name” (WWN), resultando mucho más flexible aunque más inseguro que el “Zoning” por Puerto (“Port Zoning”).

Habitualmente, las redes de almacenamiento SAN suelen particionarse en múltiples zonas por motivos de seguridad para evitar interferencias que podrían generar problemas en el almacenamiento y así facilitar la gestión.

Todo dispositivo conectado a una red de almacenamiento SAN, debe poder acceder sólo a los puertos y dispositivos que necesita utilizar, para lo cual se configurarán las correspondientes zonas en los “switches” “Fibre Channel” (“Switching Zoning”).

En consecuencia, es posible que múltiples Servidores sean mapeados al mismo puerto de la cabina de almacenamiento, del mismo modo, que es posible que un único servidor sea mapeado a múltiples puertos de las cabina de almacenamiento.

  • “LUN Masking”:

Permite restringir que servidores o “Hosts”, pueden acceder a una determinada LUN (disco virtual) en una cabina de almacenamiento. En consecuencia, podemos ver el “LUN Masking”, como una configuración o proceso de autorización y seguridad dentro de la red de almacenamiento SAN.

Así, si una LUN no es asignada o presentada por la cabina de almacenamiento a un “Host” o Servidor específico, este no podrá acceder a dicha LUN (no tendrá visibilidad). En el caso de servidores en “Cluster”, es necesario que todos los servidores miembros del mismo “Cluster” tengan visibilidad sobre todas las LUN.

“LUN Masking” nos va a permitir que una LUN (o un grupo de LUN’s) en un puerto de la cabina de almacenamiento, sea mapeada a un WWN (o a un grupo de WWN, en el caso de un “Cluster”). “LUN Masking” se implementa de diferentes formas, en función del fabricante.

En la práctica, “Switch Zoning” y “LUN Masking” suelen utilizarse en conjunto. En consecuencia, para que un “Host” o Servidor pueda acceder a una LUN (disco virtual) de una cabina de almacenamiento, ambos deben pertenecer a la misma Zona (“Switch Zoning”), y además la cabina de almacenamiento debe permitir el acceso de dicho “Host” o Servidor a dicha LUN (“LUN Masking”).

 

FCIP, iFCP e iSCSI:

  • FCIP (“Fibre Channel over IP”):

También conocido como “Fibre Channel Tunneling” o “Storage Tunneling”, se trata de una tecnología basada en IP y desarrollada por el IETF (“Internet Engineering Task Force”), que permite la transmisión de tramas “Fibre Channel” (FC) a través de túneles IP, con el objetivo de facilitar la extensión geográfica de las redes de almacenamiento SAN. Para ello se utilizan equipos conversores (“Edge Devices” ó “FCIP Gateways”) situados en la periferia de cada una de las redes SAN que se desean intercomunicar, de tal modo que dichos dispositivos, se limitarán a encapsular y reenviar las tramas FC (“Fibre Channel”) vía TCP/IP.

Gracias a la combinación de redes IP y redes SAN, es posible interconectar múltiples redes de almacenamiento SAN a través de distancias mucho mayores dando lugar a las redes de almacenamiento “SAN-to-SAN”.

  • iFCP (“Internet Fibre Channel Protocol”):

Se trata de una tecnología basada en IP ratificada por el IETF, que permite la transmisión de las capas superiores de tramas “Fibre Channel” (FC) a través de una red IP.

Una característica especial de iFCP, es que mapea direcciones IP a dispositivos “Fibre Channel” (FC) específicos de la red de almacenamiento SAN. Además, TCP es el responsable de gestionar la congestión, detección de errores y recuperación ante fallos.

FCIP (“Fibre Channel over IP”) e iFCP (“Internet Fibre Channel Protocol”) son protocolos muy parecidos, cuyo objetivo es la extensión de las redes de almacenamiento SAN, y cuya principal diferencia radica en el método elegido para cumplir su objetivo:

FCIP utiliza “Tunneling” mientras iFCP utiliza “Routing”.

  • iSCSI (“Internet Small Computer System Interface”):

Se trata de un standard de almacenamiento basado en IP y desarrollado por el IETF (“Internet Engineering Task Force”), que permite el envío de comandos SCSI a través de redes IP. Habitualmente iSCSI utiliza los puertos TCP-860 y TCP-3260.

En consecuencia, iSCSI permite implementar redes de almacenamiento SAN basadas en TCP/IP (sin utilizar “Fibre Channel” FC), de tal modo que se minimizan los costes, ya que es posible reutilizar los dispositivos de red de la LAN, como “switches” y “routers”, funcionando así sobre la infraestructura de red existente.

El protocolo iSCSI permite que los clientes (“initiators”) envíen comandos SCSI a los dispositivos de almacenamiento (“targets”) a través de IP.

Los clientes iSCSI (“iSCSI initiators”) pueden utilizar tarjetas de red Ethernet convencionales. Sin embargo, es conveniente que dichas tarjetas soporten TOE (“TCP Offload Engine”).

¿Qué es TOE (“TCP Offload Engine”)?, TOE es una característica de las tarjetas de red ethernet que libera a la CPU del equipo cliente de la realización de ciertas tareas propias del protocolo TCP/IP.

En iSCSI, en vez de utilizar WWN (como se hace sobre “Fibre Channel” FC), se utilizan direcciones IP y nombres iSCSI (“iSCSI Qualified Name” ó IQN). Los nombres IQN tiene el formato “iqn.yyyy-mm.{reverse domain name}”.

 

La principal diferencia entre iSCSI y “Fibre Channel”, es que con iSCSI se está trabajando directamente con TCP/IP, hecho que facilita la extensión geográfica de la red de almacenamiento SAN, evitando tener que utilizar tecnologías como FCIP e iFCP. Además, con iSCSI se puede aprovechar la electrónica de red ya establecida, evitando así la inversión en una nueva infraestructura de red basada en fibra.

 

 

 

Deja un comentario