Glosario
 
 
Storage

Almacenamiento de datos en un dispositivo o soporte que puede retenerlos durante lapsos prolongados para ser recuperados en el momento en que se necesiten.

 
 
Unidades de Almacenamiento

B (Byte) - Octeto o grupo de 8 bits.
Unidad representativa más pequeña. El byte es la unidad de memoria de la CPU. Cada caracter (letra, número, etc.) necesita de 1 B para ser representado.

KB (KiloByte) - 1024 bytes.
En informática se utiliza, por ejemplo, en el contexto del tamaño de la memoria. 2 KB equivalen a una página tipeada; 10 KB, a una página Web estática; 100 KB, a una foto de baja resolución.

MB (MegaByte) - 1024 KB.
1 MB equivale a un libro pequeño; 2 MB, a una foto de alta resolución; 5 MB, a las obras completas de Shakespeare; 10 MB, rayos X digitales; 100 MB, un metro de libros colocados en estantería; 650 MB, un CD-ROM.

GB (GigaByte) - 1024 MB.
1 GB equivale a una pickup cargada con papel, a una sinfonía con sonido de alta fidelidad, o a una película con calidad TV; 2 GB, a las obras completas de Beethoven; 100 GB, a un piso colmado de publicaciones académicas.

TB (TeraByte) - 1000 GB.
Por ejemplo, toda la información de las ventas detalladas de DISCO acumuladas en 2 años. 1 TB equivale a 50.000 árboles convertidos en papel; 10 TB, a la Biblioteca del Congreso de los EE.UU.

TeraByte Raw 1024 GB de datos «en bruto» (no procesados) por el sistema informático. Datos aún no corregidos, ni clasificados en una secuencia, ni procesados de ninguna otra forma. Disponibles 50% - 90 %, según configuración.

TeraByte visible en RAID 5
Espacio disponible real después de haber armado un RAID 5 con los discos.

 
 
SAN (Storage Area Network)

Red local dedicada de almacenamiento, típicamente construida en torno a la tecnología de fibrocanal, que conecta los dispositivos de storage a un conjunto heterogéneo de servidores, sobre una base múltiple. Una configuración SAN consta además de subsistemas de disco, switches, hubs y puentes.

Es posible añadir servidores y subsistemas de storage con un impacto mínimo en la arquitectura de storage. Dado que las SANs emplean la tecnología de fibrocanal, se maximiza la performance y se elimina la latencia (la tecnología de fibrocanal mueve los datos a muy altas velocidades y anchos de banda, a una distancia de hasta 10 kilómetros).

Con las SANs, los volúmenes de storage se unen a los servidores y es el sistema operativo de estos el que administra la colocación de la información. A diferencia de DAS (Direct-Attached Storage), las SANs permiten remover los dispositivos de storage de los servidores y de la LAN, con lo cual el storage se mantiene en la red a disposición de muchos clientes. Al emplear protocolos en bloque que soportan procesos de base de datos, las SANs son ideales para entornos de storage con tareas DB intensivas.

 
 
NAS (Networked Attached Storage)

Red local de almacenamiento en la que los datos son transferidos usando protocolos como TCP/IP. Una NAS une los servidores a los subsistemas de storage. Con una NAS, los sistemas de archivos, en lugar de los volúmenes de información sin procesar (raw), están disponibles a través de la red. El administrador de archivos (file system) maneja y administra la colocación real de los datos.

Al igual que las SANs, en una NAS el storage está disponible independientemente de la disponibilidad del servidor. NAS no está atada a ninguna plataforma o sistema operativo en particular y libera el procesamiento de las aplicaciones clave que corren en el servidor permitiendo que los clientes accedan al storage en la red.

A diferencia de las SANs, compuestas por una red discreta de servidores y dispositivos de storage, un dispositivo de storage NAS es inteligente y autónomo y, tal como su nombre lo indica, se adosa directamente a la LAN.

Una NAS se centra en la red. Típicamente usada para consolidación del storage en la LAN, una NAS es la solución de capacidad de almacenamiento preferida para permitir que los clientes accedan a los archivos en forma rápida y directa. Esto elimina los cuellos de botella que usualmente encuentran los usuarios cuando acceden a los archivos desde un servidor de usos generales.

Tanto NAS como SANs ofrecen ventajas sobre la infraestructura distribuida tradicional del storage y ayudan a las firmas a consolidar el almacenamiento y a aumentar la flexibilidad en la administración de servidores y discos.

 
 
Diferencias entre SAN y NAS

SANs y NAS se diferencian de varias maneras debido a sus protocolos de acceso. La tecnología de fibrocanal de las SANs proporciona tiempo de respuesta mucho mejor. Los dispositivos de storage residen detrás de los switches de la SAN, que están conectados con los servidores. El switch de la SAN hace que la información sea mucho más accesible y el storage más escalable que con las tecnologías tradicionales de SCSI. En un desarrollo SAN, un volumen cualquiera de storage es accesible pasando sólo por un servidor. Los desarrollos SAN de alta disponibilidad requieren dos HBAs en cada servidor y el software correspondiente para fallas y redundancia.

Los volúmenes almacenados en la SAN se asocian a los servidores usando el protocolo SCSI. Este protocolo SCSI hace que el espacio almacenado aparezca como si estuviera directamente unido al servidor. Esto implica que la entrada / salida de datos es manejada por el sistema operativo del servidor a nivel de bloques. El espacio almacenado de la SAN podrá hacer funcionalmente todas las operaciones que el sistema operativo le permita como si estuviera utilizando un disco tradicional.

Por otro lado, NAS tiene estructura cliente-servidor, por lo que sus comandos de I/O se hacen a través de una conexión estándar de IP. El administrador de archivos (file system) maneja la colocación de la información. Como resultado, NAS permite compartir archivos entre distintos usuarios y sistemas operativos a través de los protocolos: Network File System (NFS - para Unix) y Common Interface File System (CIFS - para NT).

Múltiples servidores pueden ver el sistema de archivos en forma simultánea. De todas maneras, estar conectado directamente a la LAN tradicional genera algunas preocupaciones respecto al throughput. Generalmente, NAS se utiliza para aplicaciones que tienen tareas de lectura intensivas. En estos casos, muchos clientes pueden acceder en forma simultanea a los mismos volúmenes dando menor latencia y mejor performance

Las NAS solo requieren como hardware de interconexión la placa tradicional de conexión a la red Network Interface Cards (NICs).

 
  SAN SAN
Protocolo Bloque Archivo (NFS, CIFS)
Latencia Baja Standard IP
Seguridad Alta - no se comparte Se comparte con controles
Aplicaciones La información no se comparte Compartida
Hardware en el servidor HBAs NICs
 
 
IDC (Internet Data Center)

Grandes centros de datos que proveen una cartera de soluciones de Internet y de transmisión de información, voz y video, tanto a medianas y grandes empresas como a proveedores de telecomunicaciones e integradores de sistemas con conectividad de gran velocidad necesaria para acceder a Internet y tener servicios con alta redundancia.

Estos centros de datos cuentan con múltiples sistemas de alimentación con respaldo de UPS y baterías de reserva, generadores de energía, tanques de combustible de emergencia, seguridad con acceso restringido 24 x 7, sistema de detección y extinción de incendios, áreas de racks abiertas y cerradas y una telco-room "state-of-the-art" con conectividad de radio y F.O. y gateways con múltiples Carriers.

 
 
SLA (Services level Agreement)

Servicio que compromete prestar el proveedor en términos de calidad, cantidad y tiempos de respuesta. Por regla general, un SLA es un contrato firmado entre un ASP (Application Service Provider) y un usuario final, en el que se estipula el nivel de servicio requerido que se compromete a cumplir el proveedor.

Un SLA deberá contener nivel de servicio especificado, opciones de soporte, previsiones para penalidades por incumplimiento de servicios no provistos, nivel garantizado de performance del sistema, nivel especificado de soporte al usuario, tipo de hardware y software que se proveerá y a qué precio.

El servicio que garantiza Gemelo Storage está en cumplimiento con el del IDC o centro de datos corporativos. Gemelo Storage siempre provee SLAs con un nivel de servicio del 99.95% o superior.

 
 
SSP (Storage Service Provider)

Un SSP provee storage en calidad de servicio de utilidad a empresas establecidas y compañías de Internet que desean eliminar la infraestructura de almacenamiento de su administración diaria y sus gastos de capital.

En la mayoría de los casos, el SSP es responsable del diseño, la instalación y la administración diaria del entorno de storage del cliente. A su vez, el cliente obtiene los beneficios operacionales asociados con tener sus funciones críticas de storage prestadas bajo un modelo de hosting sobre una plataforma "state-of-the-art" administrada por un equipo de especialistas dedicados.

Asimismo, un SSP ofrece backups periódicos, archivado y capacidad para consolidar datos provenientes de múltiples lugares en una compañía de modo tal que la información se comparta de manera efectiva.

 
 
TCO (Total cost of Ownership)

Costo total de propiedad de un proyecto; vale decir, lo que costaría hacerlo en forma interna vs. lo que costaría contratando a un tercero (tercerización). Estos estudios son generalmente muy específicos a cada proyecto e incluyen costos variados, en ocasiones considerados ocultos o indirectos.

El TCO incluye: costo original de computadoras y software, upgrade de hardware y software, mantenimiento, soporte técnico y capacitación.

 
 
S-POP (Storage point of Presence)

Puntos de presencia de storage. En el caso de Gemelo Storage, instalaciones de su infraestructura y sus servicios en un centro de datos (propio o de un tercero). Desde octubre de 2001, Gemelo Storage Solutions tiene presencia en Sao Paulo (Brasil), Buenos Aires (Argentina), Santiago (Chile) y Ciudad de México (México), con S-POPs redundantes y de altísima disponibilidad.

La configuración de cada S-POP es relativamente estándar e incluye hardware, software y elementos de red tales como subsistema de discos, librería de cintas, switches, hubs, servidores y routers.

 
 
DLT (o cintas)

Familia de dispositivos y tecnología de medios de respaldo magnéticos, ampliamente utilizados por la industria. Actualmente constituye la forma más usada de efectuar respaldos en medios magnéticos.

Las DLTs tienen 1/2" de ancho y los cartridges se ofrecen en varias medidas que van de 20 a más de 40 GB. Las unidades DLT son más rápidas que otros tipos de unidades de cinta, logrando velocidades de transferencia de 2,5 Mbps.

 
 
HBA (Host Bus Adapter)

Adaptador que se instala dentro de los servidores para conectar el bus interno de la máquina a la red de fibrocanal implementada por una SAN y, de este modo, poder acceder a los recursos de storage y respaldo que se comparten en la red de almacenamiento.

Un HBA administra la transferencia de información entre canales. A fin de reducir al mínimo el impacto en la performance del procesador host, el HBA ejecuta automáticamente muchas de las funciones de interfase de bajo nivel o bien involucrando al mínimo al procesador.

 
 
SCSI

Interfaz estándar paralela usada por PCs, sistemas Macintosh y muchos sistemas UNIX para conectar dispositivos periféricos a computadoras. Las interfaces SCSI proveen mayores velocidades de transmisión de datos (hasta 80 megabytes por segundo) que los puertos serie y paralelo estándar. Debido a que es posible conectar varios dispositivos a un solo puerto SCSI, en realidad SCSI es más un bus de entrada / salida que una simple interface.

Aunque SCSI es un estándar ANSI, existen diferentes variantes, lo cual significa que dos interfaces SCSI podrían ser incompatibles. A modo de ejemplo, SCSI soporta varios tipos de conectores. Las variantes implementadas en la actualidad son SCSI-1, SCSI-2, Wide SCSI, Fast SCSI, Fast Wide SCSI, Ultra SCSI, SCSI-3, Ultra2 SCSI y Wide Ultra2 SCSI (esta última utiliza un bus de 16 bits y soporta velocidades de datos de 80 MBps).

 
 
Throughput

Velocidad de transferencia de datos de un lugar a otro o procesados en una unidad de tiempo especificada. Cantidad de datos que se transmiten por segundo, considerando compresión, corrección de errores y tiempo para la conexión.

Las velocidades de transferencia de datos para unidades de disco y redes se miden en términos de throughput, típicamente en kbps, Mbps y Gbps.

Número de instrucciones ejecutadas por segundo o toda otra medida de velocidad de ejecución de un procesador principal o de entrada / salida.

 
 
Time to Market

Tiempo que se tarda en transformar una idea en un producto final listo para ser ofrecido en el mercado.

 
 
RAW

Read After Writing. Datos no procesados o "en bruto". El término RAW se refiere a datos que pasan por un dispositivo de entrada / salida sin ser interpretados. Por el contrario, el término cooked se refiere a datos que son procesados antes de pasar al dispositivo de E/S.

Este vocablo proviene de UNIX, que soporta modos cooked y raw para salida de datos a una terminal. En modo cooked, caracteres especiales, como por ejemplo erase y kill, son procesados por el driver de dispositivos antes de ser enviados al dispositivo de salida.