Feeds:
Entradas
Comentarios

Archive for febrero 2011

Saludos de nuevo a todos,

aprobado el 70-646 con más holgura que el 70-642 (y tanta!) nos hemos metido a tratar diferentes medios de almacenamiento y tecnologías para éste, como puede ser RAID.

Y ha habido uno de ellos que me ha llamado mucho la atención, RAID 5, mediante el cuál se puede construir un array de discos y, «perdiendo» el de mayor tamaño (si son todos iguales economicamente cuadra mejor), consegimos una recuperación de datos completa en caso de error de un disco. Esto es, 4 discos de 2TB repletos de información, con los cuales dispondríamos de 6TB de almacenamiento, y en uno de ellos tenemos un fallo de Hw. Simplemente reemplazándolo se recompondría la información de él, gracias a la información de paridad repartida en los demás discos. Y, lo mejor de todo, el sistema no deja de funcionar en ningún momento sufiendo simplemente una caida del rendimiento de los discos.

¿Cómo funciona? Realmente es «sencillo». En un array de, por ejemplo, 3 discos, un dato X se dividiría en X1, X2 y Xp. Cada uno de esos «paquetes» se enviaría a un disco diferente. En caso de fallo de uno de los discos se podrían dar 3 escenarios:

  1. X1 + X2 : El disco roto contenía la info de paridad. Tenemos la información.
  2. X1 + Xp : El disco roto contenía el paquete X2. Con X1 + Xp se reconstruye X2
  3. X2 + Xp: El disco roto contenía el paquete X1. Con X2 + Xp se reconstruye X1

La mágia desaparece pero, por un lado tenemos el estress al que sometemos los discos al realizar una gran reconstrucción y, por otro, tenemos los URE (unrecoverable read error).

En el primer punto tenemos que en el ejemplo anterior del array de 4 discos de 2TB, al fallar uno, estamos ante una situación crítica en la que no podemos permitirnos el fallo de otro disco y, en este escenario de «emoción», sometemos a estos discos a un estress enorme: deben recorrerse por completo para realizar la recuperación del disco estropeado, es decir, 6 Gb de lectura. Puede dar un poco de miedo.

En el otro punto, tenemos los UREs, que simplemente son errores aleatorios que pueden producirse en los discos SATA y que, según la estadística, tenemos un 5% de probabilidad de que ocurra en un volumen de datos de 12 Tb. Entonces, si tenemos un RAID 5 de 4 discos de 4 TB y uno de ellos falla, ¡¡Tenemos un 5% de probabilidad de que la recuperación falle!! Esto sería así porque, en caso de producirse un URE durante la recuperación, ésta fallaría, perdiendo casi con total seguridad una gran cantidad de información.

Esto no quiere decir que RAID 5 sea bueno ni malo, sino que tiene limitaciones y que hay que estudiar con detenimiento el escenario en el que se implementa, ya que se solía ver el RAID 5 por los administradores como «La Solución». Hace unos años, estos URE no eran tenidos en cuenta debido a los tamaños de los discos pero en la actualidad empiezan a tener un papel importante.

En un post del blog http://hypecycles.wordpress.com, podemos encontrar, con fecha de 7 de Marzo de 2010, el siguiente comentario:

RAID 5 is broken, just not for all circumstances.Today’s admins need to be aware of the consequences of scenarios that can lead to a failed rebuild. Most admins have never even questioned RAID 5′s viability, making the situation a little worse.

Espero que haya parecido interesante la lectura/tutorial sobre RAID 5, yo personalmente creo que he aprendido de mi mismo conforme iba escribiendo 😉

Hasta la próxima,

Jacob.

Read Full Post »