Discos duros y S.M.A.R.T.
Tenemos un comando en Linux que se llama “smartctl” el cual nos da información vital sobre el disco duro consultado. Datos tales como
temperatura, horas en funcionamiento, promedio de fallo, etc…
equipo ~# smartctl -a -d ata /dev/sda
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 253 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 67
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 247181777
9 Power_On_Hours 0x0032 076 076 000 Old_age Always - 21179
... ... ...
Tenemos 4 columnas: VALUE, WORST, THRESH y RAW_VALUE
VALUE es el valor actual que nos da el indicador que debe de ser
superior a THRESH. En caso contrario vamos mal, ya que quiere decir que
hay algo que está fallando (Old_age fallo típico de disco duro, Pre_fail
fallo crítico en 24 horas).
WORST es el valor más bajo que nos ha dado este indicador, se cumple
lo mismo que con el anterior, si es más bajo que THRESH, malo.
Y ahora viene el rollo del normalizado.
RAW_VALUE es el valor sin normalizar del indicador, la forma más
fácil de explicarlo es con el valor de Power_On_Hours, horas que lleva
el disco encendido.
Por ejemplo, el disco viene de fábrica con una vida útil de 100.000
horas, puede durar más o menos, pero en estudios que hemos hecho hemos
observado unos porcentajes.
Hasta 30.000 horas falla el 1%
Hasta 50.000 horas falla el 5%
Hasta 70.000 horas falla el 15%
Hasta 95.000 horas falla el 30%
Hasta 100.000 horas falla el 55%
Hasta 120.000 horas falla el 80%
Hasta 130.000 horas falla el 100%
El RAW_VALUE puede contener cualquier cosa (horas, segundos, lunas,
periodos de 18.3 segundos…) aquí cada fabricante guarda lo que el estima
oportuno, pero este RAW_VALUE me lo tiene que traducir a un valor
normalizado. Siguiendo el ejemplo anterior el número de horas lo puede
traducir a los valores 100,99,98,97,96,95,94 con un THRESH situado en el
96. ¿por qúe de 100 a 94? porque el fabricante lo decide así, podría
haber sido de 60 a 54 o de 100 a 0 con intervalos más grandes,
logicamente el THRESH se mueve en la misma escala.
¿Y el RAW_VALUE?
Como he dicho el valor del RAW lo decide cada fabricante, que marque 60
en temperatura no indica obligatoriamente que el disco esté a 60 grados,
pueden haber comenzado la escala a -10 grados, emplear grados farenheit
o cualquier otra medida. Lo importante es que el valor normalizado (43
en tu caso, sean los grados que sean) es inferior al THRESH establecido
para ese disco (45)
Hay algunos fabricantes que si que ofrecen la interpretación exacta
del RAW_VALUE pero pocas veces necesitamos conocer tanto detalle .
Comentarios