zfs Online / Offline

zfs Online / Offline Mechanismus

Vor ein paar Tagen habe ich bemerkt, daß eine meiner Pool-Festplatten scheinbar verstärkt Strukturfehler bekommt. Mein Server ist 24×7 eingeschaltet und durch eine kleine USV abgesichert. Ich verwende von Western Digital vier 2 TB Festplatten die wahrscheinlich nur für den Desktop-Betrieb vorgesehen sind. Mit einer optimalen Gehäusekühlung sowie drei 92cm-Lüftern wird für die direkte Belüftung der Festplatten gesorgt und laut meinem Smartmon-Logging werde diese maximal 20-23°C warm. Soweit so schön. Trotzdem zeigt eine der Festplatten auffällige Veränderungen. Unter zfs ist sie ein Bestandteil des gespiegelten Pools. Trotzdem möchte ich nicht so lange warten bis die Festplatte ganz den Geist auf gibt. Nur wie prüft man eine Festplatte im laufenden Betrieb? Stört sich zfs daran, wenn ich mit smartmon Tools diverse Selbsttests starte? Ich habe keine Ahnung! Und in so einem Fall kommt mein Sicherheitsinstinkt zum Vorschein. Die Festplatte sollte kein aktives Element innerhalb der Poolstruktur darstellen.

zfs bietet dafür die Befehle „zpool  [online|offline]“ und diese habe ich nun einfach mal genutzt:

2013-02-14.16:13:17 zpool offline raid1p1 ada5
[root@trinitron ~]# zpool status
  pool: raid1p1
 state: DEGRADED
status: One or more devices has been taken offline by the administrator.
        Sufficient replicas exist for the pool to continue functioning
        in a degraded state.
action: Online the device using 'zpool online' or replace the device
        with 'zpool replace'.
  scan: scrub repaired 0 in 5h46m with 0 errors on Sat Feb 16 08:56:41 2013
config:

        NAME                      STATE     READ WRITE CKSUM
        raid1p1                   DEGRADED     0     0     0
          mirror-0                DEGRADED     0     0     0
            ada6                  ONLINE       0     0     0
            15650343883830496245  OFFLINE      0     0     0  was /dev/ada5
          mirror-1                ONLINE       0     0     0
            ada3                  ONLINE       0     0     0
            ada4                  ONLINE       0     0     0
        logs
          mirror-2                ONLINE       0     0     0
            ada1p1                ONLINE       0     0     0
            ada2p1                ONLINE       0     0     0
        cache
          ada1p2                  ONLINE       0     0     0
          ada2p2                  ONLINE       0     0     0

errors: No known data errors

[...]

2013-02-14.16:17:15 zpool online raid1p1 ada5
[root@trinitron ~]# zpool status
  pool: raid1p1
 state: ONLINE
  scan: resilvered 150K in 0h0m with 0 errors on Sat Feb 16 15:16:39 2013
config:

        NAME        STATE     READ WRITE CKSUM
        raid1p1     ONLINE       0     0     0
          mirror-0  ONLINE       0     0     0
            ada6    ONLINE       0     0     0
            ada5    ONLINE       0     0     0
          mirror-1  ONLINE       0     0     0
            ada3    ONLINE       0     0     0
            ada4    ONLINE       0     0     0
...

Wie man hier schön sehen kann wurde die Festplatte ada5 kurzzeitig im Pool deaktiviert und ich konnte mit gutem Gewissen die Tools auf die Festplatte loslassen. Wenn man übrigens die Option „-t“ verwendet, dann wird der Status nur temporär umgesetzt. Bei einem Neustart des Servers würde sie ganz normal wieder als Online-Device im Pool erscheinen.

Es wurden in der Tat auch READ-Error von der Plattenelektronik gemeldet. Eine neue Festplatte liegt bereits in der Originalverpackung auf dem Schreibtisch. Ich würde gern die Platten im laufenden Betrieb auszutauschen und laut meinem Mainboard sind alle Festplatten auf „Hotswapable“ eingestellt. Mal schauen wie das abläuft.

Fortsetzung folgt.

Letzte Beiträge