RAID

Aus MindLoot
Wechseln zu: Navigation, Suche

Ein RAID-System (ursprünglich redundant array of inexpensive disks, heute redundant array of independent disks) dient zur Organisation mehrerer physikalischer Festplatten eines Computers zu einem logischen Laufwerk, das eine größere Speicherkapazität, eine höhere Datensicherheit bei Ausfall einzelner Festplatten und/oder einen größeren Datendurchsatz erlaubt als eine physikalische Platte. Während die meisten in Computern verwendeten Techniken und Anwendungen darauf abzielen, Redundanzen (das Vorkommen doppelter Daten) zu vermeiden, werden bei RAID-Systemen redundante Informationen gezielt erzeugt, damit beim Ausfall einzelner Komponenten das RAID als Ganzes seine Funktionalität behält.

Der Begriff wurde von Patterson, Gibson und Katz an der University of California, Berkeley in ihrer Arbeit "A Case for Redundant Array of Inexpensive Disks (RAID)" zum ersten Mal verwendet (frei übersetzt: Redundanter Verbund kostengünstiger Festplatten). Darin wurde die Möglichkeit untersucht, kostengünstige Festplatten im Verbund als logisches Laufwerk zu betreiben, um die Kosten für eine große (zum damaligen Zeitpunkt teure) Festplatte einzusparen. Dem gestiegenen Ausfallrisiko im Verbund sollte durch die Speicherung redundanter Daten begegnet werden, die einzelnen Anordnungen wurden als RAID-Level diskutiert.

Die weitere Entwicklung des RAID-Konzepts führte zunehmend zum Einsatz in Serveranwendungen, die den erhöhten Datendurchsatz und die Ausfallsicherheit nutzen, der Aspekt der Kostenersparnis wurde dabei aufgegeben. Die Möglichkeit, in einem solchen System einzelne Festplatten im laufenden Betrieb zu wechseln, entspricht der heute gebräuchlichen Übersetzung: Redundant Array of Independent Disks (Redundante Anordnung unabhängiger Festplatten).

Der Betrieb eines RAID-Systems setzt mindestens zwei Festplatten voraus. Die Festplatten werden gemeinsam betrieben und bilden einen Verbund, der unter mindestens einem Aspekt betrachtet leistungsfähiger ist als die einzelnen Festplatten. Mit RAID-Systemen kann man folgende Vorteile erreichen:

  • Erhöhung der Ausfallsicherheit (Redundanz)
  • Steigerung der Transferraten (Performance)
  • Aufbau großer logischer Laufwerke
  • Austausch von Festplatten und Erhöhung der Speicherkapazität während des Systembetriebes
  • Kostenreduktion durch Einsatz mehrerer preiswerter Festplatten
  • hohe Steigerung der Systemleistungsfähigkeit

Die genaue Art des Zusammenwirkens der Festplatten wird durch den RAID-Level spezifiziert. Die gebräuchlichsten RAID-Level sind RAID 0, RAID 1 und RAID 5. Sie werden unten beschrieben.

Aus Sicht des Benutzers oder eines Anwendungsprogramms unterscheidet sich ein logisches RAID-Laufwerk nicht von einer einzelnen Festplatte.

Aufbau und Anschluss - Hardware-RAID, Software-RAID

Hardware-RAID

Von Hardware-RAID spricht man, wenn das Zusammenwirken der Festplatten von einem speziell dafür entwickelten Hardware-Baustein, dem RAID-Controller, organisiert wird. Der Hardware-RAID-Controller befindet sich in physischer Nähe der Festplatten. Er kann im Gehäuse des Computers enthalten sein. Häufiger befindet er sich aber in einem eigenen Gehäuse, einem Disk Array, in dem auch die Festplatten untergebracht sind.

Vermehrt werden in den letzten Jahren auch Festplatten-Controller unter der Bezeichnung RAID-Controller auf Hauptplatinen (engl. mainboards) für den Heimcomputer- bzw. Personal Computer-Bereich verbaut sowie als Kartenerweiterung im Niedrigpreis-Sektor angeboten. Üblicherweise sind diese häufig auf RAID 0 und RAID 1 beschränkt. Um die Karten im nichtprofessionellen Bereich so erschwinglich wie möglich zu machen, überlässt man hier jedoch oft die RAID-Logik der CPU. Ein weiterer Nachteil ist bei diesen auch, dass man an den Controller gebunden ist und bei einer Fehlfunktion desselben die Gefahr eines Datenverlustes besteht. Solche Controller werden im Linux-Jargon daher oft auch als Fake-RAID bezeichnet (vgl. auch die sog. 'Win- oder Softmodems).

Software-RAID

Von Software-RAID spricht man, wenn das Zusammenwirken der Festplatten komplett softwareseitig organisiert wird. Auch der Begriff Host based RAID ist geläufig, da nicht das Speicher-Subsystem, sondern der eigentliche Computer die RAID-Verwaltung durchführt. Die meisten modernen Betriebssysteme, wie FreeBSD, Apple Mac OS X, HP HP-UX, IBM AIX, Linux, Microsoft Windows ab Windows NT oder SUN Solaris, sind dazu in der Lage. Die einzelnen Festplatten sind in diesem Fall entweder über einfache Festplattencontroller am Computer angeschlossen oder es werden externe Storage Geräte wie Disk Arrays von Firmen wie EMC, Promise, AXUS, Proware oder HDS an den Computer angeschlossen. Die Festplatten werden dann als sogenannte JBODs ("just a bunch of disks") ins System integriert.

Der Vorteil von Software-RAID ist, dass kein spezieller RAID-Controller benötigt wird. Die vom Betriebssystem mitgelieferte RAID-Software oder eine separat installierte Software wird dann genutzt. Der Festplatten-Cache bleibt aktiviert. Ein Nachteil ist die Abhängigkeit von einem bestimmten Betriebssystem bzw. einer bestimmten Plattform. Besonders bei der Disaster Recovery kommt dieses zum Tragen. Der Hauptprozessor (CPU) des Computers wird bei Festplattenzugriffen belastet, dies bringt Vor- und Nachteile mit sich. Storage Server sind in der Regel nie voll ausgelastet und somit sind Software-RAIDs auf diesen Servern schneller als Hardware-RAIDs. Leider entfällt aber die Möglichkeit, einen im RAID-Controller oder Disk Array vorhandenen Cache mit einem Battery Backup Module auszustatten. Dies hat zur Folge, dass Daten, die bei einem ungeplanten Neustart im Cache liegen, verloren gehen.

Das Programm, welches die Verwaltung der Festplatten übernimmt, wird gemeinhin als Volume Management Software oder Logical Volume Manager bezeichnet, wobei sich die Terminologie und Aufteilung der Funktionen von System zu System stark unterscheiden.

Geschichte

1987 veröffentlichten D. A. Patterson, G. Gibson und R. H. Katz von der University of California, Berkeley, USA einen Vorschlag, um die langsamen Plattenzugriffe zu beschleunigen und die MTBF (Mean time between failures) zu erhöhen. Dazu sollten die Daten auf vielen kleineren (billigeren) Platten anstatt auf wenigen großen (teuren) abgelegt werden. Deshalb hieß die frühere Schreibweise auch "Arrays of Inexpensive Disks" (heute Independent), im Gegensatz zu den damaligen SLEDs (Single Large Expensive Disk). Die Varianten RAID 0 und RAID 6 wurden erst später von der Industrie geprägt. Seit 1992 erfolgt eine Standardisierung durch das RAB (RAID Advisory Board), bestehend aus etwa 50 Herstellern.

Die gebräuchlichen RAID-Level im Einzelnen

RAID 0: Striping - Beschleunigung ohne Redundanz

RAID Level 0

Streng genommen handelt es sich bei RAID 0 nicht um ein wirkliches RAID, da es keine Redundanz gibt.

RAID 0 bietet gesteigerte Transferraten, indem die beteiligten Festplatten in zusammenhängende Blöcke gleicher Größe aufgeteilt werden, wobei quasi im Reißverschlussverfahren diese Blöcke zu einer großen Festplatte angeordnet werden, so dass somit Zugriffe auf allen parallel durchgeführt werden können (engl. striping, was "in Streifen zerlegen" bedeutet, abgeleitet von stripe, der "Streifen"). Die Datendurchsatz-Steigerung (bei sequentiellen Zugriffen, aber besonders auch bei hinreichend hoher Nebenläufigkeit) beruht darauf, dass die notwendigen Festplatten-Zugriffe in höherem Maße parallel abgewickelt werden können. Die Größe der Datenblöcke wird als Striping-Granularität (auch "chunk size" oder "interlace size") bezeichnet.

Fällt jedoch eine der Festplatten durch einen Defekt (vollständig) aus, kann der RAID-Controller ohne deren Teildaten die Nutzdaten nicht mehr vollständig rekonstruieren. Eine teilweise Restauration ist unter Umständen jedoch möglich, nämlich genau für die Dateien, die nur auf den verbliebenen Festplatten gespeichert sind, was typischerweise nur bei kleinen Dateien und eher bei großer Striping-Granularität der Fall sein wird. (Im Vergleich dazu würde die Benutzung von je einem getrennten Dateisystem pro Festplatte bei einem Ausfall eines einzelnen Speichermediums die nahtlose Benutzbarkeit der verbliebenen Medien bzw. der dortigen Dateisysteme garantieren, während der vollständige Ausfall eines einzelnen und entsprechend größeren Speichermediums einen vollständigen Verlust aller Daten zur Folge hätte.) RAID 0 ist daher nur in Anwendungen zu empfehlen, bei denen Datensicherheit kaum von Bedeutung ist oder durch eine geeignete Form von Datensicherung anderweitig gewährleistet wird oder ganz besonders bei denen überwiegend lesende Zugriffe auftreten (während ändernde Zugriffe durch entsprechende Verfahren redundant auch auf einem anderen Medium ausgeführt werden). Die bei einfachem RAID 0 unvermeidbare Betriebsunterbrechung in Folge von Festplatten-Ausfall (auch einzelner Platten) sollte bei der Planung berücksichtigt werden.

Der Einsatzzweck dieses Verbundsystems erstreckt sich demnach auf Anwendungen, bei denen in kurzer Zeit besonders große Datenmengen vor allem gelesen werden sollen, z. B. auf die Musik- oder Videowiedergabe und die sporadische Aufnahme derselben.

RAID 1: Mirroring - Spiegelung

RAID Level 1

Ein RAID-1-Array muss aus mindestens zwei Festplatten bestehen, die exakt die gleichen Daten enthalten (engl. mirroring oder duplexing, s. u.). RAID 1 bietet die volle Redundanz der gespeicherten Daten, während die Kapazität des Arrays höchstens so groß ist wie die kleinste beteiligte Festplatte.

Fällt eine der gespiegelten Platten aus, können die anderen weiterhin die Daten liefern. Besonders für Echtzeitanwendungen ist das unverzichtbar. Allerdings leidet beim Ausfall einer Platte die Geschwindigkeit. RAID 1 bietet eine hohe Ausfallsicherheit. Zum Totalverlust der Daten führt erst der Ausfall aller Platten.

Aus historischen Gründen wird zwischen Mirroring (alle Festplatten an demselben Controller) und Duplexing unterschieden, was heute jedoch nur bei Betrachtungen über den Single Point of Failure eine Rolle spielt, wobei der Festplatten-Controller jedoch seltenst die Fehlerursache sein wird, und wobei ein schadhafter Controller den Weiterbetrieb des betroffenen Rechners nur in seltenen Fällen zulassen wird.

Zur Erhöhung der Sicherheit kann ein RAID-1-System beim Lesen immer auf mehr als eine Festplatte zugreifen (wenn die Antworten vorliegen, werden die beiden Datenströme verglichen, und bei Unstimmigkeiten wird eine Fehlermeldung ausgegeben, da die Spiegelung nicht länger besteht).

Eine Spiegelplatte ist kein Ersatz für eine Datensicherung, da auch versehentliche oder sonstwie fehlerhafte Schreiboperationen sich augenblicklich auf die Spiegelplatte übertragen. Dies gilt insbesondere für unvollständig abgewickelte, schreibende Programme (etwa: durch Stromausfall abgebrochene Update-Transaktionen auf Datenbanken), wobei es hier nicht nur zu der Beschädigung der Spiegelung sondern auch zu einem inkonsistenten Datenzustand trotz intakter Spiegelung kommen kann. Abhilfe schaffen hier Backups und Transaktions-Logs.

RAID 5: Performance + Parität

RAID Level 5

RAID 5 bietet sowohl gesteigerten Datendurchsatz beim Lesen von Daten als auch Redundanz bei relativ geringen Kosten und ist dadurch die beliebteste RAID-Variante. In schreibintensiven Umgebungen mit kleinen, nicht zusammenhängenden Änderungen ist RAID 5 nicht zu empfehlen, da bei zufälligen Schreibzugriffen der Durchsatz aufgrund des zweiphasigen Schreibverfahrens deutlich abnimmt (an dieser Stelle wäre eine RAID 0+1-Konfiguration zu empfehlen). Allerdings ist RAID 5 die kostengünstigere Möglichkeit, Daten auf mindestens drei Festplatten (im Falle von zwei Festplatten ist RAID5 wie RAID1) redundant zu speichern.

Die nutzbare Gesamtkapazität errechnet sich aus der Formel s × (n - 1) (s = kleinste Platte im Array, n = Anzahl der Platten), da das gesamte Volumen der Paritätsdaten (Redundanz) s beträgt, wobei die einzelnen Festplatten in aneinander grenzende Blöcke gleicher Größe aufgeteilt werden, und wobei Gruppen von korrespondierenden n Blöcken, die von paar-weise verschiedenen Festplatten stammen, und die dort jeweils an derselben Position gespeichert werden, gebildet werden. Rechen-Beispiel: 4 Festplatten à 500 GB: 1500 GB Nutzdaten; 500 GB Redundanz

Die Nutzdaten werden wie bei RAID 0 auf alle Festplatten verteilt. Die Paritätsinformationen werden jedoch nicht wie bei RAID 4 auf einer Platte konzentriert, sondern ebenfalls verteilt. Die Berechnung der Parität erfolgt durch die XOR-Verknüpfung, die wiederum zu leichter bis erheblicher Verminderung der Datentransferrate im Vergleich zu RAID 0 führt. Da die Paritätsinformationen beim Lesen nicht benötigt werden, stehen alle Platten zum parallelen Zugriff zur Verfügung. Dieser (theoretische) Vorteil greift allerdings nicht bei kleinen Dateien ohne nebenläufigen Zugriff, erst bei größeren Dateien oder geeigneter Nebenläufigkeit tritt eine nennenswerte Beschleunigung ein. Der Schreibzugriff erfordert entweder ein Volumen, das genau (n-1) korrespondiere Datenblöcke ausfüllt, oder ein zwei-phasiges Verfahren (alte Daten lesen; neue Daten schreiben).

Bei RAID 5 ist die Datensicherheit des Arrays beim Ausfall von maximal einer Platte gewährleistet. Allerdings lässt nach Ausfall einer Festplatte oder während des Rebuilds auf die Hotspare-Platte (bzw. nach Austausch der defekten Festplatte) die Performance deutlich nach (beim Lesen: jeder (n-1)-te Datenblock muss rekonstruiert werden; beim Schreiben: jeder (n-1)-te Datenblock kann nur durch Lesen der entsprechenden Bereiche aller korrespondierenden Datenblöcke und anschließendes Schreiben der Parität geschrieben werden; hinzukommen die Zugriffe des Rebuilds: (n-1)× Lesen; 1× Schreiben). Bei dem Rebuild-Verfahren ist daher die Berechnung der Parität zeitlich zu vernachlässigen; im Vergleich zu RAID1 dauert somit das Verfahren unwesentlich länger und benötigt gemessen am Nutzdaten-Volumen nur den (n-1)-ten Teil der Schreib-Zugriffe.

Eine noch junge Methode zur Verbesserung der Rebuild-Performance und damit der Ausfallsicherheit ist präemptives RAID 5. Hierbei werden interne Fehlerkorrekturstatistiken der Platten zur Vorhersage eines Ausfalls herangezogen (S.M.A.R.T.). Vorsorglich wird nun die Hot-Spare-Platte mit dem kompletten Inhalt der ausfallverdächtigsten Platte im RAID-Verbund synchronisiert, um zum vorhergesagten Versagenszeitpunkt sofort an deren Stelle treten zu können. Das Verfahren erreicht bei geringerem Platzbedarf eine ähnliche Ausfallsicherheit wie RAID 6 und andere Dual-Parity-Implementierungen. Allerdings wurde präemptives RAID 5 aufgrund des hohen Aufwands bislang nur in wenigen "High-End"-Speichersystemen mit Server-basierten Controllern implementiert.

Weniger gebräuchliche oder bedeutungslos gewordene RAID-Level

NRAID/Linear Mode/concat(enation): Festplattenverbund

Bei NRAID (auch als linear mode oder concat(enation) bekannt) werden - wie bei RAID 0 - mehrere Festplatten zusammengeschlossen. Im Gegensatz zu RAID 0 bietet NRAID aber keinen Gewinn beim Datendurchsatz. Dafür kann man Festplatten unterschiedlicher Größe ohne Speicherverlust miteinander kombinieren (Beispiel: eine 10-GB-Festplatte und eine 30-GB-Festplatte ergeben in einem NRAID eine virtuelle 40-GB-Festplatte, während in einem RAID 0 nur 20 GB (2 x 10 GB) angesprochen werden könnten). Der Ausfall einer Platte führt zu Datenverlust, jedoch wäre es möglich einen Teil der Daten wieder zu restaurieren, solange sie komplett auf der funktionierenden Platte liegen. NRAID ist weder einer der nummerierten RAID-Levels, noch bietet es Redundanz. Man kann es aber durchaus als entfernten Verwandten von RAID 0 betrachten. NRAID macht aus mehreren Festplatten eine einzige, deren Datenkapazität der Summe der Kapazitäten aller verwendeten Platten entspricht. Heutzutage sind Controller, die mit der Eigenschaft NRAID verkauft werden, in der Lage, dies zu tun.

RAID 2

RAID 2 spielt in der Praxis keine Rolle mehr. Das Verfahren wurde nur bei Großrechnern verwendet. Die Daten werden hierbei in Bitfolgen fester Größe zerlegt und mittels eines Hamming-Codes auf größere Bitfolgen abgebildet (zum Beispiel: 4 Bit für Daten und noch 3 Bit für die ECC-Eigenschaft). Die einzelnen Bits des Hamming-Codeworts werden dann über einzelne Platten aufgeteilt, was prinzipiell einen hohen Durchsatz erlaubt. Ein Nachteil ist jedoch, dass die Anzahl der Platten ein ganzzahliges Vielfaches der Hamming-Codewortlänge sein muss, wenn sich die Eigenschaften des Hamming-Codes nach außen zeigen sollen (diese Forderung entsteht, wenn man einen Bit-Fehler im Hamming-Code analog zu einem Festplatten-Ausfall im RAID 2 sieht).

Der kleinste RAID-2-Verbund benötigt drei Festplatten und entspricht einem RAID 1 mit zweifacher Spiegelung. Im realen Einsatz sah man daher zumeist nicht weniger als zehn Festplatten in einem RAID-2-Verbund.

RAID 3: Striping mit Paritätsinformationen auf separater Festplatte

RAID Level 3

RAID 3 ist der Vorläufer von RAID 5. Im RAID 3 wird die Redundanz auf einer zusätzlichen Festplatte gespeichert. Als Redundanz bezeichnet man hier die bitweise Addition der einzelnen Bits der anderen Festplatten. Die bitweise Addition berechnet Summen von Einzelbits, die den Wert 0 und 1 enthalten können, und befolgt die Rechenregeln des mathematischen Zahlkörpers, welcher nur die Elemente 0 und 1 enthält und bei dem die folgenden Rechenregeln gelten: 1+1=0, 0+1=1, 1+0=1, 0+0=0, und Subtraktion = Addition. In der Mikroelektronik ist dies identisch mit der XOR-Verknüpfung.

Der Gewinn durch ein RAID 3 ist folgender: Angenommen, der RAID-3-Verbund besteht aus n datentragenden Festplatten und einer dedizierten Parity-Disk mit Nummer n+1. Bei einem Ausfall einer der ersten n Festplatten (mit der Nummer i) werden, nach Austausch dieser Festplatte, alle Daten auf die neue (i-te) Festplatte zurück synchronisiert, ausgehend von den Parity-Informationen der n+1-ten Festplatte und den übrigen, unversehrten n-1 Daten-Festplatten. Der Ausfall der Parity-Disk selbst wird, nach Ersetzen der Festplatte, repariert durch einfache Neuberechnung der Parity-Bits.

RAID 3 ist inzwischen vom Markt verschwunden und wurde weitgehend durch RAID 5 ersetzt, bei dem die Parität gleichmäßig über alle Platten verteilt wird. Die dedizierte Paritätenfestplatte stellte einen Flaschenhals dar (performance bottleneck). Vor dem Übergang zu RAID 5 wurde RAID 3 zudem partiell durch RAID 4 verbessert, bei dem Ein-/Ausgabe-Operationen mit größeren Blockgrößen aus Geschwindigkeitsgründen standardisiert wurden.

Zusätzlich sei hier bemerkt, dass ein RAID-3-Verbund aus lediglich zwei Festplatten per Definition identisch ist mit einem RAID 1 aus zwei Festplatten.

RAID 4

Diagramm eines speziellen RAID 4 mit gesonderter Paritäts-Platte, wobei jede Farbe eine Paritäts-Gruppe (stripe) darstellt

Es werden ebenfalls Paritätsinformationen berechnet, die auf eine dedizierte Festplatte geschrieben werden. Allerdings sind die Einheiten, die geschrieben werden, größere Datenblöcke (engl. chunks) und nicht einzelne Bytes, was die Gemeinsamkeit zu RAID 5 ausmacht.

Ein Nachteil bei klassischem RAID 4 besteht darin, dass die Parity-Platte bei allen Schreib- und Leseoperationen beteiligt ist. Dadurch ist die maximal mögliche Datenübertragungs-Geschwindigkeit durch die Datenübertragungs-Geschwindigkeit der Parity-Disk begrenzt. Da bei jeder Operation immer eine der Daten-Disks und die Parity-Disk verwendet werden, fällt die Parity-Disk häufiger aus.

Wegen der fest definierten Paritätsplatte wird statt RAID 4 fast immer RAID 5 bevorzugt.

Eine Ausnahme bildet ein Systemdesign, bei dem die Lese- und Schreiboperationen auf ein NVRAM erfolgen. Das NVRAM bildet einen Puffer, der die Übertragungsgeschwindigkeit kurzfristig erhöht, die Lese- und Schreiboperationen sammelt und in sequenziellen Abschnitten auf das RAID-4-Plattensystem schreibt. Dadurch werden die Nachteile von RAID 4 vermindert, und die Vorteile bleiben erhalten.

Network Appliance nutzt RAID 4 in ihren NAS-Systemen, das verwendete Dateisystem WAFL wurde speziell für den Einsatz mit RAID 4 entworfen. Da RAID 4 nur bei sequentiellen Schreibzugriffen effektiv arbeitet, verwandelt WAFL wahlfreie Schreibzugriffe (random writes) im NVRAM-Cache in sequentielle - und merkt sich jede einzelne Position für den späteren Abruf. Beim Lesen tritt allerdings das klassische Fragmentierungsproblem auf: Zusammengehörige Daten stehen nicht notwendigerweise auf physisch hintereinanderliegenden Blöcken, wenn sie im nachhinein aktualisiert bzw. überschrieben wurden. Die verbreitetste Beschleunigung von Lesezugriffen, der cache prefetch, ist daher ohne Wirkung. Die Vorteile beim Schreiben ergeben somit einen Nachteil beim Lesen. Das Dateisystem muss dann regelmäßig defragmentiert werden.

RAID 6: Redundanz über zwei zusätzliche Festplatten

RAID Level 6

RAID 6 funktioniert ähnlich wie RAID 5, verkraftet aber den Ausfall von bis zu zwei Festplatten. Hier werden nicht ein, sondern zwei Fehlerkorrekturwerte berechnet und so über die Platten verteilt, dass Daten und Paritäten blockweise auf unterschiedlichen Platten liegen. Das bedeutet eine Anzahl von n+2 Festplatten brutto für einen Dateninhalt von n Festplatten netto, was allerdings schon bei wenigen Netto-Festplatten eine Kosten-Ersparnis gegenüber einfacher Spiegelung (siehe RAID 1) darstellt. Jedoch ist der Rechenaufwand bei den zugrundeliegenden XOR-Prozessen erheblich höher als bei RAID 5. Bei RAID 5 werden für ein Parity-Bit die Daten aus einer Daten-Zeile addiert (und bei erforderlicher Resynchronisation die Daten aus einer Daten-Zeile per Addition zurück resynchronisiert). Dagegen muss bei RAID 6 das Parity-Bit über mehrere Daten-Zeilen berechnet werden - die Resynchronisation, insbesondere bei zwei ausgefallenen Festplatten, erfordert einen Kalkül über Matrizen und Umkehrmatrizen aus der linearen Algebra (Codierungstheorie).

Ein RAID-6-Verbund benötigt mindestens vier Festplatten.

RAIDn

Bei RAIDn handelt es sich um eine Entwicklung der Inostor Corp., einer Tochter von Tandberg Data. RAIDn hebt die bisher starre Definition der RAID-Level auf.

Dieses RAID wird definiert durch die Gesamtzahl der Festplatten (n) sowie die Anzahl der Festplatten, die ohne Datenverlust ausfallen dürfen (m). Als Schreibweise hat sich RAID(n,m) oder RAID n+m eingebürgert.

Aus diesen Definitionen können die Kenndaten des RAID wie folgt berechnet werden:

  • Lesegeschwindigkeit = n * Lesegeschwindigkeit der Einzelplatte
  • Schreibgeschwindigkeit = (n - m) * Schreibgeschwindigkeit der Einzelplatte
  • Kapazität = (n - m) * Kapazität der Einzelplatte

Einige spezielle Definitionen wurden wie folgt festgelegt:

  • RAID(n,0) entspricht RAID 0
  • RAID(n,1) entspricht RAID 5

RAID DP

RAID DP

RAID DP (double parity) ist eine von Network Appliance [1] weiterentwickelte Version von RAID 4. Hierbei wird eine zweite Parität nach der selben Formel wie die erste Parität P berechnet, jedoch mit anderen Datenblöcken. Die erste Parität wird horizontal, die zweite Parität Q diagonal berechnet. Zudem wird bei der Berechnung der diagonalen Parität jeweils die erste Parität mit einbezogen, dafür aber abwechselnd eine Festplatte nicht. Da in einem RAID DP zwei beliebige Festplattenfehler kompensiert werden können, ist die Verfügbarkeit eines solchen Systemes gegenüber einem lokalen Spiegel um das 2000- bis 4000-fache (je nach RAID-Set-Größe) gesteigert.

<math>P_1 = \operatorname{xor} \left( A_1, B_1, C_1 \right)</math> <math>P_2 = \operatorname{xor} \left( A_2, B_2, C_2 \right)</math> <math>P_3 = \operatorname{xor} \left( A_3, B_3, C_3 \right)</math> <math>\dots</math>

<math>Q_1 = \operatorname{xor} \left( P_1, A_2, B_3, 0 \right)</math> <math>Q_2 = \operatorname{xor} \left( P_2, A_3, 0, C_1 \right)</math> <math>Q_3 = \operatorname{xor} \left( P_3, 0, B_1, C_2 \right)</math> <math>Q_4 = \operatorname{xor} \left( P_4, A_5, B_6, 0 \right)</math> <math>\dots</math>

Der RAID DP vereinfacht die Wiederherstellung. Hierbei wird zuerst mit der diagonalen Parität die Daten der ersten ausgefallenen Festplatte berechnet und danach aus der horizontalen Parität der Inhalt der zweiten Festplatte.

Die Rechenoperationen beschränken sich im Gegensatz zum RAID 6, wo ein Gleichungssystem zu lösen ist, auf einfache xor-Operationen. RAID DP kann jederzeit auf RAID 4 umgeschaltet werden (und umgekehrt), indem man einfach die zweite Paritätsplatte abschaltet (bzw. wiederherstellt). Dies geschieht ohne ein Umkopieren oder Umstrukturieren der bereits gespeicherten Daten im laufenden Betrieb.

Kombinations-RAIDs

Obwohl die RAID-Level 0, 1 und 5 die weitaus größte Verwendung finden, existieren neben den Levels 0 bis 7 noch "RAID-Kombinationen". Hier wird ein RAID zu einem zweiten RAID nochmals zusammengefasst. Beispielsweise können mehrere Platten zu einem parallelen RAID 0 zusammengefasst werden und aus mehreren dieser RAID-0-Arrays z. B. ein RAID-5-Array gebildet werden. Man bezeichnet diese Kombinationen dann etwa als RAID 05 (0+5). Umgekehrt würde ein Zusammenschluss von mehreren RAID-5-Arrays zu einem RAID-0-Array als RAID 50 (oder RAID 5+0) bezeichnet werden. Auch RAID-1- und RAID-5-Kombinationen sind möglich (RAID 15 und RAID 51), die beliebtesten Kombinationen sind allerdings das RAID 01, bei dem je zwei Platten parallel arbeiten und dabei von zwei anderen Platten gespiegelt werden (insgesamt vier Platten), oder RAID 10, bei dem zwei Platten gespiegelt werden und dabei um zwei weitere gespiegelte Platten zu einem Ganzen ergänzt werden.

RAIDs können auch mit mehr als nur zwei Layern zusammengefasst werden (z. B. RAID 100), allerdings wird dies kaum verwendet.

RAID 00

Ein RAID-00-Verbund bildet ein großes RAID 0 (Upper-Level) aus mehreren kleinen RAID 0 (Lower Level). Die Eckdaten entsprechen dem RAID 0, allerdings werden mindestens vier Festplatten benötigt. RAID 00 wurde von IBM entwickelt.

RAID 0+1

RAID 0+1

Ein RAID-0+1-Verbund ist ein RAID 1 über mehrere RAID 0. Es werden dabei die Eigenschaften der beiden RAIDs kombiniert: Sicherheit (evtl. geringer als beim RAID 10) und gesteigerter Datendurchsatz.

Häufig wird behauptet, ein RAID-0+1-Verbund benötige mindestens vier Festplatten. Dieses ist nicht ganz richtig. Mindestens vier (oder genereller: eine gerade Anzahl von) Festplatten werden nur für die klassischen RAID-0+1-Verbunde benötigt. Aber auch mit nur drei Festplatten lässt sich auf vielen RAID-Controllern ein RAID-0+1 bilden. Die Platten werden dabei jeweils zu 50 % mit Nutzdaten belegt, die übrigen 50% jeder Platte enthalten eine Kopie der Nutzdaten einer der anderen Platten. Die Nutzdaten sowie die gespiegelten Daten werden verteilt (striped). Bei drei Platten sieht das so aus:

Platte A: 50 % Nutzdaten + 50 % Spiegelung Nutzdaten Platte C

Platte B: 50 % Nutzdaten + 50 % Spiegelung Nutzdaten Platte A

Platte C: 50 % Nutzdaten + 50 % Spiegelung Nutzdaten Platte B

Die Nutzdaten werden dabei ebenso wie die gespiegelten Daten RAID-0-typisch über die Platten A, B und C verteilt (striped). Bei Ausfall einer Platte sind immer noch alle Daten vorhanden.

RAID-10-Verbund

RAID 10

Ein RAID-10-Verbund ist ein RAID 0 über mehrere RAID 1. Es werden dabei die Eigenschaften der beiden RAIDs kombiniert: Sicherheit und gesteigerte Schreib-/Lesegeschwindigkeit.

Ein RAID-10-Verbund benötigt mindestens vier Festplatten.

Wenn die RAID-1-Schicht einer RAID-0+1-Implementation nicht in der Lage ist, einen Schaden in einem untergeordneten RAID0 differenziert den einzelnen Festplatten zuzuordnen, dann bietet RAID 10 gegenüber RAID 0+1 eine bessere Ausfallsicherheit und schnellere Rekonstruktion nach einem Plattenausfall, da nur ein Teil der Daten rekonstruiert werden muss.

RAID 03

RAID 03

RAID 03 ist gleichwertig mit RAID 30.

RAID 05

Ein RAID-05-Verbund besteht aus einem RAID-5-Array, das aus mehreren striped RAID 0 besteht. Er benötigt mindestens sechs Festplatten.

RAID 1.5

Die Firma Highpoint entwickelte zusätzlich noch das RAID 1.5, nicht zu verwechseln mit RAID 15. Gedacht für Privatanwender, kombiniert es die Vorteile von RAID 0 und RAID 1 und wird deshalb als eine Zwischenstufe der RAID-Levels 1 und 2 gesehen, deswegen auch die Bezeichnungswahl mit Kommastelle. Hauptvorteil ist die gleichzeitige Steigerung der Sicherheit und Geschwindigkeit bei nur zwei Festplatten, was durch keinen anderen "echten" RAID-Level realisierbar wäre. Allerdings scheint auch diese Lösung in der Praxis keine signifikanten Vorteile gegenüber den etablierten RAID-Leveln zu bieten.

RAID 15

Das RAID-15-Array wird gebildet, indem man einen striped Satz mit Parität mit mehrfachen gespiegelten Paaren als Bestandteile verwendet; es ist im Konzept ähnlich wie RAID 10, außer dass das Striping mit einer Parität erfolgt.

Bei einem Acht-Festplatten-RAID-15 dürfen bis zu drei beliebige Platten gleichzeitig ausfallen.

Ein RAID-15-Verbund benötigt mindestens sechs Festplatten.

Der Datendurchsatz ist gut, aber nicht sehr hoch. Die Kosten sind mit denen anderer RAID-Systeme nicht direkt vergleichbar.

RAID 1E

RAID 1E

Beim RAID 1E werden einzelne Datenblöcke auf die jeweils nächste Festplatte gespiegelt. Es dürfen hierbei weder zwei benachbarte noch die erste und die letzte Festplatte gleichzeitig ausfallen. Für ein RAID 1E wird immer eine ungerade Anzahl von Festplatten benötigt. Die nutzbare Kapazität reduziert sich um die Hälfte.
Es gibt allerdings noch andere Versionen von RAID 1E, die flexibler sind als die hier dargestellte Variante.

RAID 1E0

RAID 1E0

Bei einem RAID 1E0 werden mehrere RAID 1E mit einem RAID 0 zusammengeschaltet. Die maximale Anzahl der redundanten Platten und die Nettokapazität entspricht dem zugrundeliegenden RAID 1E.

RAID-30-Verbund

RAID 30

RAID 30 wurde ursprünglich von AMI entwickelt. Es stellt eine striped Variante von RAID 3 dar (das heißt ein RAID 0 welches mehrere RAID 3 zusammenfasst).

Ein RAID-30-Verbund benötigt mindestens sechs Festplatten (zwei Legs mit je drei Festplatten). Es darf eine Festplatte in jedem Leg ausfallen.

RAID-45-Verbund

Ein RAID-45-Verbund fasst, ähnlich dem RAID 55, mehrere RAID 4 mit einem RAID 5 zusammen. Man benötigt hierfür mindestens 3 RAID-4 Legs zu je drei Festplatten und damit neun Festplatten. Bei neun Festplatten sind nur vier Festplatten nutzbar, das Verhältnis verbessert sich allerdings mit der Anzahl der verwendeten Festplatten. RAID 45 wird daher nur in großen Festplattenverbünden eingesetzt. Die Datensicherheit ist sehr hoch, da mindestens drei beliebige Festplatten, zusätzlich eine Festplatten in jedem Leg und dazu noch ein komplettes Leg ausfallen dürfen.

RAID-50-Verbund

Ein RAID-50-Verbund besteht aus einem RAID 0-Array, das aus mehreren striped RAID 5 besteht.

Ein RAID-50-Verbund benötigt mindestens sechs Festplatten. Beispielsweise zwei RAID-5-Controller mit jeweils drei Platten pro Controller zusammengeschaltet mit einem Software-Stripe RAID 0. Sehr hoher Datendurchsatz beim Schreiben und Lesen, da die Rechenarbeit auf zwei XOR-Units verteilt wird.

Wird bei Datenbanken verwendet, wo Redundanz und Schreibdurchsatz im Vordergrund stehen.

RAID 51

RAID 51

Der RAID-51-Verbund wird ähnlich wie RAID 15 gebildet, indem man die gesamte Reihe eines RAID 5 spiegelt, und ist ähnlich zu RAID 01, abgesehen vom Paritätsschutz.

Bei einem Acht-Festplatten-RAID-51 dürfen bis zu drei beliebige gleichzeitig ausfallen. Darüber hinaus dürfen fünf Festplatten ausfallen, solange keine aus dem gespiegelten RAID-5-Verbund betroffen sind.

Ein RAID-51-Verbund benötigt mindestens sechs Festplatten.

Die Datenübertragungs-Leistung ist gut, aber nicht sehr hoch. Die Kosten sind mit denen anderer RAID-Systeme nicht direkt vergleichbar.

RAID 53

RAID 53 ist eine in der Praxis gängige Bezeichnung für ein RAID 30.

RAID 55

Der RAID-55-Verbund wird ähnlich wie RAID 51 gebildet, indem mehrere RAID 5-Systeme über ein weiteres RAID 5 zu einem RAID 55 zusammengeschaltet werden. Im Gegensatz zu RAID 51 ist der Overhead geringer, und es ist möglich, schneller die Daten zu lesen.

Bei einem Neun-Festplatten-RAID-55-System dürfen bis zu drei beliebige Festplatten gleichzeitig ausfallen. Darüber hinaus dürfen fünf Festplatten ausfallen. Ein RAID 55-Verbund benötigt mindestens neun Festplatten (drei Legs zu je drei Festplatten). Die Datenübertragungs-Geschwindigkeit ist gut, aber nicht sehr hoch. Die Kosten sind mit denen anderer RAID-Systeme nicht direkt vergleichbar.

RAID 5E

RAID 5E

RAID 5E ist die Abkürzung für RAID 5 Enhanced. Es kombiniert ein RAID 5 mit einem Hot-Spare. Der Hot-Spare wird dabei allerdings nicht als getrenntes Laufwerk ausgeführt, sondern auf die einzelnen Platten aufgeteilt. Anders ausgedrückt wird auf jeder Platte Speicherplatz für den Fall eines Ausfalles reserviert. Sollte eine Festplatte ausfallen, wird der Inhalt dieser Platte im freiem Speicherplatz mit Hilfe der Parität wiederhergestellt, und das Array kann als RAID 5 weiterbetrieben werden.

Der Vorteil liegt nicht in einer gesteigerten Sicherheit gegenüber RAID 5, sondern in der höheren Geschwindigkeit durch ständige Nutzung aller vorhandenen Plattenspindeln, inklusive der üblicherweise leer mitlaufenden Hot-Spare-Platte.

Die Technik wird schon lange bei IBM für RAID-Controller eingesetzt, jedoch immer mehr durch RAID 5EE ersetzt.

RAID 5EE

RAID 5EE

RAID 5EE arbeitet ähnlich wie RAID 5E. Allerdings wird hierbei der freie Speicherplatz nicht am Ende der Festplatten reserviert, sondern ähnlich der RAID-5-Parität über die Platten diagonal verteilt. Dadurch bleibt beim Ausfall eine höhere Übertragungsgeschwindigkeit bei der Wiederherstellung der Daten.

RAID 5DP, RAID ADG

RAID 5DP ist die von Hewlett Packard verwendete Bezeichnung der Implementierung für RAID 6 in den Speicher-Systemen der VA-Baureihe. Durch die Übernahme von Compaq AG durch Hewlett Packard ging die für die durch Compaq entwickelte RAID-6-Variante RAID ADG für die Compaq Smart Arrays ebenfalls in das geistige Eigentum von Hewlett Packard über. Das Akronym ADG steht hier für Advanced Data Guarding.

Matrix-RAID

Matrix-RAID

Ab dem Intel ICH6R-Southbridge ist seit etwa Mitte 2004 erstmals eine neue Technik integriert, die als "Matrix-RAID" bezeichnet wird. Sie soll die Vorteile von RAID 0 und RAID 1 auf nur zwei Festplatten vereinen. Jede der beiden Platten wird vom Controller zu diesem Zweck in zwei Bereiche aufgeteilt. Ein Bereich wird dann auf die andere Festplatte gespiegelt, während im verbleibenden Bereich die Daten auf beide Platten aufgeteilt werden. Man kann dann z. B. im aufgeteilten Bereich sein "unwichtiges" Betriebssystem und Programme installieren, um von RAID 0 zu profitieren, während man im gespiegelten Bereich dann seine wichtigen Daten abspeichern kann und auf die Redundanz von RAID 1 vertrauen kann. Im Falle eines Plattencrashes müsste man dann nur sein Betriebssystem und Programme neu aufspielen, während die wichtigen Daten im anderen Festplattenbereich erhalten bleiben.

Mit mehreren Festplatten kann man in einem Matrix-RAID auch andere RAID-Typen einsetzen und beispielsweise ab drei Festplatten eine Partition als RAID 5 betreiben.

RAID S bzw. Parity RAID

RAID S bzw. Parity RAID, manchmal auch als RAID 3+1 bzw. RAID 7+1 bezeichnet, ist ein proprietäres striped Parity RAID des Herstellers EMC. Ursprünglich nannte EMC diese Form RAID S bei den Symmetrix-Systemen. Seit dem Markauftritt der neuen Modelle DMX heißt diese RAID-Variante Parity-RAID. Inzwischen bietet EMC auch Standard-RAID-5 an. Laut Angaben von EMC dürfen bei Parity-RAID bis zu zwei Festplatten ausfallen.

RAID S stellt sich wie folgt dar: Ein Volume ist jeweils auf einem physischen Laufwerk, mehrere Volumes (meistens drei bzw. sieben) werden willkürlich zu Paritätszwecken kombiniert. Dies ist nicht mit RAID 5 zu verwechseln.

Eine Parity RAID 3+1 beinhaltet drei Daten Volumes und ein Paritätsvolume. Hiermit ist eine 75 % Nutzung der Kapazität möglich. Beim Parity RAID 7+1 hingegen sind sieben Datenvolumes und ein Paritäts-Volume vorhanden. Hiermit ist jedoch eine 87,5 % Nutzung der Kapazität möglich, bei geringerer Ausfallsicherheit.

Darüber hinaus bietet EMC noch als Option für diese RAID-Varianten die Hypervolume Extension (HVE) an. HVE erlaubt mehrere Volumes auf demselben physischen Laufwerk.

   EMC               EMC
   parity RAID       parity RAID mit HVE
 A1  B1  C1  pABC   A    B    C    pABC  
 A2  B2  C2  pABC   D    E    pDEF F
 A3  B3  C3  pABC   G    pGHI H    I
 A4  B4  C4  pABC   pJKL J    K    L

Hinweis: A1, B1, et cetera stellen einen Datenblock dar; jede Spalte stellt eine Festplatte dar. A, B, et cetera sind gesamte Volumen.

RAID TP bzw. RAID Triple Parity

RAID TP bzw. RAID Triple Parity ist ein proprietäres RAID mit dreifacher Parity vom Hersteller easyRAID. Laut Herstellerangaben können bei RAID TP bis zu drei Festplatten ausfallen.

Die Datenblöcke und die Paritäten werden parallel jeweils auf die einzelnen physischen Festplatten geschrieben. Die drei Paritäten werden auf verschiedene Stripes auf unterschiedlichen Platten abgelegt. Der RAID Triple Parity Algorithmus benutzt einen speziellen Code mit einem Hamming-Abstand von mindestens 4.

   RAID TP bzw. RAID Triple Parity
 A1        B1        pP(A1B1)  pQ(A1B1)  pR(A1B1)
 C1        pP(C1D1)  pQ(C1D1)  pR(C1D1)  D1
 pP(E1F1)  pQ(E1F1)  pR(E1F1)  E1        F1
 A2        B2        pP(A2B2)  pQ(A2B2)  pR(A2B2)
 C2        pP(C2D2)  pQ(C2D2)  pR(C2D2)  D2
 pP(E2F2)  pQ(E2F2)  pR(E2F2)  E2        F2

Hinweis: A1, B1, et cetera stellen einen Datenblock dar; jede Spalte stellt eine Festplatte dar. A, B, et cetera sind gesamte Volumen.

Hierzu benötigt man mindestens vier Festplatten. Die Kapazität errechnet sich aus Festplattenanzahl minus drei.

RAID-Z im Dateisystem ZFS

Ein von Sun Microsystems im Dateisystem ZFS integriertes RAID, ähnlich dem Aufbau von RAID 5. Gegenüber einem RAID-5-Array ist RAID-Z gegen Synchronisations-Probleme ("write hole") geschützt. Der Begriff write hole bezeichnet eine Situation, die bei Schreibzugriffen entsteht, wenn die Daten bereits auf die Festplatten geschrieben wurden, die dazugehörige Paritätsinformation aber noch nicht. Sollte während dieses Zustands ein Problem beim Berechnen oder Schreiben der Paritätsinformation auftreten, passen diese nicht mehr zu den gespeicherten Datenblöcken.</br> Siehe auch: [2]

Zusammenfassung

  • Anzahl der Festplatten
    Die Anzahl der Festplatten n gibt an, wieviele Festplatten benötigt werden, um das jeweilige RAID aufzubauen.
  • Nettokapazität
    Die Nettokapazität k gibt die nutzbare Kapazität in Abhängigkeit von der Anzahl der verwendeten Festplatten n an. Dies entspricht der Anzahl der benötigten Festplatten ohne RAID, die die gleiche Speicherkapazität aufweisen.
  • Ausfallsicherheit
    Die Ausfallsicherheit S gibt an, wieviele Festplatten ohne Datenverlust ausfallen dürfen.
  • Leg
    Ein Leg (englisch für Bein) oder lower level RAID ist ein RAID-Array, welches mit anderen gleichartigen Legs über ein übergeordnetes RAID-Array (upper level RAID) zusammengefasst wird. Hierbei ist nin Leg die Anzahl der Festplatten in einem Leg und nof Leg die Anzahl der Legs im übergeordnetem Array.
Übersicht über die Standard-RAIDs
RAID n k S Lesen Schreiben
0 ≥ 2 n 0 ++ ++
1 ≥ 2 n/2 <math>n-1</math> + o
2 ≥ 3 = 1 2
3 ≥ 3(2) n-1 1
4 ≥ 3(2) n-1 1
5 ≥ 3 n-1 1 + +
6 ≥ 4 n-2 2 o o
DP ≥ 3 n-2 2
Übersicht über die Kombinations-RAIDs
RAID n k S Lesen Schreiben
00 <math>\begin{alignat}{2} = & \sum_{k=1}^j i_k \quad (i_k \ge 2\text{, }j \ge \ 2 ) \\ \ge & \ 4\end{alignat}</math> n 0 ++ ++
10 <math>\begin{alignat}{2} = & \ i * j \quad (i \ge 2\text{, }j \ge \ 2 ) \\ \ge & \ 4\end{alignat}</math> <math>\frac{n}{2}</math> <math>\frac{1}{Leg}</math> + +
0+1
1E <math>\begin{alignat}{2} = & \ 2 * i + 1 \quad (i \ge 1) \\ \ge & \ 3 \text{ (und ungerade)}\end{alignat}</math> <math>\frac{n-1}{2}</math>
1E0 <math>\begin{alignat}{2} = & \ (2 * i + 1) * j \quad (i \ge 1 \text{, }j \ge \ 2 ) \\ \ge & \ 6\end{alignat}</math> <math>\frac{\frac{n}{2} - 1}{Leg}</math>
1.5 ≥ 2 1 o
Matrix-
RAID
<math>n+\frac{3}{4}</math> 0
15 <math>\begin{alignat}{2} = & \ i * j \quad (i \ge 2 \text{, }j \ge \ 3 ) \\ \ge & \ 6\end{alignat}</math> <math>\frac{n}{2} - 1\,</math> <math>3 \dots \frac{1}{Leg} + 1</math>
51 <math>1 \, {Leg} + 1</math>
55 <math>\begin{alignat}{2} = & \ i * j \quad (i \ge 3 \text{, }j \ge \ 3 ) \\ \ge & \ 9\end{alignat}</math> <math>\left( n_{in \, Leg} - 1 \right) \cdot \left( n-1 \right)</math> <math>\frac{1}{Leg} + 1 \, {Leg}</math> -
45 <math>\begin{alignat}{2} = & \ i * j \quad (i \ge 3(2)\text{, }j \ge \ 3 ) \\ \ge & \ 9(6)\end{alignat}</math>
5E ≥ 4 n-2 1 ++ -
5EE + 53 <math>\begin{alignat}{2} = & \ i * j \quad (i \ge 3\text{, }j \ge \ 2 ) \\ \ge & \ 6\end{alignat}</math> <math>n - n_{of \, Leg}</math> <math>\frac{1}{Leg}</math> +
5DP ≥ 4 n-2 2 o o
ADG
S 3+1 = 4 n·75 % 1
S 7+1 = 8 n·87,5 % 1
TP ≥ 4 n-3 3

Andere Begriffe

Cache

Der Cache-Speicher spielt bei RAID eine große Rolle. Grundsätzlich sind folgende Caches zu unterscheiden:

  • Betriebssystem
  • RAID-Controller
  • Enterprise Disk Array

Eine Schreib-Anforderung wird heute üblicherweise bereits quittiert, wenn die Daten im Cache angelangt sind und somit bevor die Daten tatsächlich permanent gespeichert wurden; weiterhin kann es vorkommen, dass der Cache nicht in der Reihenfolge bereinigend entleert wird, in der er gefüllt wurde; hierdurch kann eine Zeit entstehen in der bereits als gespeichert angenommene Daten durch einen Strom- oder Hardware-Ausfall verloren gehen können, was zu fehlerhaften Datei-Inhalten führen kann (etwa wenn das Datei-System von einer Verlängerung der Datei ausgeht, obwohl aber die entsprechenden Daten noch gar nicht geschrieben wurden). In Enterprise-Speichersystemen überlebt der Cache daher Resets. Der Schreib-Cache bringt einen Geschwindigkeitsgewinn, solange der Cache (RAM) nicht voll ist, oder solange die Schreib-Anforderungen in sub-optimaler Reihenfolge oder überlappend eingehen, da das Schreiben in den Cache schneller ist als das Schreiben auf Platte.

Der Lese-Cache ist heute in Datenbank-Anwendungen oft von großer Bedeutung, da hierdurch fast nur noch zum Schreiben auf das langsame Speichermedium zugegriffen werden muss.

Siehe auch: Cache, BBWC, NCQ, TCQ

SPAN

Von VIA wird in seiner RAID-Konfiguration unter anderem die Option SPAN angeboten. Sie dient zur Kapazitätserweiterung ohne Leistungsgewinn wie bei Raid 0 (Striping). Während bei Raid 0 die Daten gleichzeitig auf mehrere Festplatten verteilt werden, gelangen die Daten bei SPAN zusammenhängend auf eine Harddisk. Bei RAID 0 sollten nach Möglichkeit gleich große Festplatten verwendet werden, da die überschüssige Kapazität des größeren Datenträgers verloren geht. Bei SPAN sind unterschiedlich große Festplatten ohne Kapazitätsverlust zu einer großen Harddisk zusammenfassbar, und entspricht somit Linear Mode (s.o.).

JBOD

JBOD

JBOD bedeutet Just a Bunch Of Disks, also Nur ein Haufen Platten.

Der Begriff wird verwendet in Abgrenzung zu RAID-Systemen, um anzugeben, wenn Festplatten nicht im Verbund, sondern einzeln betrieben werden. Viele Hardware-RAID-Controller sind in der Lage, die angeschlossenen Festplatten dem Betriebssystem einzeln zur Verfügung zu stellen; die RAID-Funktionen des Controllers werden dabei abgeschaltet, und er arbeitet als einfacher Festplatten-Controller.

Ein JBOD kann auch unabhängig vom Controller eine irgendwie an den Computer angeschlossene Anzahl von Festplatten bezeichnen. Mithilfe einer Volume Management Software kann ein solches JBOD zu einem Software-RAID zusammengeschaltet werden.

Bei bestimmten RAID-Tools, wie z. B. dem VIA RAID-TOOL, wird der Begriff JBOD fälschlicherweise auch gleichbedeutend mit NRAID verwendet.

Stripe Size

Stripe size bezeichnet die Größe des aus einem oder mehreren Datenblöcken bestehenden zusammenhängenden Datenbereichs als kleinste adressierbare Einheit zur Verteilung von Daten auf RAID-Speichermedien. Bei einer Vergrößerung der Stripe-Size wächst der maximale Durchsatz, gleichzeitig erhöht sich aber die Zugriffszeit. Auch Striping-Granularität. Heute üblich sind Stripe-Größen von 4 kbyte bis 256 kbyte.

Hot Swapping

Hot Swapping ist die Möglichkeit, Festplatten im laufenden Betrieb auszutauschen. Dazu muss der Bus-Controller Hot Plugging unterstützen (i. d. R. nur SCSI oder SATA).

Hot-Spare-Laufwerk

RAID Level 5 mit Hot-Spare-Laufwerk

Das Hot-Spare-Laufwerk ist ein unbenutztes Reservelaufwerk. Fällt ein Laufwerk innerhalb des RAID-Verbundes aus, wird es durch das Reservelaufwerk ersetzt. Dadurch ist die Redundanz schnellstmöglich wiederhergestellt. Während der Rebuild-Phase hat man allerdings keine Redundanz. Zur Vermeidung dieses Problems kann ein RAID 6 oder RAID DP statt RAID 5 verwendet werden, da hier zwei Parity-Platten vorhanden sind. Außerdem gibt es Storagesysteme, die intern ständig alle Plattenbereiche prüfen. Sollte ein Datenblock "dirty" sein, so wird die Platte bis zu diesem Bereich kopiert, der Dirty-Block aus der Prüfsumme bzw. der Spiegelplatte rekonstruiert und dann weiter kopiert. Dadurch kann die Wiederherstellungszeit reduziert werden.

In größeren RAID-Systemen, in denen die Möglichkeit besteht, an einem RAID-Controller mehrere unterschiedliche RAID-Arrays einzurichten, gibt es darüber hinaus auch die Möglichkeit, dass ein Hot-Spare-Laufwerk entweder einem einzelnen RAID-Array zugeordnet ist oder für die Verwendung im gesamten RAID-System zur Verfügung steht. In diesem Fall spricht man dann von einem Local-Spare-Laufwerk (bei Zuordnung zu einem bestimmten Array) oder einem Global-Spare-Laufwerk (wenn das Laufwerk für alle Arrays verwendet werden kann).

RAIDIOS (RAID I/O Steering)

Offener Standard von Intel zur Verwendung der vorhandenen Anschlüsse. Es wird nur der fehlende I/O-Controller (mit 0 Kanälen) nachgerüstet. Kostengünstige und ökonomische Variante.

Siehe auch

Weblinks