Facebook
Facebook
Instagram @srupicture

Lost Places

Sichere Daten?


Der Horror eines jeden, der mit Daten arbeitet, ist der Datenverlust. Besonders böse ist das bei Fotografen, wenn plötzlich die Platte mit den gerade gemachten Hochzeitsfotos nicht mehr lesbar ist. Da man in diversen Foren und YouTube Videos zum Teil sehr riskante Sicherungsstrategien vorgestellt bekommt, habe ich hier mal meine Überlegungen und meinen Workflow aufgeschrieben.

Das Problem bei der Sache ist, dass immer ein kleiner Faktor alles in ein anderes Licht stellen kann. Daher ist das hier das für mich beste Vorgehen und es ist auf meine Umgebung optimiert. Es führen viele Wege nach Rom…


Und so sieht es visualisiert aus:




Workflow

Ich habe in meinen Kameras jeweils 2 Speicherkarten, welche synchron arbeiten. Die Kamera schreibt also jede Datei gleichzeitig 2 Karten parallel. Geht eine Speicherkarte kaputt, ist die andere hoffentlich noch in Ordnung.


Viele Fotografen speichern, wenn sie von einem Job kommen, die Bilder aus der Kamera auf EINER einzelnen Festplatte. Und hier beginnt das Erste Problem. Speichere ich die Daten auf eine SSD, habe ich zwar ein superschnelles Medium… aber wenn die kaputt geht und die Speicherkarten in der Kamera bereits wieder überschrieben sind, sind die Daten weg. Ok, ich könnte sofort nach dem Beschreiben der SSD ein Backup machen, aber das kostet viel Zeit. Daher speichere ich die Daten lieber gleich auf ein RAID-1 System (Dazu mehr unter RAID Systeme). Da stecken 2 Platten drin, die ebenfalls gespiegelt sind. Fällt eine aus, habe ich noch die Zweite Platte. Dieses RAID-1 hängt via Thunderbolt 3 (USB-C 3.2) Anschluss an meinem MacBook. Ja, so ein RAID ist 2/3 langsamer als eine externe SSD, aber für Bildbearbeitung und auch zum Schneiden von Videos unter FinalCut reicht es absolut aus. Ich möchte eben nicht mit zig externen SSDs herumbasteln. Da ist die Gefahr einer vergessenen Sicherung einfach zu groß. Als RAID-1 System habe ich mich für das SanDisk G-RAID entschieden. Warum steht unter dem Punkt RAID weiter unten.


Wenn ich die Arbeit an den Fotos beende, sichere ich das G-RAID auf mein Synology BACKUP RAID-5 System (mehr dazu unter Backup & Desater Recovery). Die Sicherung mache ich via TimeMachine (dem Apple BackUp Programm) inkl. dem externen G-RAID. Ich habe bei TimeMachine noch den Vorteil, dass die Daten inkrementell gesichert werden. Ich kann also eine Datei über mehrere Bearbeitungsstände zurück sichern!!!


Parallel wird mein Mac und das externe G-RAID auch noch via backplaze.com in die Cloud gesichert.


So habe ich einen schlanken Workflow und eine maximale Datensicherung.



RAID-Systeme

Ein RAID-System ist die Zusammenschaltung mehrerer Festplatten. Dazu benötigt man ein Gehäuse, in welchem die Logik des RAIDs verbaut ist. Hier gibt es viele Hersteller (LaCie, Synology, QNAP, ICY, SanDisk…). Was macht ein RAID? Ich gehe hier nur auf die wichtigsten Typen ein:


RAID 0: hierbei werden die Platten in vollem Umfang verwendet. Also 2x 2TB Platten ergeben 4TB nutzbares Plattenvolumen. Diese Variante hat dazu auch noch die schnellsten Schreib-Lese-Zugriffe, weil das Schreiben und das Lesen der Daten auf beide Platten verteilt wird. Der Haken; fällt eine Platte aus bzw. geht kaputt, ist der gesamte Datenbestand verloren. Hier würde ich eher eine externe SSD bevorzugen und von dieser ein Backup erstellen. Das kostet weniger und ist trotzdem 3x schneller.


Raid 1: Hier werden 2 (oder mehr) Platten gespiegelt. Das bedeutet, wenn 2x 2TB Platten verbaut werden, sind anstelle 4TB nur 2TB verfügbar. Fällt eine Platte aus, arbeitet die Zweite Platte weiter. Es muss dann die defekte Platte gegen eine neue getauscht werden. Das RAID System sichert dann von der noch funktionierenden Platte die Daten zurück auf die neue. Das dauert bei 1TB ca. einen kompletten Tag!!! 

Wichtig ist, dass man in einem RAID-1, auf dem man aktiv arbeitet, sehr schnelle und hochwertige Serverfestplatten verwendet. Allerdings bekommt man heute (April 2022) z.B. eine 12TB Platten für lediglich 300 EUR.

Es stellt sich die Frage; warum macht man das nicht mit SSDs? Zum Einem gibt es derzeit SSDs nur bis 4TB und, was viel wichtiger ist, es gibt keine RAID-Systeme für SSDs mit Thunderbolt Anschluss (siehe Bandbreite & Datendurchsatz).


Nun ist die Frage, welches RAID-System welches Herstellers. Was ist dabei wichtig?

Zuerst muss die Anzahl der Festplatten entschieden werden, welche ich einsetzen will. Ich wollte ein RAID-1, also 2 Festplatten. Dann geht es darum, wie ich das RAID an meinen Rechner anschließe. Hier gibt es nur 2 sinnvolle Varianten. Entweder über das Netz via 10 Gigabit Netzwerk (1 GBit/s ist zu langsam) oder via USB-C 3.2 = Thunderbolt 3. Ich habe mich für letzteres entschieden, da der Umbau des Netzwerkes auch nicht gerade kostenfrei ist ;-).

Als Hersteller kommen dann SanDisk oder Terramaster in die erste Auswahl. Ich habe mich für das G-RAID 2 von SanDisk mit 2x 12TB Platten entschieden. SanDisk gehört zu Western Digital. Das ist neben Seagate einer der Beiden großen Festplatten Hersteller.


RAID 5: Beim RAID 5 werden mindestens 3 (üblicher Weise 5) Festplatten zusammen geschaltet, wobei eine Platte als „hot spare“, also als Ersatz verwendet wird. Nehme ich z.B. 5 Stück 3TB Festplatten und schalte diese zu einem RAID-5 zusammen, habe ich netto ca. 11TB (1TB geht für die interne Verwaltung verloren) netto nutzbar und 1 Platte als Ersatz, wenn eine der 4 aktiven Platten kaputt geht. Durch die Logik der Verschaltung sinkt die Datenrate so in den Keller, dass diese Lösung zwar sehr gut als Backup, aber keinesfalls als Arbeitslaufwerk einzusetzen ist.

Ich verwende als Backup System mein (schon in die Jahre gekommenes) Synology DS1010+ mit der DX510-1 Erweiterung. Jedes System hat 5 Platten Einschübe und ist separat als je ein RAID-5 konfiguriert.



Backup & Desaster Recovery

Datensicherung & Backup wird heute oft falsch verstanden und Begriffe durcheinandergewirbelt. Aber fangen wir langsam an. In meinem MacBook steckt eine Festplatte. Davon mache ich mit TimeMachine, dem Apple Datensicherungsprogramm, regelmäßige Datensicherungen. Geht der Mac kaputt oder ich verliere ihn, kann ich aus dem Backup die Daten jeder Zeit zurückholen. Aber Achtung: Nur die Daten des letzten Backups. Alle Daten, welche ich seit dem letzten Backup auf meinem Mac erstellt habe,… sind verloren. Also immer regelmäßig und zeitnahe Backups machen. Backup heißt also, Daten woanders hinschreiben.


In meinem G-RAID, wo meine ganzen Foto- und Videodaten liegen, habe ich 2 gespiegelte Platten. Das schützt mich vor Datenverlust, wenn eine Platte kaputt geht. ABER: diese Platten laufen SYNCHRON! Das bedeutet, lösche ich eine Datei, so ist diese auch auf der zweiten Platte gelöscht. Geht eine einzelne Datei auf Platte 1 kaputt, ist diese auch auf Platte 2 kaputt. Ich schütze mich mit einem Raid-1 nur gegen einen Hardwaredefekt. Das ist zwar auch eine Form des Schutzes meiner Daten… aber eben nur gegen Hardwareausfälle. Das ist KEIN Backup. Das Backup mache ich auf mein Synology-System und parallel dazu in die Cloud zu backplaze.com. Aus beiden Systemen kann ich alle Daten zurückholen. Aus dem Backup auf dem Synology-System bis zum letzten Backup, aus der Cloud von bis gerade eben! Backplaze sichert bei mir permanent! Das könnte ich zwar auch mit meinem Synology RAID-5 machen, aber ich möchte es nicht andauern anhaben. Zum einen ist es ein Energieverbrauchsthema und zum anderen wird durch das ausschalten das Risiko eines erfolgreichen Hackerangriffs auf meine Daten minimiert.



RANSOMWARE & Einbruch

Nicht erst, seitdem uns die Ukraine Kriese eine Flut von Hackerangriffen (auch in Deutschland) beschert, passiert es immer mehr Unternehmen, sich einen Ransomware-Virus einzufangen. Hierbei werden alle Festplatten verschlüsselt und in einem Fenster auf dem Monitor steht dann, dass für die Überweisung von x Euro auf ein Bitcoin Konto, der Daten wieder frei gegeben werden. Inzwischen werden solche Cyberangriffe nicht mehr nur gegen große Firmen gerichtet. Die Software der Angreifer arbeitet heute eher nach dem Gießkannen-Prinzip. Daher trifft es gelegentlich, und immer öfter, auch kleinere Gewerbetreibende oder auch private Computer. Daher sollte jeder eine gute und kommerzielle Vieren-Schutz-Software mit Ransomware Schutz haben. Aber wenn es einen dann doch mal erwischt… ? Dafür ist mein zweiter Backup in der Cloud und mein Synology Backup. Letzteres ist nur an, wenn ich ein Backup erstelle.


Gleiches ist beim Thema Einbruch. Wird das G-RAID oder auch das Synology-System bei einem Einbruch gestohlen, oder das Haus brennt ab, habe ich noch alle Daten in der Cloud.



Anschlüsse & Datendurchsatz

Jetzt wird es kompliziert. Selbst unter IT-Profis erlebe ich öfter mal, dass MB (MegaByte mit Mbit (Megabit) verwechselt wird. Der Unterschied ist „nur“ der Faktor 1.000 ;-).


Jeder versteht, was ein MB ist. Diese Größe stellt ein Volumen dar. Dann gibt es MB/s. Das bedeutet, dass 1 MegaByte in einer Sekunde durch eine Leitung geht. Relevant ist dann, wie „dick“ die ist.


Beispiel: Unser klassisches Netzwerk wird als 1 Gigabit Netzwerk bezeichnet. Das bedeutet, dass der Datendurchsatz (von Kabeln, Routern und Switchen) wie folgt darzustellen ist:


1 GBit/s = 125MB/s


Ich bekomme also durch ein „normales“ Netzwerk 125 MB in einer Sekunde… theoretisch. In der Praxis sind es maximal 117 MB/s. Der Grund hierfür sind die Transportinformationen, welche an die Daten gehängt werden müssen. Diese müssen ja auch durch den „Kanal“.


Nun könnte man das Netzwerk auf die nächste Größe, also auf 10 GigaBit/s aufrüsten. Ja, das wäre bei mir kein Problem… nur mein Synology Laufwerk kann nur 1GBit/s und Erweiterungskarten für das von mir eingesetzte Gerät gibt es nicht. Klar, neu kaufen hilft immer ;-). Es müssen also immer ALLE Komponenten mitspielen.


Daher habe ich in meinem Netzwerk einen Ordner mit diversen Dateien mit einer Gesamt Gösse von 11GB von jedem Festplattensystem zu jedem anderen hin und her kopiert und die Zeiten gestoppt. Wichtig hierbei: mal waren es Kopierjobs über das Netzwerk und mal über Thunderbolt 3 angeschlossene Geräte und mal waren beide Verbindungstypen eingebunden. Entscheidender Faktor war immer die langsamste Verbindung. Natürlich kann auch mal eine sehr langsame alte oder über USB 2.0 angeschlossene Festplatte das langsamste Glied in der Kette sein. Aber so ein Teil verwende ich nicht mehr.


Hier die Ergebnisse:



In Zeile 1 und 2 ist das Synology System zu sehen. Schauen wir auf die MB/s Werte. Die sind mit 89,43 MB/s schon dicht an der Grenze des Netzwerkes mit 117 MB/s. Reicht aus für das Backup. Die externe SSD war hier bestimmt nicht das Problem ;-)


Schauen wir uns Zeile 7 und 8 an. Das G-RAID hängt via Thunderbolt 3 am Mac. Die Bandbreite (Zeile 15) ist hier gigantisch. Die externe SSD hat ebenfalls genug Leistung. Die Grenze ist das G-Raid. Mit Rund 250 MB/s ist der erreichte Wert weit über der Leistungsfähigkeit eines 1 Gigabit Netzwerkes, aber hier bremsen die klassischen, drehenden Festplatten aus. Schauen wir uns den Unterschied in den Datendurchsatzwerten an, so stehen rund 2.000 Mbit/s mit dem G-RAID (Zeile 7 & 8) gegen rund 7.000 Mbit/s von einer externen SSD (Zeile 5 & 6 gegenüber. Das ist rund das 3-Fache an Leistung!



Fazit

Das Thema „sichere Daten“ ist viel komplizierter, als so mancher auf Facebook oder Youtube erzählt. Natürlich geht es mit dem Kölschen Spruch „Ethätt noch emmer jootjejange“ auch. Das ist auf alle Fälle die kostengünstigste Variante… bis zum Tag x!

Wer seine Daten in Sicherheit wissen will, muss schon etwas dafür tun. Ob es nun gleich ein 10Gbit Netzwerk sein muss oder ein RAID aus SSDs, hängt vom Einzelfall ab. Wer große 4k Videodateien in Echtzeit bearbeiten muss und da auch intensives color grading macht, wird um eine SSD als Arbeitsplatte nicht herumkommen. Am besten noch intern in einem m1 Mac der neuesten Generation. Die Lösung, welche ich mir gebaut habe, versucht einen einfachen Workflow mit maximaler Sicherheit zum sinnvollen Preis zu kombinieren. 


Wer Fragen oder Verbesserungsvorschläge hat… einfach melden.



… noch ein Wort zur DSGVO!

Wer Daten zu Backplaze.com auslagert, lagert diese in ein, aus EU-Datenschutz-Sicht, unsicheres Drittland aus. Das ist, wenn personenbezogene Daten ins Spiel kommen ein Problem. Wenn ein Ordner z.B.: „Hochzeit Susi & Paul Müller am 10.10.2022 in Berlin“ benannt wird, sind die Fotos, wo Personen abgebildet werden mit einem Ort verknüpft. Hier sind schon locker 3 Verstöße gegen die DSGVO zu bewerten. Eine gute Lösung ist, die Daten vor der Übertragung zu verschlüsseln. Wer mehr dazu googeln möchte findet unter dem Stichwort „Schrems 1 und 2 Urteil“ viele interessante Informationen. Also immer schön verantwortungsvoll mit den Kundendaten umgehen!!!