Skip to content

Speichern von Daten

Zitation:

Blümm, M., Fritsch, K., Bock, S., Prof. Dr. Arning, U., & Prof. Dr. Förstner, K. U. (2024). VL_08_Speichern. Blended-Learning-Basiskurs „Forschungsdatenmanagement“ (Version 0.1). https://mbluemm.github.io/modul-fdII-thkoeln/texte/VL_08_Speichern.html

Lernziele

Lernziele

In diesem Themenblock lernen Sie die Speicherung von Daten und Dateien kennen, welche Aspekte dabei im Forschungsprozess zu beachten sind und welchen Empfehlungen zu befolgen ist. Außerdem lernen Sie über Vor- und Nachteile verschiedener Speichermedien sowie unterschiedlicher Datenformate.

(forschungsdaten.info 2023a; forschungsdaten.info 2023b).

Daten speichern und das Datenverlustrisiko minimieren

Im FDM ist eine sinnvolle Speicherung von Daten eine Voraussetzung für die Gute wissenschaftliche Praxis (GWP) und gewährleistet die Möglichkeit einer langfristigen Nachnutzbarkeit der Daten. Um möglichst zu verhindern, dass Daten beschädigt werden, verloren gehen oder veralten, ist es sinnvoll, bei der Speicherung von Daten und Dateien einige Aspekte zu beachten. So kann vorgebeugt werden, dass Daten bspw. aufgrund technischer Fehler etwa durch einen Schaden an der Festplatte oder aufgrund veralteter Software nicht mehr lesbar sind oder versehentlich gelöscht werden.

Backup- und Datensicherungsmaßnahmen sind unerlässlich: Forschungsdaten müssen vor unbefugtem Zugriff (z. B. Cyber/Hackerangriffe) und Datenverlust (z. B. technische Fehler/Brand) geschützt werden. Insbesondere sensible, personenbezogene Daten müssen durch Pseudonymisierung oder Anonymisierung besonders geschützt werden (Weiner et al. 2020).

Vor- und Nachteile von Speichermedien finden Sie unter (forschungsdaten.info 2023b).

Wichtige Aspekte bei der Speicherung von Daten

Um das Risiko des Datenverlustes bestmöglich zu reduzieren, sollte bei der Sicherung der Daten und Dateien insbesondere darauf geachtet werden, dass diese:

  • regelmäßig,
  • in mehreren Kopien,
  • in weit verbreiteten Datenformaten,
  • von den Rohdaten getrennt,
  • strukturiert (zu einem festgelegten Zeitpunkt) und einheitlich erfolgt.

Darüber hinaus ist es wichtig, die 3 - 2 - 1 - Regel zu beachten. Gleichermaßen sollte die Sicherung der Daten mit einer guten Ordner- und Dateistruktur, inklusive einer geeigneten Dateibenennung, einhergehen.

Abbildung: forschungsdaten.info 2023a

Empfehlungen zur Datensicherung

Es ist hilfreich (VerbundFDB 2018):

  • alle fünf Jahre die alten externen Speichermedien mit neueren auszutauschen.
  • notwendige Softwareanwendungen in die Backup-Strategie einzubeziehen.
  • eine regelmäßige Kontrolle der Daten und Dateien durchzuführen (z. B. einmal jährlich, stichprobenartig).
  • einen geeigneten Ablageort für Daten und Dateien zu wählen, der o über ausreichend Speicherkapazität verfügt, o allen beteiligten und berechtigten Personen Zugriff ermöglicht und o Zugriff durch Unbefugte verhindert.
  • offene W-LAN-Verbindungen zu vermeiden.
  • gute Virus- und Malwarescanner zu verwenden.
  • DSGVO-konforme Clouddienste, wie etwa die Cloud-Speicherlösung sciebo, zu wählen (https://hochschulcloud.nrw/).[1]

TIP

Kostenlose Clouddienste (bspw. Google Drive, Dropbox, OneDrive) sollten nicht verwendet werden, da deren Serverstandorte nicht in Deutschland, sondern in Amerika liegen. In Amerika sind aufgrund des USA PATRIOT Acts (2001) die eigenen Daten vor einem Zugriff Dritter nicht geschützt.

(Krähwinkel, Langner, Lipp et al. 2022)


Sicherer Passwortschutz

Was ist ein gutes Passwort?

Die Daten (Dateien und Ordner) sollten wo es möglich ist, beispielsweise bei sensiblen Daten, mit einem Passwort geschützt sein. Für einen Überblick von sicheren Passwörtern kann Passwortmanagement-Software helfen.

Beispiele für Passwortregel

Universitäten und Hochschulen haben interne Leitlinien zum Umgang mit Forschungsdaten erstellt, wie beispielsweise die Leitlinie der Technischen Hochschule Köln (Sauther-Patrascu und Dmitrieva 2021 ), in der zum Thema Sicherung von Daten folgendes zusammengefasst ist:

Die Sicherung von Daten wird meistens als ein Backup oder eine Sicherungskopie bezeichnet und dient der Wiederherstellung der ursprünglichen Daten im Falle eines Datenverlusts.

  • Bei einem Backup oder einer Datensicherung werden alle für ein Projekt relevanten Daten gespeichert. Die Archivierung von Daten bedeutet sowohl die systematische Sicherung ausgewählter Daten für einen unbegrenzten Zeitraum als auch der Erhalt und die Betreuung dieser Daten über geeignete Verfahren.

Die Langzeitarchivierung (LZA) ist ein Verfahren, das Forschungsdaten für einen unbestimmten Zeitraum (i.d.R. > 10 Jahre ab Projektende), über technologische und soziokulturelle Veränderungen hinaus, verfügbar und interpretierbar hält.

Frage: Glauben Sie es wäre für künftige Studierende hilfreich an dieser Stelle noch Informationen zum Erstellen von sicheren Passwörtern sowie zur Verwaltung von Passwörtern zu erhalten? https://forschungsdaten.info/themen/speichern-und-rechnen/passworthilfen/

Datenformate

Damit Daten langfristig nachnutzbar sind und einfacher geteilt werden können, sollte darauf geachtet werden, dass zum einen so wenig unterschiedliche Datenformate wie möglich verwendet werden, zum anderen die Daten in:

  • offenen, d.h. nicht herstellerspezifisch,
  • standardisierten,
  • langlebigen,
  • weit verbreiteten,
  • von Maschinen und Menschen lesbaren,
  • mit Metadaten versehenen

Formaten vorliegen und gespeichert werden. Dies erhöht die Wahrscheinlichkeit, dass es auch in einigen Jahren noch Software und Hardware gibt, die die Daten lesen können. Auch sollten die Formate möglichst verlustfrei konvertiert werden können.

Unter den oben genannten Aspekten eignen sich folgende Formate:

DateitypEmpfohlenes Format[2]
Text.pdf/a .txt .xml
Tabelle.xml .csv (mit Einschränkungen)
Foto.tiff .tif (.jpg ist nicht verlusfrei)
Grafik.png, .svg
Audio.wav .flac (mit
Einschränkungen)
(mp3 ist nicht
verlustfrei)

Kassettebånd Digitalisering Quelle: Digitalbevaringdk Kassettebånd_Digitalisering

Dateiformate können folgendermaßen konvertiert werden:

  • verlustfrei → bevorzugt
  • verlustbehaftet → für geringere Dateigrößen
  • sinnhaft → wesentliche Inhalte bleiben bestehen.

Mehr zu empfohlenen Textformaten (u.A.) und Konvertierungen unter Formatinformation (pdf). Mehr zu geeigneten und ungeeigneten Datenformaten unter (Böker 2023b).

Lyd Digitalisering Quelle: Digitalbevaringdk Lyd_Digitalisering


Leitfragen und Aufgaben

Leitfragen

  • Was ist die Relevanz von Daten/Dateispeicherung und Backup im FDM?
  • Wissensübertragung: Welche Rolle spielt die Dateispeicherung im Studium? Worauf ist hier zu achten? Welche Probleme können entstehen?

Aufgabe:

Arbeiten Sie die angegebenen Materialien durch und beantworten Sie für sich die Fragen. Dokumentieren und reflektieren Sie Ihre Ergebnisse in Ihrem Lernportfolio.

Weiterführende Materialen und Quellen

Literatur

Böker, E. (2023a, 5. Mai). Datenübertragung. Forschungsdaten.info. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/organisieren-und-aufbereiten/datenuebertragung/

Böker, E. (2023b, 24. Juli). Formate erhalten. Forschungsdaten.info. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/formate-erhalten/

Forschungsdaten.info. (2023, 5. Mai). Passworthilfen. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/passworthilfen/

Forschungsdaten.info. (2023, 11. August). Speichern und Übertragen großer Datenmengen. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/speichern-und-uebertragen-grosser-datenmengen/.

Putnings, M., Neuroth, H., & Neumann, J. (2021, 19. Dezember). Praxishandbuch Forschungsdatenmanagement. De Gruyter Saur. https://doi.org/10.1515/9783110657807.

Weber, A. & Piesche, C. (2021). 4.2 Datenspeicherung, -kuration und Langzeitverfügbarkeit. In M. Putnings, H. Neuroth & J. Neumann (Ed.), Praxishandbuch Forschungsdatenmanagement (pp. 327- 356). Berlin, Boston: De Gruyter Saur. https://doi.org/10.1515/9783110657807-019.

Weiner, B., Wünsche, S., Kühne, S. et al. (2020, 30. April). Crashkurs Forschungsdatenmanagement. Zenodo. https://doi.org/10.5281/zenodo.3778431.

Quellen:

Forschungsdaten.info. (2023a, 5. Mai). Datensicherheit und Backup. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/datensicherheit-und-backup/.

Forschungsdaten.info. (2023b, 5. Mai). Datenspeicherung und die Lebensdauer von Datenträgern. Zugriff am 18.10.2023, von https://forschungsdaten.info/themen/speichern-und-rechnen/datenspeicherung-und-die-lebensdauer-von-datentraegern/

Krähwinkel, E., Langner, P., Lipp, R., et al. (2022). HeFDI Data Learning Materials: Forschungsdatenmanagement eine Online-Einführung (Version 1.0). Zenodo. https://zenodo.org/records/6373596#.Y9Jfo4fMJPZ

Sauther-Patrascu, K. S. & Dmitrieva, S. (2021). Leitlinie zum Umgang mit Forschungsdaten. Abgerufen am 20. Oktober 2023, von https://www.th-koeln.de/mam/downloads/deutsch/forschung/leitlinie_zum_umgang_mit_forschungsdaten.pdf

VerbundFDB. (2018, 20. Juli). Daten benennen und organisieren. Zugriff am 18.10.2023, von https://www.forschungsdaten-bildung.de/dateien-benennen


  1. Hier empfiehlt es sich zu prüfen, wie lange auf die Hochschuldienste zugegriffen werden kann. ↩︎

  2. Praxishandbuch Forschungsdatenmanagement (Putnings, Neuroth, und Neumann 2021). ↩︎