OpenRefine Einführung

Dieses Tutorial kann als Material für unseren Einführungs-Workshop oder als Selbstlern-Ressource genutzt werden.

OpenRefine ist ein leistungsstarkes Open-Source-Tool zur Datenbereinigung und -transformation, das im GLAM-Bereich (Galleries, Libraries, Archives, Museums) und in Universitätssammlungen wertvolle Dienste leistet. Gerade hier, wo heterogene und historisch gewachsene Datensätze oft inkonsistente Metadaten aufweisen, hilft OpenRefine.

Das Tool kann:

  • praktisch alle Text-Dateiformate und Datenstrukturen wie CSV, XML, JSON importieren
  • einen schnellen Überblick über Dateien mit zehntausenden Zeilen schaffen
  • Bereinigungs- und Sortieraufgaben durchführen, etwa vor dem Import von Daten in ein neues Dokumentationssystem
  • durch Zugriff auf Webseiten und Schnittstellen diese Daten verarbeiten (z. B. für einen Abgleich mit der GND, Wikidata, OpenStreetMap usw.)
  • wiederholbare, komplexe Bearbeitungsschritte mit Hilfe der eigenen Skriptsprache GREL durchführen, die ganze Spalten oder die ganze Tabelle betreffen
  • bei der Transformation in andere Datenformate (Export) unterstützen

Ob zur Vorbereitung digitaler Sammlungen, für Systemmigrationen oder zur besseren Integration in Forschungsinfrastrukturen – OpenRefine erleichtert die Arbeit mit Metadaten erheblich und trägt dazu bei, Sammlungen besser zu erschließen und nachhaltig nutzbar zu machen.

Die Kursdateien können auf unserem SODa Repository gefunden werden.