Kuration bezeichnet im wissenschaftlich-technischen Kontext den systematischen, qualitätsgesicherten Prozess der Auswahl, Aufbereitung, Dokumentation, Pflege und langfristigen Bereitstellung von Informationen und Daten. In den Materialwissenschaften umfasst dies insbesondere experimentelle und simulierte Werkstoffdaten, Metadaten zu Probenpräparation, Messbedingungen, Auswertealgorithmen sowie Datenversionen.
Zentrale Ziele der Datenkuratierung sind Reproduzierbarkeit, Nachvollziehbarkeit und Interoperabilität. Dazu gehören die Anwendung standardisierter Metadaten-Schemata, kontrollierter Vokabulare und etablierter Dateiformate, z. B. für Mikroskopie-, Spektroskopie- oder Diffaktionsdaten. Kuratierte Datensätze werden typischerweise in Repositorien mit persistenten Identifikatoren (z. B. DOI) abgelegt, um langfristige Referenzierbarkeit zu gewährleisten.
Community-Kuration erweitert diesen Prozess, indem Fachgemeinschaften aktiv an der Qualitätsbewertung, Annotation und weiteren Anreicherung der Daten beteiligt sind. Dies kann durch Peer-Review von Datensätzen, gemeinsame Ontologieentwicklung oder kollaborative Fehlerkorrektur erfolgen. Community-Kuration ist besonders relevant für große, heterogene Materialdatenbanken, in denen Expertenwissen zur korrekten Interpretation und Klassifikation notwendig ist.
Im Kontext datengetriebener Werkstoffentwicklung (z. B. Materials Informatics) ist hochqualitative Kuration eine Voraussetzung für robuste Machine-Learning-Modelle. Unzureichend kuratierte Daten führen zu systematischen Verzerrungen, eingeschränkter Übertragbarkeit und fehlerhaften Struktur-Eigenschafts-Beziehungen. Kuration ist damit eine zentrale wissenschaftliche Tätigkeit, die zunehmend durch automatisierte Workflows, semantische Technologien und FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) unterstützt wird.
© 2026