Die Forschungsdaten-Policy der Technischen Universität Berlin

Am 23. Oktober 2019 vom Akademischen Senat beschlossen

1. Präambel

Die TU Berlin will Wissenschaft und Technik zum Wohle unserer Gesellschaft weiterentwickeln und bekennt sich zum Prinzip der nachhaltigen Entwicklung. Sie betreibt Grundlagen- und anwendungsorientierte Forschung auf internationalem Spitzenniveau und fördert fakultätsübergreifende, mit externen Akteuren vernetzte Forschungsaktivitäten ebenso wie den Wissens- und Technologietransfer zwischen Universität und Praxis durch strategische Allianzen mit Unternehmen, universitären und außeruniversitären Forschungseinrichtungen.

Forschungsdaten stellen als Grundlage wissenschaftlicher Erkenntnis eine wertvolle Ressource dar und haben einen langfristigen Wert für Forschung und Wissenschaft, mit dem Potenzial einer breiten Nutzung in der Gesellschaft. Forschungsdaten sind alle Informationen (unabhängig von Form oder Darstellung), die während eines Forschungsprozesses entstehen oder sein Ergebnis sind, einschließlich der Informationen, die zur Nachvollziehbarkeit und Reproduktion der Ergebnisse notwendig sind. Zu den Forschungsdaten zählen unter anderem Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Objekte aus Sammlungen oder Proben, Umfragen und Interviews, aber auch Skripte, Zeitschriebe, Berechnungen, Software und Code. Die TU Berlin ist sich der grundlegenden Bedeutung von Forschungsdaten zur Aufrechterhaltung der Forschungsqualität und der wissenschaftlichen Integrität bewusst und verpflichtet sich, anerkannte Standards zu befolgen, die höchsten Ansprüchen genügen. Die TU Berlin erkennt an, dass korrekte und leicht abrufbare Forschungsdaten die Grundlage und integraler Bestandteil jeder Forschungstätigkeit sind, da sie für die Überprüfung und Reproduzierbarkeit von Forschungsprozessen und -ergebnissen notwendig sind.

Mit dieser Policy will die TU Berlin ihren jetzigen und zukünftigen Forschenden eine Orientierung zum Umgang mit Forschungsdaten an die Hand geben. Die Policy bezieht sich insbesondere auf die Empfehlungen des Wissenschaftsrats (2012) und der Hochschulrektorenkonferenz (2014) sowie auf die „Leitlinien zum Umgang mit Forschungsdaten“ (2015) der Deutschen Forschungsgemeinschaft. Die TU Berlin formuliert diese Policy gemäß der "Grundsätze zur Sicherung guter wissenschaftlicher Praxis an der TU Berlin" und der „Open-Access-Policy der TU Berlin“.

2. Geltungsbereich

Diese Policy zum Management von Forschungsdaten gilt grundsätzlich für alle an der TU Berlin tätigen Wissenschaftlerinnen und Wissenschaftler. In den Fällen, in denen die Forschung mit Dritten durchgeführt wird, gehen Vereinbarungen mit diesem Dritten über geistige Eigentumsrechte, Zugangsrechte und die Speicherung von Forschungsdaten dieser Policy vor, sofern sie der „Transferstrategie der TU Berlin“, den „Handlungsempfehlungen für Wissens- und Technologietransfer im Kontext von Open Science“ und dem „Code of Conduct für die Forschung unter Beteiligung von Unternehmen“ nicht entgegenstehen. Vertragliche Regelungen, die von der Forschungsdaten-Policy abweichen, sind in der Regel vorrangig.

3. Rechtliche Aspekte

Rechte am geistigen Eigentum und Rechte an den Forschungsdaten werden in der Regel durch spezifische Vereinbarungen (z.B. Forschungsverträge wie Grant- oder Konsortialvereinbarungen und Auftragsforschungsvereinbarungen) definiert. In Fällen, in denen die Rechte an den Forschungsdaten der TU Berlin gehören, entscheidet die TU Berlin, wie die Forschungsdaten veröffentlicht, weitergegeben und weiterverwertet werden. Bei Forschungsdaten, die einer Forscherin oder einem Forscher gehören, entscheidet diese bzw. dieser, wie mit den Daten verfahren wird.

Die TU Berlin und ihre Forschenden beachten beim Forschungsdatenmanagement ethische und juristische Belange wie zum Beispiel Datenschutz und Patentrecht. Vorrang haben Regelungen zur Vertraulichkeit.

4. Umgang mit Forschungsdaten

Die Wahrung der Integrität von Forschungsdaten ist von grundlegender Bedeutung: Forschungsdaten müssen korrekt, vollständig, unverfälscht und zuverlässig gespeichert werden. Entsprechend der FAIR-Prinzipien müssen sie darüber hinaus identifizierbar, zugänglich, rückverfolgbar, interoperabel und nach Möglichkeit zur Nachnutzung zur Verfügung stehen.

Gemäß ihrer Open-Access-Policy unterstützt die TU Berlin den freien Zugang zu Forschungsdaten. In Übereinstimmung mit dem Recht am geistigen Eigentum und wenn keine Rechte Dritter, Datenschutzrechte, gesetzliche oder vertragliche Bestimmungen dem entgegenstehen, empfiehlt die TU Berlin, dass Forschungsdaten eine Lizenz zur freien Nutzung erhalten sollen, wie z. B. Creative Commons, um die Nachnutzung der Forschungsdaten zu ermöglichen.

Forschungsdaten sollen in einem geeigneten Repositorium oder Archivsystem gespeichert, mit einem Persistenten Identifikator sowie Metadaten versehen und, wenn möglich, offen zugänglich gemacht werden. Hierbei müssen die geltenden forschungsethischen und datenschutzrechtlichen Regelungen berücksichtigt werden.

Die Mindestaufbewahrungsdauer für Forschungsdaten beträgt zehn Jahre nach der Vergabe eines persistenten Identifikators oder der Veröffentlichung des zugehörigen Werks nach Abschluss des Forschungsvorhabens, je nachdem, welcher Zeitpunkt der spätere ist.

Die Einhaltung von Zitationsregeln und von Auflagen hinsichtlich der Veröffentlichung und Verwendung von Forschungsdaten sind zu gewährleisten. Bei der Nachnutzung von Forschungsdaten soll die Herkunft der Daten eindeutig nachvollziehbar sein und die Originalquellen genannt werden.

Sollen Forschungsdaten nach Ablauf der Aufbewahrungsdauer gelöscht oder vernichtet werden, erfolgt dies erst nach Berücksichtigung aller rechtlichen und ethischen Gesichtspunkte. Bei der Entscheidung über die Aufbewahrung und Vernichtung sind die Interessen und vertraglichen Regelungen von Drittmittelgebern und anderen Beteiligten, Mitarbeitenden und Partnern sowie Aspekte der Vertraulichkeit und Sicherheit zu berücksichtigen. Alle Maßnahmen sind zu dokumentieren.

5. Verantwortlichkeiten

Die Verantwortung für das Forschungsdatenmanagement während und nach einem Forschungsvorhaben liegt bei der TU Berlin und ihren Forschenden und soll mit den Grundsätzen der TU Berlin für verantwortungsbewusstes Forschen übereinstimmen. In der Verantwortung der Forschenden liegen insbesondere:

  • a) Management von Forschungsdaten gemäß den in dieser Policy formulierten Grundsätzen und Anforderungen. Dazu zählen auch Festlegungen der Projektleitung zum Umgang mit Forschungsdaten im Rahmen von Projekten;
  • b) Sammlung, Dokumentation, Zugriff auf und Speicherung oder ordnungsgemäße Vernichtung von Forschungsdaten und forschungsbezogenen Aufzeichnungen;
  • c) Planungen, um die Weiterverwendung der Daten auch nach Abschluss eines Forschungsvorhabens zu ermöglichen. Dazu gehört unter anderem die Definition von Nutzungsrechten, einschließlich der Vergabe entsprechender Lizenzen. Dazu gehört auch die Klärung der Datenspeicherung und -archivierung im Falle des Weggangs der Forschenden von der TU Berlin;
  • d) Erstellung und Aktualisierung von Datenmanagementplänen, in denen die Erhebung, Verwaltung, Integrität, Vertraulichkeit, Speicherung, Nutzung und Veröffentlichung der Forschungsdaten explizit festgelegt ist.

Die TU Berlin verpflichtet sich, die Voraussetzungen für die Erfüllung der in dieser Policy formulierten Grundsätze zu schaffen.

6. Gültigkeit

Die Forschungsdaten-Policy der TU Berlin wurde vom Akademischen Senat am 23. Oktober 2019 verabschiedet. Diese Policy wird alle drei Jahre vom Akademischen Senat überprüft und bei Bedarf aktualisiert.

Glossar zur Forschungsdaten-Policy

Auftragsforschung

Auftragsforschung ist das wissenschaftliche Forschen im Auftrag eines privatwirtschaftlichen oder öffentlich-rechtlichen Mittelgebers. Die Aufgabe ist vorgegeben und die Rechte an den Forschungsresultaten stehen in der Regel dem Auftraggeber zu, wobei der Universität ein einfaches Nutzungsrecht für Forschung und Lehre eingeräumt wird.

Datenmanagementplan

Ein Datenmanagementplan (DMP) ist ein strukturierter Leitfaden zum Umgang mit Forschungsdaten während eines Forschungsvorhabens und über das Ende des Forschungsvorhabens hinaus. Er dokumentiert den Entstehungsprozess von Forschungsdaten und wie sie ordnungsgemäß gespeichert werden, so dass sie in späteren Jahren interpretierbar und nachvollziehbar, verfügbar, authentisch, zitierfähig und nachnutzbar sind. Dazu sollen auch klar definierte rechtliche Parameter und geeignete Sicherheitsmaßnahmen (wie Verträge, Lizenzen) für die spätere Verwendung im DMP festgehalten werden. Zur Optimierung des Forschungsdatenmanagements und als Basis für einen institutionellen Support sollte ein DMP vor Beginn eines Forschungsvorhabens erstellt und im Verlauf des Vorhabens aktualisiert werden.

FAIR-Prinzipien

Die FAIR-Prinzipien formulieren internationale Grundsätze für nachhaltig nachnutzbare Forschungsdaten. Hauptziel ist eine optimale Aufbereitung der Forschungsdaten, damit diese findbar (Findable), zugänglich (Accessible), austauschbar (Interoperable) und nachnutzbar (Reusable) sind. Die FAIR-Prinzipien wurden von einer breit aufgestellten Interessengruppe, bestehend aus Vertretern aus Wissenschaft, Industrie, Förderorganisationen und wissenschaftlichen Verlagen, erstellt und 2016 erstmals veröffentlicht.

Forschende

Forschende sind alle forschungsaktiven Mitglieder der TU Berlin einschließlich der Mitarbeitenden und Promovierenden. Personen, die nicht direkt mit der TU Berlin verbunden sind, aber zu Forschungszwecken die Infrastruktur nutzen oder an der TU Berlin physisch präsent sind, werden ebenfalls in den Begriff einbezogen. Von Gastforschenden oder externen Kooperationspartnern wird ebenfalls erwartet, dass sie sich an die Forschungsdaten-Policy halten.

Forschungsdatenmanagement

Das Forschungsdatenmanagement (FDM) umfasst alle Maßnahmen zur Qualitätssicherung von Forschungsdaten hinsichtlich Speicherung, Zugriff und Aufbewahrung von Forschungsdaten, um die Forschungsergebnisse nachhaltig reproduzierbar und zur Nachnutzung verfügbar zu machen. Die Maßnahmen decken den gesamten Lebenszyklus der Forschungsdaten ab, von der Planung und Durchführung des Forschungsvorhabens, der Erstellung und Speicherung der Daten bis hin zur langfristigen Speicherung der Ergebnisse nach Abschluss des Forschungsvorhabens. Zu den spezifischen Aktivitäten des FDM gehören unter anderem Qualitätskontrolle und Qualitätssicherung, Dokumentation, Metadatenerstellung, Archivierung, Datenaustausch und Wiederverwendung, Maßnahmen zur Datenintegrität und Datensicherheit.

Kooperationsforschung

Kooperationsforschung ist die inhaltliche Zusammenarbeit auf Augenhöhe zwischen den Partnern zur Verfolgung eines gemeinsamen Ziels. Grundsätzlich stehen die Rechte an den Ergebnissen dem Partner zu, der sie erarbeitet hat.

Lizenz zur freien Nutzung

Eine Lizenz zur freien Nutzung (auch: freie Lizenz) ist ein standardisierter Lizenzvertrag, der die Nachnutzung der Forschungsdaten ermöglicht. Er regelt, welche über das geltende Urheberrechtsgesetz hinausgehenden Nutzungsrechte die Urheberin oder der Urheber der Allgemeinheit einräumt. Je nach Datentyp wird eine Lizenz ausgewählt. Bekannte freie Lizenzen aus dem Softwareumfeld sind die GNU General Public License (GPL), die MIT-Lizenz oder die Apache-Lizenz. Für Texte, Bilder, Musik oder Videos haben sich Creative-Commons-Lizenzen (CC) durchgesetzt.

Metadaten

Metadaten sind Daten über Daten. Es sind Daten, die beschreibende oder kontextuelle Informationen zu anderen Daten enthalten, indexiert werden können und das Archivieren und Auffinden erleichtern. Es gibt unterschiedliche Arten bzw. Kategorien von Metadaten. Die Metadaten in einem Repositorium lassen sich beispielsweise inhaltlich in vier Arten einordnen: bibliografische Metadaten (wie z. B. Titel, Autor, Abstract), strukturelle Metadaten (Beziehungen zwischen und innerhalb von Objekten, wie z. B. Links, Verweise), administrative Metadaten (Berechtigungen/Status, wie z. B. Zugriffsberechtigungen, Embargo), technische Metadaten (vom System ausgewertete Daten, wie z. B. Größe von Dateien, Checksummen, Änderungsdatum).

Persistenter Identifikator

Ein Persistenter Identifikator (Persistent Identifier) ist eine konstante Internet-Adresse für digitale Objekte. Er stellt sicher, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt, auch wenn sich sein physischer Standort ändert. Bekannte Beispiele sind DOI (Digital Object Identifier) oder URN (Uniform Resource Name).

Repositorium

Ein Repositorium ist eine Speicherplattform zur Archivierung und weltweiten Veröffentlichung von wissenschaftlichen Publikationen, Forschungsdaten oder Daten des kulturellen Erbes. Die Speicherung der Forschungsergebnisse in einem Repositorium soll gewährleisten, dass sie nachhaltig verfügbar, verifizierbar, zitierbar und nachnutzbar sind.

Handlungsempfehlungen zur Umsetzung der Forschungsdaten-Policy

Vorbemerkung

Die Technische Universität Berlin misst Forschungsdaten als wesentlicher Grundlage wissenschaftlicher Erkenntnis eine hohe Bedeutung bei. Gemäß der „Grundsätze zur Sicherung guter wissenschaftlicher Praxis an der TU Berlin“ und der „Open-Access-Policy der TU Berlin“ und unter Maßgabe der „Transferstrategie der TU Berlin“, den „Handlungsempfehlungen für Wissens- und Technologietransfer im Kontext von Open Science“ und dem „Code of Conduct für die Forschung unter Beteiligung von Unternehmen“ hat der Akademische Senat der Technischen Universität Berlin am 23. Oktober 2019 die „Forschungsdaten-Policy der TU Berlin“ beschlossen. In derselben Sitzung hat der Akademische Senat die „Handlungsempfehlungen zur Umsetzung der Forschungsdaten-Policy“ des Servicezentrums Forschungsdatenmanagement zustimmend zur Kenntnis genommen. Die TU Berlin unterstützt die Forschenden mit geeigneten Angeboten zum Forschungsdatenmanagement nach Maßgabe finanzieller Möglichkeiten. Die Handlungsempfehlungen* ergänzen die in der Forschungsdaten-Policy der TU Berlin formulierten Grundsätze und geben praktische Hinweise zu deren Umsetzung.

* Die vorliegenden Empfehlungen rekurrieren auf den Handlungsempfehlungen zu Forschungsdaten-Policies der
Humboldt-Universität zu Berlin (2014) und der Universität Jena (2016).

Ansprechpartner

Als zentraler Ansprechpartner für alle Belange des Forschungsdatenmanagements dient das Servicezentrum Forschungsdatenmanagement (SZF). Im SZF arbeiten die Universitätsbibliothek, die Zentraleinrichtung Campusmanagement (ZECM; vormals IT-Service-Center tubIT) und die Abt. V Forschung zusammen und bündeln ihre Kompetenzen, um die Forschenden der TU Berlin beim Umgang mit Forschungsdaten zu unterstützen. Die Leitung und Koordination des SZF liegt bei der Universitätsbibliothek. Das SZF betreibt die Forschungsdaten-Infrastruktur der TU Berlin, die in die IT-Infrastruktur der TU Berlin integriert ist, und entwickelt bedarfsgerecht weitere Services. Zentrale technische Infrastrukturdienste sind DepositOnce, das Repositorium für Forschungsdaten und Publikationen der TU Berlin, und TUB-DMP, ein Web-Tool zur Erstellung von Datenmanagementplänen. Beratungsdienste sowie ein Helpdesk ergänzen die technischen Dienste. Forschungsdatenmanagement und Forschungsdaten-Infrastruktur der TU Berlin sind nach den FAIR-Prinzipien ausgerichtet, internationalen Grundsätzen für die optimale Aufbereitung von Forschungsdaten, damit diese findbar (Findable), zugänglich (Accessible), austauschbar (Interoperable) und nachnutzbar (Reusable) sind.

Die Webseiten des SZF dienen als zentrale Plattform, auf der neben umfangreichen Informationen zum Umgang mit Forschungsdaten und den Services zum Forschungsdatenmanagement auch die Beratungsangebote mit den Kontaktdaten der Ansprechpartnerinnen und Ansprechpartner aufgeführt sind. Entsprechend der Aufgabenteilung im SZF beraten die Teams der Abt. V Forschung (s. u.) Sie zu Anforderungen der Förderorganisationen und zu Projektanträgen, das SFZ-Team der Universitätsbibliothek zum Umgang mit Forschungsdaten und zum Forschungsdatenmanagement. Die ZECM berät Sie zu Beschaffungen von Infrastruktur und zur Nutzung der von ihr angebotenen Dienste.

Empfehlungen zum Umgang mit Forschungsdaten

Im Folgenden werden Empfehlungen zum Umgang mit Forschungsdaten für verschiedene Phasen eines Forschungsvorhabens gegeben.

I. Planungsphase: vor dem Forschungsvorhaben

Wenn Sie Ihr Forschungsvorhaben im Rahmen eines Drittmittelprojekts durchführen, erkundigen Sie sich im Vorhinein nach eventuell geltenden Richtlinien zur Nachnutzung von im Projekt entstehenden Forschungsdaten. Die für die langfristige Speicherung entstehenden Kosten, die über die Grundausstattung der Universität hinausgehen, können und sollten Teil der beantragten Mittel sein. Nutzen Sie das Beratungsangebot der Abt. V Forschung, um sich über die Anforderungen der Förderorganisationen und Finanzierungsmöglichkeiten zu informieren und Ihren individuellen Bedarf zu ermitteln.

Um eine angemessene Unterstützung für Ihr neues Forschungsvorhaben zu erhalten, ist es notwendig, dass Sie Ihr Projekt bei der Antragstellung in der Abt. V Forschung anmelden. Die Anzeige von Forschungsprojekten erfolgt über eine sogenannte Projektanzeige (ePA). Bei Fragen unterstützt Sie der Servicebereich Forschung.

Darüber hinaus ist bei jedem Forschungsvorhaben, in dem Daten erhoben werden oder Daten die Grundlage Ihrer Forschung bilden, eine frühzeitige Auseinandersetzung mit den Anforderungen und Möglichkeiten eines effizienten und nachhaltigen Forschungsdatenmanagements dringend angeraten. Wenden Sie sich an das SZF-Team, um sich über den Umgang mit Forschungsdaten und über Serviceangebote zum Forschungsdatenmanagement zu informieren und eine geeignete Strategie für Ihr Vorhaben zu entwickeln.

Empfohlen und von den Förderorganisationen zunehmend gefordert wird die Erstellung eines Datenmanagementplans (DMP). Ein Datenmanagementplan ist ein strukturierter Leitfaden für den Umgang mit Forschungsdaten während eines Forschungsvorhabens und über das Ende des Forschungsvorhabens hinaus. Er dokumentiert den Entstehungsprozess von Forschungsdaten und wie sie ordnungsgemäß gespeichert werden, so dass sie in späteren Jahren interpretierbar und nachvollziehbar, verfügbar, authentisch, zitierfähig und nachnutzbar sind.

In der Antragsphase sollte eine Strategie für die nachhaltige Speicherung und Verfügbarmachung der Forschungsdaten bestimmt werden und in den Datenmanagementplan einfließen. Auch klar definierte rechtliche Parameter und geeignete Sicherheitsmaßnahmen (wie Verträge, Lizenzen) für die spätere Verwendung sollten im Datenmanagementplan festgehalten werden. Zur Optimierung des Forschungsdatenmanagements und als Basis für einen institutionellen Support sollte ein Datenmanagementplan vor Beginn eines Forschungsvorhabens erstellt und im Verlauf des Vorhabens aktualisiert werden (Stichwort: living document).

Zur Unterstützung bei der Erstellung, Versionierung und nachhaltigen Speicherung Ihres Datenmanagementplans für Einzel- oder Verbundprojekte steht Ihnen das Web-Tool TUB-DMP zur Verfügung. Es enthält Vorlagen (Templates) in Form von Checklisten mit relevanten Fragen, die Sie – sofern für Ihr Projekt relevant – in einem Schritt-für-Schritt-Workflow beantworten können, u.a. ein Template zur Erstellung eines Horizon 2020-konformen Datenmanagementplans. Bei Fragen zum Datenmanagementplan unterstützt Sie das SZF-Team.

Bei allen Forschungsvorhaben und auch bei der Veröffentlichung der Ergebnisse sind rechtliche Rahmenbedingungen zu beachten. Bestimmte Forschungsdaten etwa in den Sozial- oder Lebenswissenschaften sowie der Medizin unterliegen strengen Auflagen, wie dem Datenschutz oder der vorherigen Begutachtung durch eine Ethikkommission. Auch der Schutz des Urheberrechts und die berechtigten Interessen Dritter müssen gewährleistet sein. Deshalb sind bei der Planung eines Forschungsvorhabens grundlegende rechtliche Fragen im Voraus abzuklären. Das Referat Forschungsverträge, Lizenzen und Patente der Abt. V Forschung ist Ihnen hierbei behilflich. Zu den Anforderungen des Datenschutzrechts wenden Sie sich unbedingt frühzeitig an die behördliche Datenschutzbeauftragte.

II. Durchführungsphase: während des Forschungsvorhabens

Für die Speicherung und Verarbeitung von Forschungsdaten sowie für die Kollaboration auf Basis dieser Daten sollten Verfahren verwendet werden, die dem aktuellen Stand der Technik entsprechen. Dazu gehört insbesondere die Beachtung von Datensicherheit hinsichtlich Verfügbarkeit, Integrität (Unverfälschtheit) und Authentizität. Dies impliziert z.B. die Nutzung der Datensicherung, die Verwendung sicherer Datenaustauschplattformen und die Verwendung von Versionierungstools.

In der Durchführungsphase eines Projekts unterliegen Datensätze meist einer Entwicklung über mehrere Stufen hinweg (z.B. durch Auswahl, Aggregation, Integration). Es hat sich als vorteilhaft erwiesen, die verschiedenen Versionen zu kennzeichnen, zu dokumentieren und zumindest während der aktiven Projektlaufzeit aufzubewahren. Insbesondere bei Text-basierten Daten erleichtert die Verwendung von Versionierungstools, wie sie in der Softwareentwicklung üblich sind (z.B. git, SVN), das Management der verschiedenen Versionen.

Die ZECM stellt im Forschungsumfeld u.a. folgende Dienste zur Verfügung; nähere Beschreibungen finden Sie auf den Webseiten der ZECM:

  • Nutzung von Netzwerkfilesystemen (inkl. Datensicherung)
  • Archivspeicherdienste auf Bandlaufwerken
  • Bereitstellung virtueller Root-Server (Serverhosting)
  • Unterbringung realer Server (Serverhousing)
  • Blockspeicherdienste für Server (virtuelle Festplatten über ein dezidiertes Speichernetz)
  • Datenaustauschdienste
  • Versionierungsdienste

Die Dienste werden entweder als Grundausstattung kostenfrei oder zum Selbstkostenpreis angeboten. Das gleiche gilt für die Werkzeuge zum kollaborativen Arbeiten, die die ZECM bereitstellt.

Unterschiedliche Wissenschaftsdisziplinen und ihre Teilgebiete haben unterschiedliche Arbeitsweisen im Umgang mit Forschungsdaten, was eine fachübergreifende Empfehlung zur Nutzung konkreter Verfahren erschwert. Daher wird grundsätzlich empfohlen, sich im Vorhinein über die in der jeweiligen Fachgemeinschaft etablierten Datenformate, Software und Standards zur Dokumentation und Annotation von Forschungsdaten wie z.B. Ontologien, kontrollierte Vokabulare oder Metadatenschemata zu informieren. Die Nutzung offener, nicht-proprietärer Datenformate unterstützt die Zugänglichkeit und Langzeitverfügbarkeit von Forschungsdaten.

Von elementarer Bedeutung für die Nachnutzbarkeit von Forschungsdaten ist deren Beschreibung mit Metadaten. Metadaten sind Daten über Daten und geben den Kontext wieder, in dem diese erzeugt wurden. Als Faustregel gilt: Metadaten sollten die klassischen sechs W-Fragen beantworten: Wer? Was? Warum? Wie? Wann? Wo? Metadaten sind die Voraussetzung, um potenziellen Nachnutzern das Auffinden und die Abschätzung der Eignung für die Nutzung zu ermöglichen. Idealerweise erfolgt die Beschreibung strukturiert und maschinenlesbar. Hierzu existieren in den meisten Fachdisziplinen Metadatenstandards und standardisierte Terminologien. Falls diese nicht existieren, sollten allgemeingültige Standards, wie z.B. Dublin Core, zur Beschreibung verwendet werden. Sie werden von weltweiten Initiativen vorangetrieben und helfen, die Forschungsergebnisse besser nachvollziehbar und interoperabel zu machen.

In Verbundprojekten oder bei großen Datenmengen ist der Einsatz dezidierter Arbeitsumgebungen und Portale zum Datenmanagement sinnvoll. Der Betrieb dieser Tools erfordert meist zusätzliche Ressourcen, bietet jedoch den Vorteil einer einheitlichen und zentralen Verwaltung der Forschungsdaten. Das Auffinden und der Austausch von Daten wird damit erleichtert, sollte jedoch im Projektkonsortium mit Hilfe einer projektspezifischen Data Policy geregelt werden.

III. Abschlussphase: nach dem Forschungsvorhaben

Im Sinne der guten wissenschaftlichen Praxis sind Forschungsdaten spätestens zum Projektende langfristig zu sichern und nach Möglichkeit zugänglich zu machen, sofern keine vertraglichen, ethischen oder gesetzlichen Bestimmungen dem entgegenstehen. Von vielen Förderorganisationen wird inzwischen besonderer Wert auf die Zugänglichkeit gelegt, um die Nachvollziehbarkeit von Forschungsergebnissen und die Nachnutzung der Daten zu ermöglichen. Gemäß ihrer Open-Access-Policy unterstützt die TU Berlin den freien Zugang zu Forschungsdaten. Bei der Veröffentlichung von Forschungsdaten empfiehlt die TU Berlin, sich an dem Prinzip „Zugänglich, wenn möglich, eingeschränkt, wenn notwendig“ zu orientieren.

Folgende Grundprinzipien hinsichtlich der Veröffentlichung von Forschungsdaten sollen beachtet werden:

  • Allgemeine Projekt-, Arbeitsgruppen-, Lehrstuhl- oder Mitarbeiter-Webseiten sind in der Regel kein geeigneter Ort für die primäre Veröffentlichung von Forschungsdaten, da die langfristige Verfügbarkeit häufig nicht gewährleistet ist und die eindeutige Identifizierung (Stichwort: Persistenter Identifikator) nur begrenzt möglich ist.
  • Bei der Auswahl der zu veröffentlichenden Daten empfiehlt die DFG (2015): „Forschungsdaten sollten in einer Verarbeitungsstufe (Rohdaten oder bereits weiter strukturierte Daten) zugänglich sein, die eine sinnvolle Nach- und Weiternutzung durch Dritte ermöglicht.” Insbesondere Daten, die Grundlage wissenschaftlicher Artikel bilden, sollten – soweit keine (datenschutz)rechtlichen oder forschungsethischen Bedenken mehr entgegenstehen – zugänglich gemacht werden.
  • Wie bei wissenschaftlichen Artikeln sollten auch Forschungsdaten mit der Veröffentlichung einen eindeutigen, persistenten Identifikator (PID) zugewiesen bekommen. Auf diese Weise sind Forschungsdaten für sich, d. h. unabhängig von einer Publikation, auffindbar und eigenständig zitierbar. Bekannte Beispiele sind DOI (Digital Object Identifier) oder URN (Uniform Resource Name).
  • Um die Nutzungs- und Verwertungsrechte von Forschungsdaten zu regeln, sollten Daten immer mit einer entsprechenden Lizenz veröffentlicht werden. Die Wahl der Lizenz sollte zumindest einen offenen Zugang für wissenschaftliche Zwecke erlauben. Zu berücksichtigen sind ggf. die speziellen Anforderungen der Förderorganisation bzw. Repositorien. Bekannte freie Lizenzen aus dem Softwareumfeld sind die GNU General Public License (GPL), die MIT-Lizenz oder die Apache-Lizenz. Für Texte, Bilder, Musik oder Videos haben sich Creative-Commons-Lizenzen durchgesetzt.

Für die Veröffentlichung Ihrer Forschungsergebnisse (Forschungsdaten und Publikationen) steht Ihnen als Mitglied der TU Berlin und Ihren Kooperationspartnern das fachübergreifende Repositorium DepositOnce der TU Berlin zur Verfügung. In DepositOnce werden Forschungsergebnisse gespeichert, d. h. konsolidierte Daten und alle Informationen (wie Skripte, Zeitschriebe, Berechnungen usw.), die zur Reproduktion des Ergebnisses notwendig sind. Gemäß den Grundsätzen zur Sicherung guter wissenschaftlicher Praxis der TU Berlin werden die Forschungsdaten für die Dauer von mindestens 10 Jahren gespeichert.

  • Alle Daten in DepositOnce sind mit Metadaten (Standardformat Extended Dublin Core) versehen.
  • Alle Datensätze erhalten automatisch eine persistente Internetadresse (DOI).
  • Den Datensätzen können verschiedene freie Lizenzen zugewiesen werden.
  • Über den DOI können zusammengehörige Forschungsdaten und Publikationen in DepositOnce miteinander verlinkt werden und verweisen dann gegenseitig aufeinander.
  • Gemäß den Regeln guter wissenschaftlicher Praxis können veröffentlichte Forschungsdaten in DepositOnce nicht mehr geändert werden; so bleiben Zitierfähigkeit und Nachvollziehbarkeit erhalten. DepositOnce verfügt über eine Versionierung, bei der neue Versionen publiziert werden und gleichzeitig die vorhergehenden verfügbar bleiben. Jede neue Version erhält einen neuen DOI; vorhergehende und aktuelle Versionen werden automatisch miteinander verlinkt und verweisen aufeinander.
  • DepositOnce ist dem Open Access verpflichtet. Die Metadaten sind im Internet frei zugänglich und werden über Standardschnittstellen weit verbreitet und suchbar gemacht (Google Scholar u.a.). Die Forschungsdaten selbst können mit einer Sperrfrist (Embargo) versehen werden.

Eine Reihe von Fach-Communities hat in den vergangenen Jahren weltweit disziplinspezifische Forschungsdaten-Infrastrukturen aufgebaut, an denen sich auch Forschende der TU Berlin beteiligen. Inzwischen existiert eine große Anzahl fachspezifischer Repositorien. Diese können im Vergleich zu DepositOnce durchaus Vorteile bieten, wie z.B. fachspezifische Metadatenschemata und spezifische Suchmöglichkeiten. In den Fällen, in denen Sie als Mitglied der TU Berlin bereits ein Repositorium Ihrer Fach-Community nutzen, sollten Sie dies weiterhin tun. Ebenfalls, wenn es sinnvoll erscheint, die Forschungsdaten in einem fachspezifischen Repositorium zu veröffentlichen und ein solches für Ihre Disziplin existiert. Darüber hinaus besteht die Möglichkeit, Daten in speziellen Data Journals zu publizieren. In einigen Disziplinen ist auch die Veröffentlichung von Daten als Supplement zum wissenschaftlichen Artikel etabliert. Diese Form der Datenpublikation hat jedoch den Nachteil, dass die Daten nur über den Artikel gefunden werden können und keine eigenständigen, zitierfähigen Publikationsobjekte bilden.

Bei der Wahl eines fachspezifischen Repositoriums sollten folgende Kriterien beachtet werden: Langzeitverfügbarkeit (mindestens 10 Jahre), Vergabe von persistenten Identifikatoren (z.B. DOI, URN), Lizenzen und Nutzungsrechte der Daten, Bekanntheit und Sichtbarkeit, Kosten. Auf der Suche nach einem geeigneten fachspezifischen Repositorium für Ihre Forschungsdaten bietet das Portal re3data.org einen guten Überblick mit umfangreichen Such- und Filterfunktionen. Bei Fragen zu DepositOnce und zu Repositorien steht Ihnen das SZF-Team zur Verfügung.

Die Veröffentlichung von Forschungsdaten sollte so zeitnah wie möglich erfolgen. Liegen triftige Gründe vor, können Daten in DepositOnce mit einer Sperrfrist (Embargo) versehen werden. In diesem Fall werden nur die Metadaten veröffentlicht; die Daten selbst sind im Repositorium gesichert, jedoch erst nach Ende der Sperrfrist zugänglich. Während der Sperrfrist können die Daten von Interessierten per E-Mail angefragt werden. Die Festlegung der Sperrfrist erfolgt durch die verantwortlichen Forschenden, wobei es gilt, die Vorgaben und Richtlinien der Forschungsförderer und Repositorien zu beachten. Embargoperioden sollten eine Dauer von maximal 5 Jahren nach Projektende nicht überschreiten. Ein Embargo ist zu begründen, z.B. in einer Datei im Repositorium, die auch das Ende des Embargos benennt.