Umgang mit Forschungsdaten in den Geistes- und Sozialwissenschaften
In den Geistes- und Sozialwissenschaften können alle erzeugten bzw. bearbeiteten Dokumente, Materialien, Bilder, Audio- und Videoaufnahmen, Texte, Mess- und Auswertungsdaten im weitesten Sinn als Forschungsdaten aufgefasst werden. Sie stellen einen integralen Bestandteil der Forschungsergebnisse dar und sind sowohl für die Überprüfbarkeit als auch sehr häufig für die Nachnutzung für weitere Forschungen bedeutend (z. B. bei Quelleneditionen oder bei sozialwissenschaftlichen Längsschnittstudien).
Daten, die aus geistes- und sozialwissenschaftlichen Forschungen hervorgehen, können in sehr vielen Fällen grundsätzlich nicht erneut erzeugt werden (Unwiederholbarkeit) bzw. die Wiedergewinnung der Daten ist in praktischer Hinsicht kaum realisierbar. Im ersten Fall können Erhebungen politischer Einstellungen zu bestimmten Zeitpunkten oder Ausgrabungen archäologischer Fundkontexte als Beispiel dienen. Im zweiten Fall sind etwa umfangreiche und langwierige Texteditionen oder Dokumentationen von Museumsobjekten zu nennen, die sich kaum mehrfach durchführen oder finanzieren lassen.
Um eine phasenübergreifende Qualitätssicherung zu gewährleisten, ist in allen geistes- und sozialwissenschaftlichen Forschungsvorhaben, die in relevantem Umfang Forschungsdaten (im obigen Sinn) erzeugen oder bearbeiten, ein effektives und verlässliches Forschungsdatenmanagement wichtig. Mit der ansteigenden Bedeutung größerer Datenmengen nimmt auch der wesentliche Einfluss des Datenmanagements auf die Qualität der Forschungsergebnisse zu. Entsprechend sollte es gute wissenschaftliche Praxis der geistes- und sozialwissenschaftlichen Forschung sein, nicht nur dem Datenmanagement selbst die notwendige Aufmerksamkeit zu widmen, sondern auch den diesbezüglichen Beitrag von Wissenschaftler*innen als relevante Leistungsdimension zu würdigen. Individuelle wissenschaftliche Leistungen drücken sich nicht nur in Veröffentlichungen aus, sondern sind in wachsendem Maß mit der Aufbereitung von Forschungsdaten und auch der (Weiter-)Entwicklung von Forschungssoftware verbunden.
Auch wenn Forschungsdaten insgesamt in zunehmendem Umfang Bedeutung für die Forschung haben, können sie entsprechend der großen Vielfalt geistes- und sozialwissenschaftlicher Forschungsansätze und Projektkonstellationen eine sehr unterschiedliche Rolle spielen. Während bestimmte Vorhaben explizit darauf ausgerichtet sind, große Datenmengen zu gewinnen und aufzubereiten, sind in anderen Fällen nur gewisse Teile und Phasen der Forschungen (auch) mit der Auswertung von Daten verbunden. Obwohl sich der Aufwand stark unterscheiden kann, umfasst das Forschungsdatenmanagement stets die systematische Vorbereitung und Organisation des gesamten Umgangs mit Daten von der Erhebung, Bearbeitung, Dokumentation, Speicherung und Archivierung bis zur Bereitstellung für eine Nachnutzung. Daraus folgt, dass auch die mithilfe diverser (Software-)Werkzeuge durchgeführten Analyseschritte ein integraler Teil des Forschungsdatenmanagements sind.
Idealerweise können sich Forschungsprojekte an Standards und best practices orientieren, die auch von Fachgesellschaften oder anderen einschlägigen Organisationen oder Institutionen empfohlen werden. In den letzten Jahren haben einige Fachgesellschaften, aber auch Fachkollegien der DFG (externer Link) formuliert, die auch auf Besonderheiten der jeweils betroffenen Fächer und Forschungsansätze eingehen.
Die Daten sind verlässlich zu speichern (bzw. bei analogen Materialien zu lagern) und ggf. langfristig zu archivieren. Im Idealfall sollte neben der Sicherung der Daten – sofern nicht besondere Gründe dagegensprechen – auch ein externer Zugang zur Überprüfbarkeit und Nachnutzung für wissenschaftliche Zwecke ermöglicht werden. Wenn eine Nachnutzung möglich sein soll, darf der Zugang nicht auf eine reine „Ansicht“ der Daten beschränkt sein, sondern sollte eine Weiterbearbeitung nach den aktuellen Erfordernissen ermöglichen. Für die Archivierung und Nachnutzung sind jedoch grundlegende Vorüberlegungen notwendig. Zum einen ist zu entscheiden, was als „archivwürdig“ angesehen wird, zum anderen, welcher Aufwand realistisch betrieben werden kann und nicht zuletzt, welche rechtlichen Bestimmungen zu beachten sind.
In manchen Fällen ist die Archivierung und Bereitstellung der bearbeiteten Daten verpflichtend (etwa im Denkmalschutz) oder entspricht der Zielsetzung eines Vorhabens (z. B. Quelleneditionen). In diesen Fällen sind in der Regel dennoch Entscheidungen darüber zu treffen, in welchem Zustand (Versionierung) und wie vollständig sämtliche Daten des Forschungsprozesses mit zu erfassen sind. In vielen anderen Fällen muss bei der Entscheidung, ob und unter welchen Bedingungen Daten zur wissenschaftlichen Nachnutzung zur Verfügung gestellt werden sollen, die Nachfrage aus der wissenschaftlichen Community berücksichtigt werden, um das Verhältnis von Kosten und Nutzen der Datenaufbereitung und Dokumentation zur Weitergabe einzuschätzen.
Beispielsweise bei sozialwissenschaftlichen Langfristvorhaben wäre eine hohe Nachfrage nach den Daten zu erwarten. Darüber hinaus entscheidet sich oft an der Datenart bzw. dem Inhalt, ob sich die Daten zur Weitergabe eignen. Oft ist dies bei sensiblen Daten, insbesondere aus qualitativen Interviews oder bei Videodaten aus datenschutzrechtlichen Gründen problematisch, da die Anonymisierung dieser Daten schwerer umzusetzen ist bzw. durch die Anonymisierung wesentliche Informationen der Daten verloren gehen.
Wenn Daten zur Nachnutzung freigegeben werden, stellt sich die Frage nach der Lizenzvergabe. Unterschiedliche Nutzungslizenzen regeln, inwiefern die Daten durch Dritte genutzt werden dürfen, ob Daten z. B. nur gelesen oder auch verändert werden dürfen und zu welchem Zweck diese genutzt werden dürfen. Einen Überblick über verschiedene Nutzungslizenzen und die damit verbundenen Rechte gibt z. B. das Consortium of European Social Science Data Archives (Link siehe unten).
Schließlich kann die Erlaubnis zur Nachnutzung z. B. auch nur für die Untersuchung einer bestimmten Fragestellung gegeben werden und nicht generell für Analysen mithilfe des Datensatzes gelten. In diesem Zusammenhang können Datenproduzierende auch Sperrfristen für die Nachnutzung von Daten festlegen, um so z. B. die Veröffentlichung der aus dem Projekt erzielten Ergebnisse und den Abschluss von eventuellen Qualifikationsarbeiten zu sichern.
Grundsätzlich wäre zu erwarten, dass Forschende die Fragen, ob Archivierungs- und Bereitstellungspflichten bestehen, ob ein wissenschaftliches Interesse der Community an den Daten besteht, ob und in welchem Maße und in welcher Form die Daten sich zur Veröffentlichung eignen und zu welchem Zeitpunkt, für ein gegebenes Vorhaben individuell beantworten und den Umgang mit den Forschungsdaten auch entsprechend gestalten. Insbesondere bei sozialwissenschaftlichen Forschungsvorhaben ist es gute wissenschaftliche Praxis, dabei von Anfang an den Datenschutzanforderungen bei Untersuchungen an und mit Personen die notwendige Aufmerksamkeit zu schenken (siehe hierzu die aktuelle (externer Link)).