Zugang zu Forschungsergebnissen in den Lebenswissenschaften

Grundsätzlich ist eine vollständige Veröffentlichung von Ergebnissen anzustreben, da auf der Grundlage eines umfassenden Bildes bereits erarbeiteter Ergebnisse korrekte Zusammenhänge und neue Erkenntnisse zielgerichteter und ressourcenschonender gewonnen werden können. Bei der Bewertung von Ergebnissen sollte deren sorgfältige Beschreibung und Validität in den Mittelpunkt gestellt werden.

Um sicherzustellen, dass inhaltlich sinnvolle Einheiten publiziert werden, ist bei der Planung von Publikationen die Qualität einer Publikation in den Mittelpunkt zu stellen. Bei der Darstellung der eigenen Publikationsleistung ist darauf zu achten, nur eine überschaubare Auswahl an Arbeiten aufzuführen.

Die Berücksichtigung der FAIR-Prinzipien im Umgang mit Forschungsdaten ist in den kooperationsorientierten Lebenswissenschaften besonders zentral, um die Nachvollziehbarkeit und die Nachnutzungsmöglichkeiten von Ergebnissen zu gewährleisten. Die Beantwortung vieler Fragestellungen in den Lebenswissenschaften basiert auf der Auswertung komplexer Datensätze bzw. auf der Modellierung von Prozessen auf der Grundlage von Datensätzen. Häufig können nur so komplexe, übergeordnete Zusammenhänge verstanden werden. Die Umsetzung der FAIR-Prinzipien ist ressourcen- und zeitintensiv. Aufgrund der hohen Vielfalt an Datentypen, die durch die methodisch-technische Dynamik noch erhöht wird, sind Wissenschaftler*innen häufig auf die Unterstützung durch und Expertise in Forschungsdatenzentren angewiesen. Dies gewährleistet auch die nationale und internationale Anschlussfähigkeit und Verknüpfbarkeit der Datensätze. Es empfiehlt sich bereits in der Planungsphase von Projekten, entsprechende Überlegungen anzustellen, um die personellen und finanziellen Ressourcen berücksichtigen zu können.       

Insbesondere bei klinischen Fragestellungen können Datenschutzaspekte beim Zugang zu oder bei der gemeinschaftlichen Nutzung von Datensätzen eine Rolle spielen. Etablierte Pseudonymisierungsansätze und Technologien zur Evaluierung des Re-Anonymisierungsrisikos sollten in diesen Fällen Anwendung finden. In vielen Fällen wird eine Arbeit mit anonymisierten Datensätzen möglich sein, um die Fragestellung zu beantworten.

In den Lebenswissenschaften sind Forschungsdaten sehr häufig sehr eng mit Materialien, Geweben oder Organismen verknüpft. Der Zugang zu diesen ist für die Nachvollziehbarkeit und Anschlussfähigkeit der Erkenntnisse häufig gleichermaßen relevant. Entsprechend anerkannte und zertifizierte Archive, Sammlungen oder Biobanken sollten daher genutzt werden, um die zentralen Materialen, Gewebe oder Organismen aus Projekten standardisiert und qualitativ bestmöglich verfügbar zu halten. Die hierfür notwendigen zeitlichen und finanziellen Ressourcen sollten bereits bei der Projektplanung bedacht werden. Besonders relevant ist dies bei mikrobiologischen Stämmen oder humanem Material.

Liegen Forschungsergebnisse in Form von Software, eines Modells oder einer Simulation vor oder wurden Methoden des maschinellen Lernens verwendet, ist es herausfordernd alle für die Nachvollziehbarkeit und Anschlussfähigkeit notwendigen Informationen zur Verfügung zu stellen. Bei Software empfiehlt es sich, z. B. durch Containerisierung und Einbindung in Frameworks wie Bioconductor die Nachnutzung zu erleichtern. Wann immer möglich und zumutbar, ist der Quellcode offenzulegen. Ergebnisse aus Prozessen des maschinellen Lernens können mit der Veröffentlichung der Trainingsdatensätze besser nachvollzogen und nachgenutzt werden.

Hilfreiche Hinweise zur Nachnutzbarkeit von Forschungssoftware auf bioconductor.org(externer Link)