12.04.2022
COVID-19

Forschungsdaten stehen zur Nutzung bereit

Anonymer Datensatz von NAPKON fertiggestellt

Prof. Dr. Janne Vehreschild, Foto: Michael Wodak
Prof. Dr. Janne Vehreschild, Foto: Michael Wodak

Das Nationale Pandemie Kohorten Netz (NAPKON) – ein Teilprojekt des Forschungsnetzwerks der Universitätsmedizin zu COVID-19 (NUM) – dokumentiert seit November 2020 in einer bundesweit angelegten Studie Daten von mit SARS-CoV-2 infizierten Patienten, um die Viruserkrankung umfassend zu erforschen. Die Forschungsergebnisse sollen wichtige Beiträge zur Bewältigung der Pandemie und zum Verständnis der Erkrankung sowie ihrer Behandlungsmöglichkeiten leisten. Nun wurde ein anonymer Datensatz öffentlich zur Verfügung gestellt, mit dem sich sowohl projektinterne als auch -externe Wissenschaftler einen Überblick verschaffen können, ob die Zusammensetzung der Daten sich für die Bearbeitung ihrer eigenen Forschungsfragen eignet.

COVID-19 ist eine komplexe Infektionskrankheit. Nur eine entsprechend große und repräsentative Anzahl von Studienteilnehmenden kann zu gesicherten und eindeutigen wissenschaftlichen Erkenntnissen führen. Dies setzt große planerische und logistische Anstrengungen voraus, deswegen setzt NAPKON auf Kooperation. In der NAPKON-Studie arbeiten bundesweit 68 Standorte zusammen, um die Untersuchungsergebnisse in eine gemeinsame Datenbank einzuspeisen und in einem standardisierten Verfahren Bioproben zu sammeln. „Wir sind den Patientinnen und Patienten und den Standorten dankbar, dass sie diese umfassende COVID-19-Studie ermöglichen. Im Vordergrund steht der kooperative Gedanke. Deswegen können sich auch externe Wissenschaftlerinnen und Wissenschaftler um die Nutzung der NAPKON-Daten bewerben“, sagt Univ.-Prof. Dr. Janne Vehreschild, Sprecher von NAPKON und Infektiologe an der Uniklinik Köln und dem Universitätsklinikum Frankfurt.

Der anonyme Datensatz wurde entwickelt, um einen Überblick des Patienten-Kollektivs von NAPKON öffentlich zur Verfügung zu stellen. Er besteht aus 15 Variablen, die demographische Daten und den klinischen Verlauf von COVID-Patienten, sowie das Outcome nach drei Monaten beschreiben. Der Datensatz dient einerseits dazu, Machbarkeits-Abfragen für Forschungsprojekte durchzuführen.  Gleichzeitig werden auf der NAPKON-Website kleinere Analysen graphisch dargestellt, die beispielsweise die Hospitalisierungs-, die Mortalitäts- und die Intensivtherapierate eines Patienten-Kollektivs, das über Deutschland verteilt unterschiedliche Gesundheitssektoren abdeckt, anzeigen. „Die zugrundeliegende Idee ist es, die NAPKON-Kohorten sichtbar zu machen. So gewinnen Wissenschaftlerinnen und Wissenschaftler einen guten Überblick über das Gesamtkollektiv von NAPKON. Gleichzeitig freuen wir uns, mit dem öffentlichen Datensatz den Gedanken der offenen Wissenschaft, der sogenannten Open Science, fördern zu können“, erläutert Sina Hopff, Ärztin und wissenschaftliche Mitarbeiterin in NAPKON.

Univ.-Prof. Dr. Fabian Prasser, Medizininformatiker an der Charité – Universitätsmedizin Berlin und am Berlin Institute of Health (BIH) in der Charité, ist auf den medizinischen Datenschutz spezialisiert und hat bei der Entwicklung der Anonymisierungspipeline für den öffentlichen NAPKON-Datensatz eine wichtige beratende Funktion eingenommen: „Wir entwickeln seit vielen Jahren Anonymisierungssoftware, weil die Forschung erheblich von der Auswertung großer Datenmengen profitiert. Ich freue mich sehr, dass wir damit nun die Erforschung von COVID-19 unterstützen und auch die Teilhabe der Öffentlichkeit an Forschungsprojekten verbessern können."

Um die Daten der Patienten maximal zu schützen, wurde eine Anonymisierungspipeline entwickelt, die Angriffe durch Aussonderung, Verknüpfbarkeit und Schlussfolgerungen verhindert. „Aussonderung“ bezieht sich hierbei auf die Möglichkeit, einige oder alle Daten zu isolieren, die eine Person im Datensatz identifizieren, „Verknüpfbarkeit“ auf die Möglichkeit, mindestens zwei Beobachtungen zu verknüpfen, die dieselbe spezifische Person oder eine spezifische Gruppe von Personen betreffen und „Schlussfolgerungen“ betrifft die Möglichkeit, mit erheblicher Wahrscheinlichkeit den Wert eines Attributs aus den Werten einer Reihe von anderen Attributen abzuleiten. Damit ist das Risiko einer Reidentifizierung der Teilnehmenden bestmöglich minimiert. Das Datenschutzkonzept der NAPKON Anonymisierungspipeline ist auf der NAPKON Website einsehbar.

NAPKON ist eines der Verbundprojekte des Netzwerks Universitätsmedizin (NUM), gefördert vom Bundesministerium für Bildung und Forschung (BMBF) und sammelt umfassende, qualitätsgesicherte Daten, Bilddaten und Bioproben von COVID-19-Patienten als nationale prospektive Kohortenstudie zur detaillierten Abbildung des Akut- und Langzeitverlaufs. Die Rekrutierung der Patienten erfolgt an fast allen deutschen Universitätskliniken, aber auch an regionalen außeruniversitären Kliniken und in niedergelassenen Arztpraxen. NAPKON zeichnet sich im internationalen Vergleich durch die Kombination von drei unterschiedlichen Kohorten aus, die die Erkrankung aus unterschiedlichen Blickwinkeln abbilden und somit eine besondere Datentiefe liefern. Die gesammelten Daten und Bioproben können von interessierten – auch Projekt externen - Wissenschaftler in einem Open Use & Access-Verfahren angefordert werden.

Nach oben scrollen