Forschungsdaten: Aufbau von "Mikrodatenzentrum" ab 1. Jänner geplant
Die angekündigte Forschungsdaten-Plattform bei der Statistik Austria soll ab 1. Jänner 2022 aufgebaut werden, erklärte Bildungsminister Heinz Faßmann (ÖVP) am Rande der Alpbacher Technologiegespräche. Eine nach der kürzlich abgelaufenen Begutachtungsphase adaptierte Fassung des Gesetzes soll im Herbst vorliegen. Mitte 2022 könnten dann erste Forschungsfragen beantwortet werden, hieß es seitens des Statistik Austria-Generaldirektors Tobias Thomas.
Das "Austrian Micro Data Center" (AMDC) wurde bereits im Regierungsprogramm angekündigt. Die Grundidee besteht darin, dass über die bei der Statistik Austria angesiedelte neue Plattform jene öffentlichen "Register", die dort schon ausgewertet werden, auch für die Grundlagenforschung zur Verfügung stehen. Dazu braucht es Änderungen im Bundesstatistikgesetz und Forschungsorganisationsgesetz, die nun im Herbst umgesetzt werden sollen. Zur tatsächlichen Einrichtung benötige die Statistik Austria dann noch rund ein halbes Jahr, so Thomas.
So könnten dann "untadelige" Forschungsorganisation, wie Universitäten oder die Akademie der Wissenschaften (ÖAW) und andere zugelassene Einrichtungen Informationen aus dem Melderegister oder etwa dem Bildungsstandregister für ihre Forschung verwenden. Die Statistik Austria stellt im ersten Schritt die von ihr selbst erhobenen Informationen für die Forschung zur Verfügung. In weiterer Folge könnten zusätzliche staatliche Datenbanken folgen.
Beteiligung weiterer Ministerien
Würden auch Daten aus der Elektronischen Gesundheitsakte (ELGA) einfließen, wäre dafür eine eigene Verordnung des Wissenschaftsministeriums - in dem Fall gemeinsam mit dem Gesundheitsministerium - nötig. Mit dem seitens der Forschungsgemeinde lange geforderten Vorstoß wolle man auch Ministerien, die relevante Daten beherbergen, auffordern - der Minister sprach wörtlich von "challengen", sich zu beteiligen.
Durch entsprechende Sicherheitsstandards will die Statistik Austria gewährleisten, dass die Wissenschafter damit beispielsweise den Einfluss unterschiedlicher Bildungsverläufe auf die jeweiligen Arbeitsmarktkarrieren analysieren können, ohne dabei Rückschlüsse auf einzelne Personen anstellen zu können. Identitätsdaten werden durch Personenkennzeichen ersetzt.
Stellt eine unabhängige Forschungsinstitution, die auf dem Niveau einer Universität forscht, einen Antrag mit einer konkreten Forschungsfrage, erstellt die Statistik Austria einen speziell zugeschnittenen "Datenkörper", erklärte Thomas. Diese Informationen seien dann "anonymisiert" und werden in einem "virtuellen, geschützten Arbeitszimmer" nur dem Antragsteller zur Verfügung gestellt. Für letzteren müsse die Forschungseinrichtung sozusagen bürgen.
Daten bleiben auf Servern der Statistik Austria
Die Daten verlassen die Server der Statistik Austria zu keinem Zeitpunkt, versicherten Faßmann und Thomas. Die Berechnungen machen die Wissenschafter per Fernzugriff. Danach erfolge auch noch eine "Outputkontrolle". Hier wird nochmals überprüft, dass sich die Resultate nicht auf Einzelpersonen zurückführen lassen, bevor sie etwa in Fachjournalen publiziert werden.
Kein Forscher wolle "wissen, was Herr Müller oder Frau Mayer macht", betonte Thomas. Es gehe um Erkenntnisse in größerem Rahmen, wo sich Ursache und Wirkung möglichst gesichert abschätzen lassen. Etwaiger Missbrauch würde in den Straftatbestand des "Amtsmissbrauchs" fallen, eine Sperre und entsprechend hohe Strafandrohungen zur Folge haben.
Bei dem Vorhaben handle es sich um einen "Meilenstein" für die heimische Forschung, die bisher bei vielen Fragestellungen auf Daten aus dem Ausland angewiesen war. In einer hoffentlich folgenden "Medizindatenstelle" als möglichen zukünftigen Teil des AMDC könnte man dann etwa auch Fragen zu Nebenwirkungen von Medikamenten beantworten. Man könnte abschätzen, bei welchen Patientengruppen etwa teure Behandlungen aus dem Bereich der personalisierten Medizin nicht erfolgsversprechend sind, umriss der Komplexitätsforscher Stefan Thurner, Chef des Complexity Science Hub (CSH) Vienna, Anwendungsmöglichkeiten.
Datentechnischer "Blindflug" in der Pandemie
Nicht zuletzt wären diese Möglichkeiten in der Pandemie äußerst hilfreich - oder hilfreich gewesen, denn Forscher bemängelten hier oftmals einen datentechnischen "Blindflug". So könne man hierzulande ohne verteilt in verschiedensten Organisationen lagernde Registerdaten noch immer nicht beantworten, wie das Covid-19-Infektionsrisiko etwa mit der Arbeitstätigkeit in verschiedenen Wirtschaftssektoren oder in bestimmten soziökonomischen Umfeldern aussieht. Selbst um Infektionszahlen oder Spitalsaufnahmen unter Geimpften und Nicht-Geimpften schwirren immer noch Fragezeichen.
Auch die viel beachteten Langzeitfolgen von Covid-19 "kann man nicht abschätzen ohne Registerdaten", sagte Thurner. Beim AMDC und seinen möglichen weiteren Ausbaustufen gehe es also darum, "Daten für die Gesellschaft nutzbar zu machen" und "kollektiv etwas zu lernen", so der Komplexitätsforscher.