Hintergrund
Die Gesundheit zu verbessern und vorausschauende Maßnahmen gegen (neu) auftretende Infektionskrankheiten zu entwickeln ist eines der Einzelziele des Horizon 2020 Programms – „Gesundheit, demographischer Wandel und Wohlergehen“. Mit SARS-CoV-2 ist erneut ein Erreger aufgetreten, zu dessen besseren Erforschung dem Ziel der Bekämpfung der Pandemie weltweit zahlreiche Projekte und Initiativen ins Leben gerufen wurden. Allein an der Medizinischen Hochschule Hannover (MHH) sind im Rahmen der Forschung im Kontext des SARS-CoV-19-Erregers MHH insgesamt 114 Projekte (17 klinische Studien) aus 43 Abteilungen gestartet worden (Stand 08.02.21). (Eine öffentliche Übersicht ausgewählter Projekte.)
In der Pandemiebekämpfung ist zeitkritisches Handeln entscheidend. Neben der schnellen Generierung großer Datenmengen und der zeitnahen Verarbeitung stellt auch die stark gestiegene institutsübergreifende Kollaboration eine enorme Anforderung an das derzeitige Speichersystem. Aktuell beziehen die COVID-Projekte die IT-Ressourcen über die aktuell verfügbaren IT-Ressourcen an der MHH. Die große Zahl der COVID-Projekte steht nicht im Verhältnis zum geplanten Wachstum der IT-Ressourcen. Derzeit können die verfügbaren IT-Ressourcen den Bedürfnissen an IT-Ressourcen aus den COVID-Projekte kaum zufriedenstellend erfüllen.

Ziele
Das Ziel des Vorhabens ist der Aufbau und die Erweiterung der derzeitigen
IT-Forschungsinfrastruktur an der MHH. Die geplante anwendungsgetriebene IT-Struktur soll den Forschenden der zahlreichen COVID-Projekten einen einfachen Zugang zu erhöhten Rechenkapazitäten, Speicher und Anwendungen für datengetriebene Forschungsprojekte ermöglichen. Die Erweiterung ist erforderlich, da zahlreiche Forschungsprojekte im Rahmen der COVID-19-Forschung (XHale, diverse NUM-Projekte u.a. CODEX, RACOON, NAPKON, Covid19-Bioprobenregister) und mehr als 100 weitere Projekte und Studien an der MHH seit 2020 begonnen wurden.
Die einzelnen Sars-CoV-2-Forschungsprojekte haben neben der Datenerzeugung und -gewinnung das Management und die Auswertung von Daten zur Folge. Um weiterhin eine verlässliche und bedarfsgerechte IT-Infrastruktur bereitstellen zu können, stellt InDaCo („Infrastruktur für Datengetriebene Corona-Forschung“) die Durchführung und den Erfolg aktueller und zukünftiger innovativer Forschungsprojekte an der MHH und weiteren Kooperationspartnern durch Aufstockung der IT-Ausstattung sicher. Ein besonderer Fokus liegt dabei auf der Entwicklung von Methoden sowohl der Datenanalyse als auch des maschinellen Lernens. Diese sollen in anspruchsvollen Bereichen - etwa bei der Kombination von klinischen Daten mit molekularen Befunden oder der automatisierten Analyse und Befundung medizinischer Bilddaten - eingesetzt werden und sowohl für grundlagenwissenschaftliche als auch für translationale Ansätze zuverlässige und reproduzierbare Daten liefern.
Es ist ein besonderes Speicherkonzept erforderlich, das den Anforderungen an die zeitgemäße Datenverarbeitung im Forschungsbereich standhält. Zusätzlich soll durch den Einsatz innovativer anwendungsgetriebener Methoden ein nachhaltiges Speicherkonzept angeboten werden, das neben der reinen Ablage, eine intelligente Leistungszuweisung zu besonders oft angefragten Daten ermöglicht. Ein einfach zu bedienendes Zugriffskonzept soll die Fähigkeit zur Kollaboration steigern. Schnittstellen zum geplanten Forschungsdatenmanagement bieten ein unterstützendes Fundament im Forschungsdatenlebenszyklus.
Die Innovationspotentiale dieses Infrastruktur-Projekts sind folgenden Teilzielen zugeordnet:
Teilziel | Wie | Innovationspotential im Rahmen der COVID-19-Bekämpfung |
Erleichterung des Zugangs hoher Rechenleistung | Adäquate Virtualisierungs-infrastruktur und einfacher Zugang | u.A. Grundlage zur Entwicklung innovativen Methoden der künstlichen Intelligenz |
Nachhaltiges Speicherkonzept durch innovative Methoden | Intelligentes Speichersystem und Fähigkeit zusätzliche Metadaten zu Forschungsdaten zu speichern | Unterstützung Lebenszyklus für Forschungsdaten Einfacher Zugang zu Daten, transparente Sichtbarkeit und Zugriffskonzept zur Wiederverwendung bereits vorhandener Forschungsdaten |
Nachhaltige Verwendung von Forschungsdaten | Unterstützung des Forschungsdatenmanagements der MHH Bibliothek | „open Data“ als Initiative für transparente Forschung verhilft zu einer nachvollziehbareren und zielgerichteten Analyse von Forschungsarbeiten und einer verbesserten Pandemiebekämpfung |
Verbesserte Kollaboration- und Transfer | Ausbau adäquater Netzwerkkapazitäten und leistungsfähige Vernetzung der Komponenten | Fundament für neuartige Großgeräte in der Spitzenforschung auf dem Campus |
Standardisierte Datenverarbeitung und Interoperabilität großer Datenmengen | Harmonisierte Datenstrukturen (z. B. den GECCO-Datensatz) und einheitliche Kodierung (z. B. LOINC, SNOMED) | Beschleunigte und Vereinfachte Datenanalyse durch Fähigkeit Daten europaweit länderübergreifend eindeutig interpretierbar zusammenzuführen |
Umsetzung
Für verschiedene Forschungs-Teams in der MHH wird eine erweiterbare KI-/ML-Compute-Clusterlösung benötigt. Mit den Fördermitteln aus der EFRE-Förderung soll zunächst die heute vorhandene Infrastruktur um einen „VMware Cluster“ und sowie eine „IBM-Spectrum-Scale Storage Lösung“ ergänzt werden.
Das Projekt wird geleitet von Frau Dr. Apfel-Starke.
Die Projektleitung wird von einem Team aus fünf Personen aus dem Zentrum für Informationsmanagement unterstützt. Drei Fachinformatiker für Systemintegration werden an Bewerkstelligung der Implementation der IT-Infrastruktur zuständig. Weitere Personen übernehmen die Einrichtung, Anwendungsbetreuung, fachliche Beratung und steuern die Anforderung aus den Forschungsprojekten zur Umsetzung gemeinsam mit der Abteilung Basissysteme. Zusätzlich steuern Mitarbeiter die Zugänge zu den IT-Ressourcen und begleiten die Forschungsprojekte IT-seitig.
Ansprechpartner
Dr. Johanna Apfel-Starke
Projektleitung
MHH Information Technology
Medizinische Hochschule Hannover (MHH)
OE8780, Carl-Neuberg-Str. 1, 30625 Hannover, Deutschland