Teaserbild mit Vernetzungen zwischen Neuronen und dem Logo der Förderung durch EFRE

InDaCo

Infrastruktur für Datengetriebene Corona-Forschung

Hintergrund

Die Gesundheit zu verbessern und vorausschauende Maßnahmen gegen (neu) auftretende Infektionskrankheiten zu entwickeln ist eines der Einzelziele des Horizon 2020 Programms – „Gesundheit, demographischer Wandel und Wohlergehen“. Mit SARS-CoV-2 ist erneut ein Erreger aufgetreten, zu dessen besseren Erforschung dem Ziel der Bekämpfung der Pandemie weltweit zahlreiche Projekte und Initiativen ins Leben gerufen wurden. Allein an der Medizinischen Hochschule Hannover (MHH) sind im Rahmen der Forschung im Kontext des SARS-CoV-19-Erregers MHH insgesamt 114 Projekte (17 klinische Studien) aus 43 Abteilungen gestartet worden (Stand 08.02.21). (Eine öffentliche Übersicht ausgewählter Projekte.)

In der Pandemiebekämpfung ist zeitkritisches Handeln entscheidend. Neben der schnellen Generierung großer Datenmengen und der zeitnahen Verarbeitung stellt auch die stark gestiegene institutsübergreifende Kollaboration eine enorme Anforderung an das derzeitige Speichersystem. Aktuell beziehen die COVID-Projekte die IT-Ressourcen über die aktuell verfügbaren IT-Ressourcen an der MHH. Die große Zahl der COVID-Projekte steht nicht im Verhältnis zum geplanten Wachstum der IT-Ressourcen. Derzeit können die verfügbaren IT-Ressourcen den Bedürfnissen an IT-Ressourcen aus den COVID-Projekte kaum zufriedenstellend erfüllen.


InDaCo baut auf bereits existierenden EU- und CoVId-Projekten auf mi dem Ziel, die Verarbeitung großer Datenmengen zu standardisieren und Interoperabilität zu fördern. InDaCo hat eine verbesserte Kollaboration, leichteren Zugang zu Rechenleistungen, ein nachhaltiges Speicherkonzept und die nachhaltige Verwendung von Forschungsdaten zum Ziel (FAIR-Prinzipien). Hierfür wird auf Grundsteine aus früheren Arbeiten zurückgegriffen.

Ziele

Das Ziel des Vorhabens ist der Aufbau und die Erweiterung der derzeitigen

IT-Forschungsinfrastruktur an der MHH. Die geplante anwendungsgetriebene IT-Struktur soll den Forschenden der zahlreichen COVID-Projekten einen einfachen Zugang zu erhöhten Rechenkapazitäten, Speicher und Anwendungen für datengetriebene Forschungsprojekte ermöglichen. Die Erweiterung ist erforderlich, da zahlreiche Forschungsprojekte im Rahmen der COVID-19-Forschung (XHale, diverse NUM-Projekte u.a. CODEX, RACOON, NAPKON, Covid19-Bioprobenregister) und mehr als 100 weitere Projekte und Studien an der MHH seit 2020 begonnen wurden.

Die einzelnen Sars-CoV-2-Forschungsprojekte haben neben der Datenerzeugung und -gewinnung das Management und die Auswertung von Daten zur Folge. Um weiterhin eine verlässliche und bedarfsgerechte IT-Infrastruktur bereitstellen zu können, stellt InDaCo („Infrastruktur für Datengetriebene Corona-Forschung“) die Durchführung und den Erfolg aktueller und zukünftiger innovativer Forschungsprojekte an der MHH und weiteren Kooperationspartnern durch Aufstockung der IT-Ausstattung sicher. Ein besonderer Fokus liegt dabei auf der Entwicklung von Methoden sowohl der Datenanalyse als auch des maschinellen Lernens. Diese sollen in anspruchsvollen Bereichen - etwa bei der Kombination von klinischen Daten mit molekularen Befunden oder der automatisierten Analyse und Befundung medizinischer Bilddaten - eingesetzt werden und sowohl für grundlagenwissenschaftliche als auch für translationale Ansätze zuverlässige und reproduzierbare Daten liefern.

Es ist ein besonderes Speicherkonzept erforderlich, das den Anforderungen an die zeitgemäße Datenverarbeitung im Forschungsbereich standhält. Zusätzlich soll durch den Einsatz innovativer anwendungsgetriebener Methoden ein nachhaltiges Speicherkonzept angeboten werden, das neben der reinen Ablage, eine intelligente Leistungszuweisung zu besonders oft angefragten Daten ermöglicht. Ein einfach zu bedienendes Zugriffskonzept soll die Fähigkeit zur Kollaboration steigern. Schnittstellen zum geplanten Forschungsdatenmanagement bieten ein unterstützendes Fundament im Forschungsdatenlebenszyklus.


Die Innovationspotentiale dieses Infrastruktur-Projekts sind folgenden Teilzielen zugeordnet:

Teilziel

Wie

Innovationspotential im Rahmen der COVID-19-Bekämpfung

Erleichterung des Zugangs hoher Rechenleistung

Adäquate Virtualisierungs-infrastruktur und einfacher Zugang

u.A. Grundlage zur Entwicklung innovativen Methoden der künstlichen Intelligenz

Nachhaltiges Speicherkonzept durch innovative Methoden

Intelligentes Speichersystem und Fähigkeit zusätzliche Metadaten zu Forschungsdaten zu speichern

Unterstützung Lebenszyklus für Forschungsdaten

Einfacher Zugang zu Daten, transparente Sichtbarkeit und Zugriffskonzept zur Wiederverwendung bereits vorhandener Forschungsdaten

Nachhaltige Verwendung von Forschungsdaten

Unterstützung des Forschungsdatenmanagements der MHH Bibliothek

„open Data“ als Initiative für transparente Forschung verhilft zu einer nachvollziehbareren und zielgerichteten Analyse von Forschungsarbeiten und einer verbesserten Pandemiebekämpfung

Verbesserte Kollaboration- und Transfer

Ausbau adäquater Netzwerkkapazitäten und leistungsfähige Vernetzung der Komponenten

Fundament für neuartige Großgeräte in der Spitzenforschung auf dem Campus

Standardisierte Datenverarbeitung und Interoperabilität großer Datenmengen

Harmonisierte Datenstrukturen (z. B. den GECCO-Datensatz) und einheitliche Kodierung (z. B. LOINC, SNOMED)

Beschleunigte und Vereinfachte Datenanalyse durch Fähigkeit Daten europaweit länderübergreifend eindeutig interpretierbar zusammenzuführen

Umsetzung

Für verschiedene Forschungs-Teams in der MHH wird eine erweiterbare KI-/ML-Compute-Clusterlösung benötigt. Mit den Fördermitteln aus der EFRE-Förderung soll zunächst die heute vorhandene Infrastruktur um einen „VMware Cluster“ und sowie eine „IBM-Spectrum-Scale Storage Lösung“ ergänzt werden.

Das Projekt wird geleitet von Frau Dr. Apfel-Starke.

Die Projektleitung wird von einem Team aus fünf Personen aus dem Zentrum für Informationsmanagement unterstützt. Drei Fachinformatiker für Systemintegration werden an Bewerkstelligung der Implementation der IT-Infrastruktur zuständig. Weitere Personen übernehmen die Einrichtung, Anwendungsbetreuung, fachliche Beratung und steuern die Anforderung aus den Forschungsprojekten zur Umsetzung gemeinsam mit der Abteilung Basissysteme. Zusätzlich steuern Mitarbeiter die Zugänge zu den IT-Ressourcen und begleiten die Forschungsprojekte IT-seitig.