FLIGHT
FLIGHT - Federated Learning-Guided digital Health
Prostatakrebs ist die zweithäufigste Krebserkrankung in Deutschland und die dritthäufigste bei Männern weltweit. Um den Schweregrad des Tumors und optimale Behandlungsoptionen zu identifizieren, werden “Tissue Microarrays” (TMAs) aus der Prostata des Patienten entnommen und mit Hämatoxylin und Eosin (H&E) gefärbt. Ein Pathologe bewertet daraufhin das Erscheinungsbild des Gebwebes nach dem Gleason-Grading-System. Gleason-Muster sind jedoch sehr subjektiv und die Einstufung kann zwischen Pathologen erheblich variieren. Daher ist ein Computer-Aided-Decision-Support-System wünschenswert, das von der Identifizierung von Gleason-Mustern losgelöst arbeitet.
Für die KI-basierte Survival- oder Time-to-Event-Vorhersage von Prostatakrebspatienten hat das Institut für Medizinische Systembiologie (PI Bonn) die de facto führende Analysemethode eCaReNet (Explainable Cancer Relapse Prediction Network) entwickelt. Es ist ein “End-to-End” trainiertes neuronales Netzwerk, das TMA-Spots als Eingabe verwendet und die Wahrscheinlichkeit eines rezidivfreien Überlebens über die Zeit ausgibt.
Da biomedizinische Daten eine hohe biologische Variabilität aufweisen können, sind große Stichprobengrößen erforderlich, um möglichst exakte KI-Modelle zu trainieren. Die begrenzte Patientenverfügbarkeit pro Institution und Datenschutzbestimmungen erschweren es jedoch, solche Datenmengen zu akquirieren.
Um die Zugänglichkeit biomedizinischer Daten unter Einhaltung der Vorschriften zu personenbezogenen Daten zu verbessern, schlagen wir vor, KI-Modelle auf verteilten Datensätzen unter Verwendung von Techniken zur Verbesserung der Privatsphäre wie Federated Learning (FL) und Secure Multi-Party Computation (SMPC) zu trainieren. FL impliziert kollaboratives Modelltraining auf dezentralisierten Daten, die verschiedenen Teilnehmern gehören. Dies geschieht durch den Austausch von Modellparametern, die aus lokalen Daten berechnet werden. In SMPC werden alle Berechnungen auf dem geheimem geteiltem Anteil der Daten durchgeführt, so dass keine Partei private Daten wiederherstellen kann, die einer anderen Partei gehören.
Dieses neuartige Tool wird über die von PI Baumbach entwickelte Plattform FeatureCloud öffentlich zugänglich gemacht. Die Leistungsfähigkeit föderierter KI-Modelle wird anhand eines Datensatzes der Abteilung für Pathologie (PI Sauter) des UKE evaluiert. Dieser Datensatz besteht aus Bildern von mehr als 17.000 Patienten und enthält mehrere Unterdatensätze, um die Generalisierbarkeit zu bewerten, was ihn ideal für eine realistische Simulation einer multizentrischen Studie macht.
Mit der Entwicklung gemeinsamer föderierter KI-Ansätze können wir uns vorstellen, dass FLIGHT die Blaupause für kollaboratives Lernen an sensiblen oder zu großen Datensätzen über viele Institutionen und Zentren in Hamburg hinweg wird.
Leitung:
Stefan Bonn, Zentrum für Molekulare Neurobiologie (ZMNH), Institut für Medizinische Systembiologie
Jan Baumbach, Zentrum für Bioinformatik, Computational Systems Biology
Guido Sauter, Institut für Pathologie mit den Sektionen Molekularpathologie und Zytopathologie