Dr. Algorithmus - wenn der Computer die Gesundheit checkt

Ein Zukunftszenario zur Rolle der künstlichen Intelligenz in der Medizin

Pixabay

Die Zukunftsreporter – Ihre Korrespondenten aus möglichen Welten, in denen wir leben werden oder leben wollen

Stellen wir uns doch einmal vor, morgen wäre der Tag Ihrer wichtigsten Untersuchung: der große Gesundheitscheck. Es ist ganz normal, dass Sie in der Nacht davor schlecht schlafen und den Appetit verlieren. Schließlich kennt jeder einen Freund, eine Freundin oder ein Familienmitglied, bei dem der Computer überraschend eine Krankheit entdeckt hat. Ein neu aufgelegtes Zukunftsszenario zur Rolle der künstlichen Intelligenz in der Medizin.


Seit ein paar Jahren ist die große Früherkennungsuntersuchung mit künstlicher Intelligenz (KI) für die meisten Menschen selbstverständlich. Die Gesellschaft hat sie akzeptiert. Erst zögerlich, aber als die Krankenkassen wie früher beim Zahnersatz auch für andere Krankheiten ein Belohnungssystem eingeführt haben, meldeten sich immer mehr Menschen für die große Vorsorgeuntersuchung. Manchmal bekommt man nur dann eine bessere Therapie, wenn man genügend Stempel auf dem Vorsorgeausweis gesammelt hat. Es ist ja auch nicht schwer: Online einen Termin vereinbaren, damit es keine Wartezeiten gibt. Wer will, kann zusätzlich noch einen Gesprächstermin mit der KI ausmachen. Das ist für Menschen wichtig, die Angst vor einer psychischen Störung haben. Es ist eine seltsame Vorstellung, aber der Computer kann besser zuhören als die meisten Menschen.

Alles beginnt mit der Untersuchung in der Röhre. Ein Großrechner wertet mit künstlicher Intelligenz die Ergebnisse des Scans im Computertomografen und im MRT aus. Bei der Untersuchung muss man eine Stunde stillliegen, bis die Analysegeräte den Körper von Kopf bis Fuß durchleuchtet haben. Dann wartet man 30 Minuten auf die Antwort des Algorithmus. Der Computer kennt Millionen Bilder von Organen im gesunden Zustand und in den verschiedenen Phasen der wichtigsten Erkrankungen. Manche Menschen verlassen das Untersuchungszimmer im öffentlichen Institut für Radiologie kreidebleich. Sie haben die Empfehlung bekommen, bald einen Arzt aufzusuchen. Diesen Moment beschreiben die Betroffenen später als schlimm, aber wir wissen, dass es ein heilsamer Moment ist.

In dringenden Fällen vereinbart der Rechner sofort einen Termin. Im dritten und vierten Stock des Instituts überprüft ein Arzt sofort das Ergebnis des Algorithmus und leitet weitere Untersuchungen ein. Für viele Betroffene ist dieser menschliche Kontakt noch ein kleiner Hoffnungsschimmer, aber fast immer bestätigen die Ärzte die Diagnose des Computers. Der menschliche Blick auf die Bilder des CT und des MRT ist längst schlechter als der des Dr. Algorithmus. Denn die künstliche Intelligenz wird ständig mit neuen Daten gefüttert, die Fehlerquote des Algorithmus liegt inzwischen bei einem Promille. Diese Zahl wird der Transparenz wegen jedes Jahr bekannt gegeben. Nur eine von tausend Diagnosen ist falsch. Ärzte bieten deshalb keine Vorsorge-Untersuchungen mehr an – sie haben Angst, verklagt zu werden, wenn sie etwas übersehen. Der Computer erkennt doppelt so viele Krankheiten wie ein Radiologe, der vor zehn Jahren sein Studium beendet hat. Das alles ist ein großer Fortschritt, denn Früherkennung ist wichtig. Manche Patienten haben an der Seitenwand des Instituts kleine, gravierte Metallschilder angebracht, die häufig nur ein Wort tragen: Danke.

Das Gespräch mit dem Rechner ist noch eine ungewohnte Situation. Der Computer stellt ein paar Fragen, aber er interessiert sich nicht für die Antworten. Viele Menschen glauben, dass sich eine Depression dadurch erkennen lässt, was ein Mensch sagt. Die Maschine ist da ganz anders. Sie analysiert nicht den Inhalt, sondern die Art und Weise, wie gesprochen wird. Der Rhythmus, die Tonlage und die Artikulation der Sprache geben Auskunft über die psychische Verfassung. Kaum jemand versteht, wie die Maschine das gesprochene Wort auswertet. Aber der Erfolg der Technik gibt ihr Recht, die Maschine ist objektiv. Viele Menschen verkrampfen bei dieser Untersuchung, Sie wissen nicht, wie sie sprechen sollen. Aber nach ein paar Jahren gewöhnt man sich daran.

Jeder Betrieb muss seinen Mitarbeitern zwei Tage frei geben, damit sie die „Jährliche“ machen können. Die „Jährliche“ - so heißt die Untersuchung im allgemeinen Sprachgebrauch. Psychologen werten diesen unverbindlichen Ausdruck, der sich eingebürgert hat, als Zeichen von Unsicherheit. Menschen tun sich schwer, über Unangenehmes zu sprechen. Früher sagte man, der Zustand ist "sehr ernst" und meinte den möglichen Tod. Aus dem gleichen Grund heißt es eben die „Jährliche“.

Die Firmen sollen zwei Tage freigeben, weil es zur Tradition geworden ist, dass die Menschen nach der Untersuchung eine Ü-40-Party feiern, sofern alles gut verlaufen ist. Wer auf der Bewertungsskala unter 40 Punkten bleibt, gilt in den Augen der Maschine als gesund. Ein befreiendes Gefühl. Wer 60 Punkte nicht überschreitet, muss sich keine großen Sorgen machen. Trotzdem ist die Anspannung in der Woche vor der Untersuchung so groß, dass ein Tag Erholung angemessen ist. Vor der „Jährlichen“ setzen die Betriebe gern Quartalsgespräche an, in denen Mitarbeiter über den Stand ihrer Projekte berichten. Das hat sich als notwendig erwiesen, weil manche Mitarbeiter nach der „Jährlichen“ erst nach mehreren Monaten an den Arbeitsplatz zurückkehren. Die Therapie hat eben Vorrang. 

Wissenschaftlicher Hintergrund

Keine Sorge: Die oben beschriebene Form der umfassenden Vorsorgeuntersuchung wird zwar gern als Zukunftsszenario aufgebaut. Aber nach Ansicht der Experten für künstliche Intelligenz im Gesundheitswesen wird es sie nie geben. Trotzdem spielt Dr. Algorithmus in der Arztpraxis eine wachsende Rolle. Lesen Sie im Folgenden von mehreren konkreten Projekten, wie lernende Algorithmen (künstliche Intelligenz) in der Medizin bereits eingesetzt werden.

Früherkennung von Hautkrebs

Eine Studie der Uni Heidelberg zeigt, dass künstliche Intelligenz durchaus zuverlässigere Diagnosen stellen kann als der Mensch. Das Team von Holger Haenssle verwendete ein von Google entwickeltes neuronales Netzwerk zur Früherkennung von Hautkrebs. Die Heidelberger trainierten das System mit mehr als 100.000 realen Fotos von auffälligen Leberflecken bei denen die Wissenschaftler wussten, ob sich daraus später Hautkrebs entwickelt hatte. Mit diesem Wissen schnitt der Algorithmus im Vergleich zu erfahrenen Dermatologen bei der Bewertung unbekannter Fotos sogar besser ab. Der Computer erkannte 95 Prozent der Melanome und fand damit mehr Krebsfälle als die Ärzte, die nur 89 Prozent entdeckten. Dabei konnten die Ärzte sogar auf zusätzliche Bilder zurückgreifen, so wie sie es in ihrem Praxisalltag auch tun würden. Alle teilnehmenden Dermatologen verfügten über mehrjährige Erfahrung bei der Erkennung von Hautkrebs. Die hat sicher nicht jeder Arzt. Der Einsatz der künstlichen Intelligenz könnte dafür sorgen, dass alle Patienten eine zuverlässigere Diagnose erhalten – unabhängig davon, wo sie wohnen, oder welchen Arzt sie konsultieren. Der Computer solle den Arzt nicht ersetzen, sondern seine Entscheidungsfindung erleichtern, schreibt Haenssle. Denkbar auch, dass es in der Zukunft eine zentrale Stelle gibt und der Arztbesuch durch eine Abschätzung des Computers manchmal entfallen kann: Wer einen auffälligen Leberfleck findet, kann ihn gemäß der Anweisung einer App fotografieren und das Bild an einen Computer senden, der das Hautkrebsrisiko bewertet. Die Software würde dann entweder den Besuch beim Arzt empfehlen oder Entwarnung geben.

In der Bevölkerung überwiegt Skepsis

Nicht nur bei den Ärzten, auch in der Bevölkerung ist die Skepsis gegenüber den Entscheidungen der künstlichen Intelligenz weit verbreitet. Das belegt das Technik-Radar, eine repräsentative Umfrage, die von der Körber-Stiftung und der Deutschen Akademie der Technikwissenschaft (acatech) beauftragt wurde. Nur ein Drittel der Befragten findet es sinnvoll oder sehr sinnvoll, wenn Ärzte ihre Entscheidungen vor allem auf der Basis von riesigen Datenbanken treffen. Nur jeder Fünfte vertraut dem Computer mehr als dem Arzt, wenn sich die Diagnosen von Mensch und Maschine widersprechen.

Die Deutschen vertrauen der künstlichen Intelligenz in der Medizin noch nicht.
Körberstiftung, Acatech

Früherkennung einer Sepsis auf der Intensivstation

Die Sepsis (populärer Name: Blutvergiftung) ist eine der häufigsten Todesursachen in Deutschland. Bei einer Sepsis weitet sich eine ursprünglich lokal begrenzte Infektion über das Lymphsystem oder die Blutgefäße auf den ganzen Körper aus. Etwa 160.000 Fälle gibt es in Deutschland jedes Jahr, ein Drittel der Betroffenen stirbt, meistens an Multi-Organ-Versagen. Bei der Behandlung einer Sepsis auf der Intensivstation zählt jede Minute.

In der Schweiz soll deshalb im Rahmen der „Personalized Swiss Sepsis Study“ jetzt ein Frühwarnsystem etabliert werden. Dazu werden auf den Intensivstationen von mehreren Schweizer Universitätskliniken während des gesamten Verlaufs einer Sepsis komplexe Informationen über den Patienten und den Erreger gesammelt. Die Daten, die beim typischen Monitoring der Intensiv-Patienten anfallen, sollen kombiniert werden mit genetischen Analysen des Erregers und weiteren molekular-genetischen Untersuchungen des Patienten. Zudem weiß man von jedem Teilnehmer der Studie, ob er eine Sepsis entwickelt und wie eine Therapie angeschlagen hat. Die künstliche Intelligenz soll in dieser Datenflut neue Bio-Marker finden, mit denen sich der Verlauf von Blutvergiftungen früher und genauer als bisher vorhersagen lässt, und damit eine effektivere Behandlung ermöglichen. Das könnte Leben retten.

Die Bio-Informatiker profitieren davon, dass sie sich nicht auf Archivdaten stützen müssen, sondern alle Daten im Rahmen des Projekts selbst erheben. Denn je besser die Qualität des Datensatzes, desto erfolgreicher kann er von den Algorithmen ausgewertet werden. So reicht vermutlich eine niedrige Zahl an Patienten aus, um bisher nicht bekannte Zusammenhänge zu erkennen. „Bei dieser gut ausgewählten Patienten-Gruppe könnte eine niedrige vierstellige Zahl an Patienten bereits ausreichen“, urteilt Michael Forsting, Direktor des Instituts für Diagnostische und Interventionelle Radiologie und Neuroradiologie am Universitätsklinikum Essen. Die Wissenschaftler vertrauen darauf, dass die Computer die Daten besser verknüpfen als das menschliche Gehirn.

Verlaufskontrolle bei chronischen Erkrankungen

Für dieses Problem haben die Radiologen bereits einen Terminus technicus: „satisfaction of search“ heißt ein häufiger Fehler, der auch erfahrenen Radiologen unterläuft. Gemeint ist, dass der Arzt eine Auffälligkeit im Bild erkennt, damit zufrieden ist und deshalb nicht nach weiteren Auffälligkeiten sucht. Besonders häufig passiert das bei Verlaufskontrollen: bei Bildern des CT oder MRT, die aufgenommen werden, um die Entwicklung einer Therapie zu verfolgen. Wie hat sich ein Tumor entwickelt? Gibt es in einem Organ mehr oder weniger Ablagerungen als beim letzten Arztbesuch? Diese Routine-Aufgabe sollen künftig Algorithmen erledigen, damit der Radiologe prüfen kann, ob sich beispielsweise neue Metastasen entwickelt haben.

Generell könnte künstliche Intelligenz bei der Suche nach Tumoren hilfreich sein. In den USA wird bereits ein Programm verkauft, dass auf CT-Bildern der Lunge Knoten entdeckt und deren Form und Volumen bestimmt. Der Hersteller möchte damit Routine-Untersuchungen bei Risikogruppen erleichtern. Die Uni-Klinik Essen nutzt ein Programm, dass bei Gebärmutterhalskrebs frühzeitig Metastasen aufspürt. „Es sagt mit einer Treffsicherheit von 95 bis 97 Prozent vorher, ob die Patientinnen bereits Metastasen entwickelt haben“, erklärt Michael Forsting.  

Forscher der University of California in San Francisco behaupten, dass sie einen lernfähigen Algorithmus entwickelt haben, der die Alzheimer-Vorzeichen in den Hirnscans mit der Positronen-Emissions-Tomografie (PET) möglicherweise besser entdecken kann als ein Mensch. Sie trainierten ihr System an 2.000 PET-Aufnahmen von Alzheimer-Patienten im Frühstadium. Danach testeten sie die KI an 40 zuvor nicht bekannten Aufnahmen, der Computer lag in seiner Bewertung immer richtig. Bevor solche Maschinen im Klinikalltag eingesetzt werden, müssen sie aber mit größeren Fallzahlen getestet werden.

Lungenuntersuchung auf Tuberkulose

Röntgenuntersuchungen der Lunge sind seit Jahrzehnten der wichtigste Weg, um Tuberkulose (TB) zu erkennen. Jährlich infizieren sich nach Angaben der Weltgesundheitsorganisation (WHO) mehr als zehn Millionen Menschen mit TB. Im Jahr 2016 starben 1,3 Millionen Menschen an der hoch ansteckenden Krankheit. Mit Massenuntersuchungen lässt sich die Ausbreitung der Krankheit verhindern, wenn es vor Ort genug Medikamente gibt. Doch in ärmeren Ländern und in Ländern mit hohen Bevölkerungszahlen fehlen meistens Ärzte, die Röntgenbilder auswerten können. Diese Aufgabe kann künstliche Intelligenz übernehmen.

Die Software „Computer-Aided Detection for tuberculosis“ (CAD4TB) wird inzwischen sogar von der Weltgesundheitsorganisation (WHO) empfohlen. Der Computer erkennt abnormale Strukturen, die Hinweise auf TB liefern. Er liefert binnen Minuten eine Punktzahl zwischen 0 und 100 für die Wahrscheinlichkeit, dass auf dem Röntgenbild eine aktive TB zu sehen ist. In diesem Fall muss der Betroffene eine Speichelprobe zur weiteren Diagnostik abgeben. Die Qualität der Computerdiagnose wurde weltweit von Lungenärzten überprüft. CAD4TB wird mittlerweile in 24 Ländern eingesetzt. Das System eignet sich für Krankenhäuser oder als mobile Diagnostikeinheit, die in einen kleinen Lkw passt. Nach Angaben des Herstellers, Delft Imaging Systems, sind täglich 200 Untersuchungen möglich. Computer sollen demnächst auch beim Mammografie-Screening zur Früherkennung von Brustkrebs eingesetzt werden.

Mobile Tuberkulose-Kontrolle im Lkw: Dieses Fahrzeug erreicht in Nigeria auch Städte und Dörfer ohne Arzt oder Krankenhaus. Das Equipment ermöglicht eine Tuberkulose-Untersuchung.
Mobile Tuberkulose-Kontrolle im Lkw: Dieses Fahrzeug erreicht in Nigeria auch Städte und Dörfer ohne Arzt oder Krankenhaus. Das Equipment ermöglicht eine Tuberkulose-Untersuchung.

Medikamentenmischung für HIV-Patienten

HIV kann noch immer nicht geheilt werden. Die Therapie verfolgt das Ziel, die Vervielfältigung des Virus zu unterdrücken und dadurch die Virus-Konzentration im Körper niedrig zu halten. Dafür gibt es mehr als zwei Dutzend Wirkstoffe, die auch gemeinsam verabreicht werden. Die Mediziner verfügen über mehr als 1000 mögliche Therapieoptionen. Kurz nach der HIV-Diagnose schlägt die Therapie meist noch gut an, aber das anpassungsfähige HI-Virus entwickelt schnell Resistenzen gegen die Wirkstoffe. „Die Virus-Resistenz ist das zentrale Problem der Therapie“, bestätigt Thomas Lengauer, Direktor der Abteilung Computational Biology and Applied Algorithmics am Max-Planck-Institut für Informatik in Saarbrücken. Die Resistenzen können sich so weit entwickeln, dass die Ärzte ihren Patienten keine wirksame Behandlung mehr anbieten können. Das HI-Virus kann sich dann ungehindert im Körper ausbreiten.

Die Bio-Informatiker überlisten das Virus dank künstlicher Intelligenz. Die lernenden Algorithmen nutzen dafür Informationen aus der genetischen Sequenz des HI-Virus eines Patienten, die aus einer Blutprobe ermittelt wird. Zudem profitieren die Bio-Informatiker von einer europaweiten Datenbank mit den Daten von 150.000 Patienten, die die Therapie gewechselt haben. Die eine Hälfte der Datenbank verwendet der Algorithmus zunächst zum Lernen. Er sucht beispielsweise nach Zusammenhängen zwischen den Mutationen im genetischem Profil des Virus, der Medikamentengabe und der Virenmenge im Blut. Danach testet die Maschine mit der anderen Hälfte der Daten, ob sich die eigene Prognose zur Wirksamkeit einer Therapie mit den bisherigen Erfahrungen deckt. Wenn der Lernprozess beendet ist, kann die Software das Resistenzniveau des HI-Virus im Patienten gegenüber den Wirkstoffen abschätzen. Das Virus kann tausende Mutationen haben, aber nur ein paar davon beeinflussen die Resistenz. „Wir berechnen Erfolgswahrscheinlichkeiten einer Therapie für 48 Wochen in die Zukunft“, erläutert Lengauer.

Die Übertragung der Ergebnisse in den Alltag war nicht einfach. „So etwas im Labor zu entwickeln oder beim Patienten anzuwenden, sind zwei ganz unterschiedliche Dinge“, berichtet Lengauer über seine Erfahrungen. So wollen Ärzte eine Erklärung haben, warum die Software eine bestimmte Medikamenten-Kombination ausgewählt hat – „Explainable AI“ heißt der Fachausdruck dafür. Sonst akzeptieren sie die Entscheidung der Software nicht. Die Bio-Informatiker haben eine stärkere Variante der KI entwickelt, die eine konkrete Therapie vorschlägt. Aber die hat sich noch nicht durchgesetzt, weil die Ärzte ihr nicht vertrauen. „Wir arbeiten an einer neuen Generation, die es dem Arzt erleichtert, die Entscheidung nachzuvollziehen“, erklärt Lengauer. Diese Lösung sei interaktiver, biete mehr Alternativen und bilde das Entscheidungsverfahren ab. 

Früherkennung von Depressionen

Stimme und Sprechweise von Menschen zur Diagnostik zu verwenden, ist ein relativ neues Gebiet. US-Forscher der New York University School of Medicine haben das System mit Hilfe von Soldaten entwickelt. Sie fütterten ihre KI mit diagnostischen Standardinterviews von 53 Veteranen des Irak- und des Afghanistankriegs, die ein Posttraumatisches Belastungssyndrom (PTBS) entwickelt hatten. Als Vergleich dienten Gespräche mit 78 Veteranen, die nicht unter dem Syndrom leiden. Tatsächlich entdeckte der Computer typische Muster für die beiden Gruppen, die er in anderen Tonaufnahmen wiederfinden konnte. Nach Angaben der Forscher kann das neue System bisher mit 89 Prozent Genauigkeit ein PTBS aus Aufnahmen von Kriegsteilnehmern erkennen.


Dieser Beitrag wird immer wieder aktualisiert. Jeden Monat gibt es neue Studien über die Leistungsfähigkeit von KI in der Diagnostik. Die Zukunftsreporter werden das Thema beobachten.

Er erscheint in der RiffReporter-Koralle „Die Zukunftsreporter“. Eine Übersicht unserer Artikel finden Sie hier. Und auf dieser Seite können Sie unsere Arbeit mit einem freiwilligen Beitrag unterstützen. Herzlichen Dank! Uns interessiert Ihre Meinung: Bitte schreiben Sie uns unter hallo@zukunftsreporter.online


RiffReporter unterstützen
Die Zukunftsreporter