Forscherin entwickelt KI für effizientere Zellsegmentierung

Durch | April 23, 2025

Bilder von segmentierten Zellen sind in der biomedizinischen Forschung und Diagnostik enorm wichtig und sehr teuer. Zwar kann mittlerweile auch Künstliche Intelligenz (KI) die Zellsegmentierung übernehmen, sie braucht dafür aber ein Training mit einer großen Menge gelabelter Daten: Daten, die von ExpertInnen manuell gekennzeichnet werden müssen. Wie sich dieser Prozess intelligent beschleunigen lässt, erforscht Doktorandin Eiram Mahera Sheikh an der Hochschule Bielefeld im Rahmen des SAIL-Forschungsnetzwerks. Sie setzt schon bei der Vorbereitung der Trainingsdaten auf KI, genauer: auf Deep Active Learning.

Credits: Credits: P. Pollmeier, HSBI
Credits Credits P Pollmeier HSBI

Die beiden im Computer aufgerufenen Darstellungen (Foto) sind Abbilder der gleichen biologischen Zellen. Links das mikroskopische Bild einiger Bauchspeicheldrüsen-Stammzellen auf einem porösen Substrat: Die kleinen weißen Flecken, unterschiedlich groß, länglich geformt, leicht verschwommen vor grauem Hintergrund, sind die individuellen Zellen. Hier ist es nicht so leicht zu unterscheiden, ob ein Pixel noch zur Zelle gehört oder schon zum Hintergrund. Eiram Mahera Sheikh lenkt die Aufmerksamkeit der Besucher auf die rechte Seite: dieselbe Anordnung der Zellen, diesmal aber unterschiedlich eingefärbt und deutlich abgegrenzt zum nun schwarzen Hintergrund. „Mit dieser Maske ist das Bild für die Analyse viel besser zu gebrauchen. Hier sind die Zellen deutlich segmentiert, und zwar mit Hilfe von KI, also Künstlicher Intelligenz.“ Sheikh will dafür sorgen, dass dieses Verfahren künftig noch effizienter geschehen kann – und zwar, indem sie die KI mittels KI schlau macht. Mit anderen Worten: Sie will ermöglichen, dass das notwendige Training der Zellsegmentierungs-KI schneller vonstatten gehen kann als bisher und greift dabei ihrerseits auf ein KI-Verfahren zurück.

Nach mehreren Jahren im Beruf hat sich die 33-jährige Informatikerin mit indischen Wurzeln in Zuge eines Masterstudiums auf Data Science und KI spezialisiert. Nun ist sie als Doktorandin an die Hochschule Bielefeld (HSBI) gekommen. Mit der Zellsegmentierung hat sie ein Thema gewählt, dass in der biomedizinischen Forschung und Diagnostik von großer Bedeutung ist: „Die Analyse von Bildern segmentierter Zellen liefert wichtige Erkenntnisse über die Merkmale von Zellen, über pathologische Veränderungen oder darüber, wie Zellen auf bestimmte Wirkstoffe reagieren“, erläutert Eiram Mahera Sheikh. „Das sind Informationen, die zum Beispiel in der Krebstherapie oder in der pharmakologischen Forschung von Bedeutung sind.“ Sheiks Forschung setzt allerdings zwei Schritte früher an – sozusagen auf einer Metaebene. „Die Zellsegmentierung kann mittlerweile auch von KIs übernommen werden. Mich interessiert das Training dieser KI.“

Das Projekt ist Teil des interdisziplinären Forschungsnetzwerks SAIL. Das steht für SustAInable Life-Cicle of Intelligent Socio-Technical Systems („Nachhaltiger Lebenszyklus intelligenter soziotechnischer Systeme“). In dem vom Land NRW mit bis zu 14,8 Millionen Euro geförderten Verbund kooperieren die Universität Bielefeld als Konsortionalführerin (Konsortialführung), die HSBI, die TH OWL und die Universität Paderborn mit dem Ziel, KI-Systeme über ihren gesamten Lebenszyklus transparent, sicher, nachhaltig und robust arbeiten zu lassen. Die rund 90 beteiligten WissenschaftlerInnen des Netzwerks befassen sich mit der Grundlagenforschung im Bereich der KI ebenso wie mit ihren Auswirkungen auf Mensch und Gesellschaft sowie mit konkreten Anwendungen im Bereich der Industrie 4.0 und der intelligenten Gesundheitsversorgung. Wolfram Schenck, Professor für Ingenieurinformatik, wissenschaftlicher Leiter des Data-Analytics-Clusters des Center for Applied Data Science (CfADS) am Campus Gütersloh und HSBI-Sprecher im Projekt SAIL, betreut Eiram Mahera Sheiks Promotion, die an der Schnittstelle von Grundlagenforschung und Gesundheitsversorgung verortet ist, aber durchaus auch Erkenntnisse darüber hinaus liefert.

Schenck erklärt die Herausforderungen von Sheiks Arbeit: „Um die Zellsegmentierung zu erlernen, braucht die Zellsegmetierungs-KI sehr viele gelabelte Daten für das Training. Das sind Bilddaten auf Pixelebene, die mit zusätzlichen Informationen versehen und klassifiziert sind.“ Ein aufwendiges Verfahren, denn konkret bedeutet das: Für jedes Pixel eines Bildes von biologischen Zellen muss festgelegt werden, ob es beispielsweise zur Klasse „Hintergrund“, zur Klasse „Membran“ oder zur Klasse „Zellkörper“ gehört. Schenck verdeutlicht: „Dieses sogenannte Labeling kann heute nur manuell von Expert:innen vorgenommen werden, die genau wissen, was zu sehen ist.“ Zellmembran? Abgestorbene Zelle? Hintergrund? – Pixel für Pixel muss jemand, der etwas von der Sache versteht, die mühselige, etwas eintönige Arbeit verrichten, bevor die KI fit gemacht werden kann für die Segmentierung von gewissen Zellen.

„Weil die Arbeit so zeitintensiv und eintönig ist, wird sie von den ExpertInnen nur ungern gemacht“, wirft Dr. Constanze Schwan ein. „Abgesehen davon ist das Labeling durch die Langwierigkeit und den Einsatz der hochausgebildeten Fachkräfte auch sehr teuer.“ Schwan hat sich der Besprechung angeschlossen. Die Informatikerin im Career@BI-Programm der HSBI lehrt nicht nur am Fachbereich für Ingenieurwissenschaften und Mathematik, sondern arbeitet zugleich auch in der Forschungsabteilung des Biotech-Unternehmens Miltenyi Biotec in Göttingen. Sie bringt den Bedarf der Praxis ein: „Es wäre ein großer Fortschritt, gäbe es ein Modell beziehungsweise einen Algorithmus, der den Aufwand für das Labeling reduzieren würde.“ Denn existierende Segmentierungsverfahren, die etwa für das autonome Fahren geeignet sind, geraten im Fall mikroskopischer Bilder an ihre Grenzen. Dies liegt unter anderem an den komplexeren und feineren Strukturen, die sich in den Bildern finden. Das sind häufig auch Bildstapel auf einer Zeitachse für 3D-Strukturen. Diese Bilder oder Bildstapel enthalten oft komplexe Strukturen, die schwer zu segmentieren sind.

Um das Problem der komplexen Strukturen zu umgehen und um die Spezialistenteams zu entlasten, die die Zellsegmentierungs-KI trainieren müssen, setzt Eiram Mahera Sheikh ihrerseits auf KI. „Es geht mir darum, die Bildregionen zu identifizieren, die für das Erlernen der Zellsegmentierung besonders wichtig sind. Damit bräuchten nicht mehr sämtliche Bildpixel von Hand gelabelt werden, sondern nur noch diejenigen, die als Trainingsdaten besonders wertvoll sind.“ Solch ein gezieltes Herauspicken potentieller Trainingsdaten wird „Aktives Lernen“ bzw. „Active Learning“ genannt. Weil die KI-Algorithmen für die Zellsegmentierung aus dem sogenannten ‚Deep Learning‘ kommen, wird hier auch von „Deep Active Learning“ gesprochen.

Welche die wertvollen Trainingsdaten sind, hat Sheikh mittlerweile identifiziert: „Es sind die unsichersten, die, bei denen der KI-Algorithmus Schwierigkeiten hat, zum Beispiel wegen des schlechten Bildkontrasts oder aufgrund von Zellen, die sich überlappen oder eine ungleichmäßige Form aufweisen.“ Nur diese sollten also künftig von ExpertInnen angeschaut und gelabelt werden, während der Aufwand in den eindeutigen Fälle gespart werden könnte, weil Sheiks KI das Labeling schon vorgenommen hat. Im Grunde lernt die Zellsegmentierungs-KI so, mit weniger Daten und dennoch so effektiv, dass sie später trotzdem präzise Zellsegmentierungen vornehmen kann.

Lesen Sie auch

Mit KI schneller zu besseren Photovoltaik-Materialien | Pugnalom

KI ermöglicht Naturschutzgutachten für alle Arten weltweit | Pugnalom


Entdecke mehr von Pugnalom

Melde dich für ein Abonnement an, um die neuesten Beiträge per E-Mail zu erhalten.

Autoren-Avatar
LabNews Media LLC
LabNews: Biotech. Digital Health. Life Sciences. Pugnalom: Environmental News. Nature Conservation. Climate Change. augenauf.blog: Wir beobachten Missstände

Kommentar verfassen