
Ein Forschungsteam der Ludwig-Maximilians-Universität München (LMU) hat eine neue Methode entwickelt, um Treibhausgasemissionen (THG) aus Nachhaltigkeitsberichten von Unternehmen zuverlässiger zu extrahieren. Die Lösung adressiert die Herausforderungen der bisherigen manuellen Datenerfassung, die aufwendig und fehleranfällig ist, und setzt auf künstliche Intelligenz (KI), um den Prozess zu automatisieren. Damit will das Team die Genauigkeit und Vergleichbarkeit von Emissionsdaten verbessern, die für die Erreichung von Netto-Null-Zielen entscheidend sind.
Große Unternehmen in der EU sind gesetzlich verpflichtet, ihre THG-Emissionen zu melden. Die Daten, die oft in umfangreichen PDF-Nachhaltigkeitsberichten vorliegen, werden jedoch häufig manuell ausgewertet, was zeitintensiv und ungenau ist. Moderne KI-Systeme, sogenannte Large Language Models (LLMs), bieten zwar Potenzial zur Automatisierung, liefern aber nicht immer zuverlässige Ergebnisse, da sie Messfehler verursachen können. Um diesem Problem zu begegnen, hat die Forschungsgruppe Greenhouse Gas Insights and Sustainability Tracking (GIST) der LMU einen Goldstandard-Datensatz erstellt, der als Referenz für die automatisierte Extraktion dient.
Dieser Datensatz basiert auf Nachhaltigkeitsberichten von Unternehmen des MSCI World Small Cap Index und des deutschen DAX. Er wurde in einem mehrstufigen Prozess entwickelt, bei dem Experten für Sustainable Finance der LMU und der Deutschen Bundesbank gemeinsam mit Methodikern strenge Annotationsregeln definierten. Mehrere Runden der Datenextraktion und -verifizierung sowie Diskussionen in Expertengruppen waren nötig, um die Präzision zu gewährleisten. Der Prozess zeigte, wie komplex die Erfassung vergleichbarer Emissionsdaten ist, da viele Unternehmen unvollständige oder inkonsistente Angaben machen.

Die Analyse ergab, dass etwa die Hälfte der untersuchten Berichte keine verwertbaren THG-Daten enthielt. Wenn Emissionen gemeldet wurden, bezogen sie sich meist auf direkte Emissionen (Scope 1) und indirekte Emissionen aus Energieverbrauch (Scope 2). Daten zu weiteren indirekten Emissionen, etwa aus Lieferketten oder Dienstreisen (Scope 3), waren oft lückenhaft. Ursachen dafür liegen in uneinheitlichen Berichtsstandards und fehlendem Kontext in den Dokumenten.
Der neue Datensatz, ergänzt durch Skripte und Zusatzmaterialien, bietet eine transparente Grundlage für die Evaluierung automatisierter Extraktionsmethoden. Er dokumentiert Annahmen und Entscheidungen klar, um faire Vergleiche zwischen verschiedenen Ansätzen zu ermöglichen und Unsicherheiten sichtbar zu machen. Die GIST-Gruppe hofft, dass diese Ressource Forschern und Unternehmen hilft, die Qualität automatisierter Systeme zu verbessern und Datenlücken im Nachhaltigkeitsreporting zu schließen. Langfristig soll die Methode dazu beitragen, die Transparenz und Vergleichbarkeit von Emissionsdaten zu erhöhen und den Weg zu einer klimaneutralen Wirtschaft zu ebnen.
Jacob Beck, Anna Steinberg, Andreas Dimmelmeier, Laia Domenech Burin, Emily Kormanyos, Maurice Fehr & Malte Schierholz
https://doi.org/10.1038/s41597-025-05664-8

