Wir verwenden Cookies, um Inhalte und Anzeigen zu personalisieren, Funktionen für soziale Medien anbieten zu können und die Zugriffe auf unsere Website zu analysieren. Außerdem geben wir Informationen zu Ihrer Verwendung unserer Website an unsere Partner für soziale Medien, Werbung und Analysen weiter. Unsere Partner führen diese Informationen möglicherweise mit weiteren Daten zusammen, die Sie ihnen bereitgestellt haben oder die sie im Rahmen Ihrer Nutzung der Dienste gesammelt haben.
Notwendige Cookies helfen dabei, eine Webseite nutzbar zu machen, indem sie Grundfunktionen wie Seitennavigation und Zugriff auf sichere Bereiche der Webseite ermöglichen. Die Webseite kann ohne diese Cookies nicht richtig funktionieren.
1.gifWird verwendet, um die Anzahl der Sitzungen auf der Website zu zählen, was für die Optimierung der Bereitstellung von CMP-Produkten erforderlich ist.
fe_typo_userBehält die Zustände des Benutzers bei allen Seitenanfragen bei.
Maximale Speicherdauer: SitzungTyp: HTTP-Cookie
Präferenz-Cookies ermöglichen einer Webseite sich an Informationen zu erinnern, die die Art beeinflussen, wie sich eine Webseite verhält oder aussieht, wie z. B. Ihre bevorzugte Sprache oder die Region in der Sie sich befinden.
Wir nutzen diese Cookie-Typen nicht.
Statistik-Cookies helfen Webseiten-Besitzern zu verstehen, wie Besucher mit Webseiten interagieren, indem Informationen anonym gesammelt und gemeldet werden.
_pk_id#Erfasst Statistiken über Besuche des Benutzers auf der Website, wie z. B. die Anzahl der Besuche, durchschnittliche Verweildauer auf der Website und welche Seiten gelesen wurden.
Maximale Speicherdauer: 1 JahrTyp: HTTP-Cookie
_pk_ses#Wird von Piwik Analytics Platform genutzt, um Seitenabrufe des Besuchers während der Sitzung nachzuverfolgen.
Maximale Speicherdauer: 1 TagTyp: HTTP-Cookie
Marketing-Cookies werden verwendet, um Besuchern auf Webseiten zu folgen. Die Absicht ist, Anzeigen zu zeigen, die relevant und ansprechend für den einzelnen Benutzer sind und daher wertvoller für Publisher und werbetreibende Drittparteien sind.
Wir nutzen diese Cookie-Typen nicht.
Nicht klassifizierte Cookies sind Cookies, die wir gerade versuchen zu klassifizieren, zusammen mit Anbietern von individuellen Cookies.
Liste der Domains, für die Ihre Zustimmung gilt: [#BULK_CONSENT_DOMAINS#]
Die Cookie-Erklärung wurde das letzte Mal am 3/19/25 von Cookiebot aktualisiert
[#IABV2_TITLE#]
[#IABV2_BODY_INTRO#]
[#IABV2_BODY_LEGITIMATE_INTEREST_INTRO#]
[#IABV2_BODY_PREFERENCE_INTRO#]
[#IABV2_BODY_PURPOSES_INTRO#]
[#IABV2_BODY_PURPOSES#]
[#IABV2_BODY_FEATURES_INTRO#]
[#IABV2_BODY_FEATURES#]
[#IABV2_BODY_PARTNERS_INTRO#]
[#IABV2_BODY_PARTNERS#]
About
Cookies sind kleine Textdateien, die von Webseiten verwendet werden, um die Benutzererfahrung effizienter zu gestalten.
Laut Gesetz können wir Cookies auf Ihrem Gerät speichern, wenn diese für den Betrieb dieser Seite unbedingt notwendig sind. Für alle anderen Cookie-Typen benötigen wir Ihre Erlaubnis.
Diese Seite verwendet unterschiedliche Cookie-Typen. Einige Cookies werden von Drittparteien platziert, die auf unseren Seiten erscheinen.
Sie können Ihre Einwilligung jederzeit von der Cookie-Erklärung auf unserer Website ändern oder widerrufen.
Erfahren Sie in unserer Datenschutzrichtlinie mehr darüber, wer wir sind, wie Sie uns kontaktieren können und wie wir personenbezogene Daten verarbeiten.
Bitte geben Sie Ihre Einwilligungs-ID und das Datum an, wenn Sie uns bezüglich Ihrer Einwilligung kontaktieren.
KI-gestützte Extraktion von Biodiversitätsdaten aus Sammlungsetiketten
In den Beständen naturhistorischer Sammlungen verbergen sich spannende und aufschlussreiche Biodiversitätsdaten aus historischen Zeiträumen. Sie sind als Vergleichsgrundlage und als Anzeiger für den Zustand von Ökosystemen in der Vergangenheit unentbehrlich. Denn sie geben Aufschluss über die Entwicklung und den Wandel von Biodiversität. Viele dieser Daten sind im Schriftgut naturhistorischer Sammlungen vorhanden – auf Objektetiketten, in Eingangskatalogen oder in Reiseberichten, die bis ins 18. Jahrhundert zurückreichen, aber bislang kaum erschlossen sind.
Textmining für den Umweltschutz
Ziel des Projekts ist die Erstellung einer KI-basierten Anwendung zur Extraktion solcher biodiversitätsbezogenen Daten aus historischen Sammlungsetiketten. Das Projekt KI-gestützte Extraktion von Biodiversitätsdaten aus Sammlungsetiketten des Museums für Naturkunde möchte diese Daten verfügbar machen. Dafür soll eine KI-basierte Anwendung für das Text-Mining aus Sammlungsetiketten entwickelt werden. Diese wird nicht nur erkennen, wo auf dem Etikett welcher Text steht, sondern auch automatisch wissen, ob es sich zum Beispiel um den Art- und Gattungsnamen eines Tieres handelt, um die Angabe eines Fundortes oder Zeitpunkts. So können die in den Sammlungsetiketten enthaltenen Daten digital erfasst und zur Analyse des Biodiversitätswandels genutzt werden.
Unterstützung durch die KI-Ideenwerkstatt für Umweltschutz
Die KI-Ideenwerkstatt für Umweltschutz unterstützt das Projekt, indem sie Rechenkapazität zur Verfügung stellt, einen zusätzlichen Referenzdatensatz erstellt und ein KI-Modell zur automatischen Informationsextraktion aus Digitalisaten trainiert. Das Pilotprojekt KI-gestützte Extraktion von Biodiversitätsdaten aus Sammlungsetiketten wird in Kooperation mit dem Museum für Naturkunde Berlin weiterentwickelt.
Franziska Schuster über das Pilotprojekt
Diese Inhalte können nicht angezeigt werden, da die Marketing-Cookies abgelehnt wurden. Klicken
Sie
hier
, um die Cookies zu akzeptieren und den Inhalt anzuzeigen!
Projektsteckbrief
Welches Umweltproblem wollt ihr mit eurem Pilotprojekt lösen?
Die Veränderung der biologischen Vielfalt und die zugrundeliegenden menschlichen Einflussfaktoren sind von hoher Relevanz für den Natur- und Umweltschutz. Ihre Analyse ist die Basis für effektive Maßnahmen gegen Biodiversitätsverlust und für Handlungsempfehlungen an Politik, Wirtschaft und Gesellschaft. Dabei sind historische Biodiversitätsdaten als Indikatoren für den Zustand von Ökosystemen in der Vergangenheit als Benchmarks unentbehrlich. Solche Daten sind in großer Menge im Schriftgut naturhistorischer Sammlungen vorhanden: als Objektetiketten, in Eingangskatalogen und aus Reiseberichten, die bis ins 18. Jahrhundert zurückreichen. Diese Daten sind aber bislang nur in Einzelfällen erschlossen.
Wir würdet ihr euer Projekt kurz beschreiben?
Ziel des Projekts ist die Erstellung einer KI-basierten Anwendung zur Extraktion solcher biodiversitätsbezogenen Daten aus historischen Sammlungsetiketten. Wir möchten eine Anwendung entwickeln, die die effiziente Informationsextraktion aus Digitalisaten von Sammlungsetiketten unter Verwendung von Methoden der künstlichen Intelligenz realisiert.
Welche positive Umweltauswirkung erzielt ihr mit eurem Projekt?
Der Beitrag des Projekts zum Natur-, Umwelt- bzw. Klimaschutz besteht in der Bereitstellung eines innovativen Werkzeugs, das die biodiversitätsrelevanten Daten in strukturierter Form für eine weitere Nutzung verfügbar macht.
Wie möchtet ihr das Problem mit KI lösen?
Die Anwendung wird als Sequenz mehrerer funktioneller Module realisiert (Informationsextraktionspipeline). Mithilfe von KI werden innerhalb der Informationsextraktionspipeline die funktionellen Module der Layouterkennung, Zeichen- und Handschriftenerkennung auf syntaktischer Ebene (OCR, HTR) sowie die Erkennung von in den Dokumenten bezeichneten Entitäten auf semantischer Ebene (NER) realisiert.
Was macht eure Lösung innovativ?
Die hier angestrebte Informationsextraktion ist aufgrund der Komplexität der Struktur und des Inhalts der natürlichsprachlichen Dokumente erst durch die Entwicklung leistungsfähiger KI-Methoden im Bereich des Text Mining möglich geworden. Computergestützte Informationsextraktion wird erst durch den Einsatz hochdimensionaler Klassifizierungsverfahren möglich und ist mit anderen Ansätzen (z.B. reguläre Ausdrücke) nicht durchführbar.
Wie möchtet ihr eine langfristige Nutzung der KI-Anwendung ermöglichen?
Das Projekt ist Teil der kontinuierlichen Aktivitäten des Museums für Naturkunde im Bereich Sammlungserschließung und -entwicklung. Computergestützte, KI-basierte Technologien werden dabei eine wichtige Rolle spielen, entsprechend gehen wir von einer langjährigen Nutzung der Projektergebnisse auch für Weiterentwicklungen aus. Als modulare Anwendung zur Informationsextraktion können die Projektergebnisse von anderen Sammlungen nachgenutzt und auf weitere Use Cases ausgeweitet werden, z.B. die Extraktion von Informationen zu biologischen Eigenschaften der Sammlungsobjekte aus textlichen Überlieferungen. Die im Projekt entwickelten Softwarebestandteile werden open source und unter einer freien Lizenz als Datenpublikationen über die entsprechenden Datenportale des Museums zur Verfügung gestellt.
Pilotprojekte kennenlernen
Lernt weitere spannende Projekte für KI und Umweltschutz kennen!
Die Fachzeitschrift für Museen "Museumskunde" berichtete über das KI-Pilotprojekt des Museums für Naturkunde. Schwerpunkt des Heftes ist das Thema Museen und KI.
„Daten sind nicht gleich Daten. Mich begeistert, dass das Unsichtbare sichtbar wird, wenn viele biodiversitätsrelevante Daten für die Nutzung verfügbar gemacht werden und sie uns auf diese Weise Aufschluss über die Entwicklung und den Wandel von Biodiversität liefern.”