1 Min. Lesezeit
1 Min. Lesezeit
Automatisierte Texterkennung und -verarbeitung mithilfe von Künstlicher Intelligenz
Reiner Strauß
:
12. September 2022

Juergen Dietrich, Senior Lead Data Scientist bei der Bayer AG
Herr Dietrich, bei der TECHBAR 2022 zeigen Sie, inwiefern Bayer Spielformen der Künstlichen Intelligenz nutzt, um menschliche Sprache zu analysieren und zu verarbeiten. In welchem Bereich werden Verfahren der Texterkennung eingesetzt? Wobei helfen sie?
In allen Bereichen werden heute sog. Natural Language Processing (NLP) - Verfahren eingesetzt, die eine Extraktion und Charakterisierung von Text- und Sprachinformationen erlauben. Neben der klassischen ‚Named Entity Recognition‘ werden auch Ähnlichkeitsanalysen von Freitextinformation eingesetzt. Letzteres wird dafür benutzt, um ähnliche Inhalte in anderen Texten zu identifizieren.
Worin liegt die für Sie größte Herausforderung bei der automatisierten Texterkennung?
Erstens: Identische Terme können unterschiedliche Bedeutung (zum Beispiel Nebenwirkung eines Medikaments, dessen Anwendungsgebiet und Begleiterkrankung). Darüber hinaus bestehen – je nach Anwendungsfall – Probleme bei der Identifizierung von Sarkasmus und Ironie. Und obwohl die aktuellen Methoden satzübergreifend Relationen (Kontext) herstellen können, ist das in einem Schritt zu verarbeitende Datenvolumen begrenzt.
Worauf dürfen sich die Teilnehmer der TECHBAR 2022 während Ihres Vortrages freuen?
Wir haben ein Trainingsdatensatz für ein KI-Modell mit einer hohen Güte und absichtlich mit unterschiedlichen Sprachtypen erzeugt. Unsere Experimente zeigen, dass neben einer Identifizierung identische Terme mit unterschiedlicher Bedeutung auch bei unterschiedlichen Sprachtypen möglich ist. Das erzeugte KI-Modell ist daher robuster, kostengünstiger und lässt sich vielseitiger einsetzen.
Vielen Dank für diesen Einblick. Wir freuen uns auf Ihren Vortrag!
Weiterführende Links
1 Min. Lesezeit
Abstract zu wichtigen Aspekten von GxP-relevanter Validierung von Machine Learning-Modellen
Ein Auszug: Introduction and Objective Machine learning (ML) systems are widely used for automatic entity recognition in pharmacovigilance. Publicly...
1 Min. Lesezeit
Syncwork beteiligt sich an GAMP Konferenz in Mannheim
Die 18. Offizielle GAMP® 5 Konferenz steht unmittelbar bevor und Syncwork ist dabei. Vom 2. bis 3. Dezember 2025 kommen Fachleute aus der Pharma- und...