← Zurück zur Übersicht

1 Min. Lesezeit

Abstract zu wichtigen Aspekten von GxP-relevanter Validierung von Machine Learning-Modellen

Abstract zu wichtigen Aspekten von GxP-relevanter Validierung von Machine Learning-Modellen

Ein Auszug:

Introduction and Objective

Machine learning (ML) systems are widely used for automatic entity recognition in pharmacovigilance. Publicly available datasets do not allow the use of annotated entities independently, focusing on small entity subsets or on single language registers (informal or scientific language). The objective of the current study was to create a dataset that enables independent usage of entities, explores the performance of predictive ML models on different registers, and introduces a method to investigate entity cut-off performance.

Methods

A dataset has been created combining different registers with 18 different entities. We applied this dataset to compare the performance of integrated models with models created with single language registers only. We introduced fractional stratified k-fold cross-validation to determine model performance on entity level by using training dataset fractions. We investigated the course of entity performance with fractions of training datasets and evaluated entity peak and cut-off performance.

Results

The dataset combines 1400 records (scientific language: 790; informal language: 610) with 2622 sentences and 9989 entity occurrences and combines data from external (801 records) and internal sources (599 records). We demonstrated that single language register models underperform compared to integrated models trained with multiple language registers.

Dietrich, J., Dr. Kazzer, P. Provision and Characterization of a Corpus for Pharmaceutical, Biomedical Named Entity Recognition for Pharmacovigilance: Evaluation of Language Registers and Training Data Sufficiency. Drug Saf (2023). https://doi.org/10.1007/s40264-023-01322-3

Weiterführende Links

Syncwork beteiligt sich an IHI JU VICT3R-Initiative zur Reduzierung von Tierversuchen in experimentellen Studien

1 Min. Lesezeit

Syncwork beteiligt sich an IHI JU VICT3R-Initiative zur Reduzierung von Tierversuchen in experimentellen Studien

33 Partnerorganisationen, darunter die Syncwork AG, werden ab dem 1. September 2024 für 42 Monate ihr Know-how und ihre Kompetenzen bündeln. Unter...

Read More
Sicherheit schafft Vertrauen dank TISAX

1 Min. Lesezeit

Sicherheit schafft Vertrauen dank TISAX

Für die Syncwork AG steht die Sicherheit von Daten und Systemen an erster Stelle. Aus diesem Grund hat das Unternehmen unter Beweis gestellt, dass es...

Read More
Pharma MES Europe: Wie sich die Anlageneffizienz mit scarabPLUS steigern lässt

1 Min. Lesezeit

Pharma MES Europe: Wie sich die Anlageneffizienz mit scarabPLUS steigern lässt

Am 22. und 23. September 2025 trifft sich die Pharma- und Biotech-Branche bei der Pharma MES im Maritim proArte Hotel in Berlin. Auch Syncwork ist...

Read More