Hannover : Institutionelles Repositorium der Leibniz Universität Hannover
Doi
Abstract
Die Berechnung von Vorhersageintervallen auf derGrundlage von historischen Kontrolldaten aus Bioassays
ist in vielen Bereichen der biologischen Forschung von Interesse. Bei pharmazeutischen und präklinischen
Anwendungen, wie z. B. Immonogenitätstests, ist die Berechnung von Vorhersageintervallen (oder oberen
Vorhersagegrenzen), die zwischen anti-drug Antikörper positiven Patienten und anti-drug Antikörper negativen
Patienten unterscheiden, von Interesse. In der (Öko-)Toxikologie werden verschiedene Bioassays
angewendet, um die toxikologischen Eigenschaften einer bestimmten chemischen Verbindung anModellorganismen
zu untersuchen (z. B. ihre Karzinogenität oder ihre Auswirkungen auf aquatische Nahrungsketten).
In diesem Forschungsbereich ist es von Interesse zu überprüfen, ob das Ergebnis der aktuellen
unbehandelten Kontrolle (oder der gesamten aktuellen Studie) mit den historischen Informationen übereinstimmt.
Zu diesem Zweck können Vorhersageintervalle auf der Grundlage von historischen Kontrolldaten
berechnet werden. Wenn die aktuellen Beobachtungen im Vorhersageintervall liegen, kann davon
ausgegangen werden, dass sie mit den historischen Informationen übereinstimmen.
Das erste Kapitel dieser Arbeit gibt einen detaillierten Überblick über die Verwendung von historischen
Kontrolldaten im Rahmen von biologischen Versuchen. Darüber hinaus wird ein Überblick über die Datenstruktur
(dichotome Daten, Zähldaten, kontinuierliche Daten) und die Modelle, auf denen die vorgeschlagenen
Vorhersageintervalle basieren, gegeben. Im Zusammenhang mit dichotomen Daten oder Zähldaten
wird besonderes Augenmerk auf Überdispersion gelegt, die in Daten mit biologischem Hintergrund häufig
vorkommt, in der Literatur zu Vorhersageintervallen jedoch meist nicht berücksichtigt wird.
Daher wurden Vorhersageintervalle für eine zukünftige Beobachtung vorgeschlagen, die auf überdispersen
Binomialdaten beruhen. Die Überdeckungswahrscheinlichkeiten dieser Intervalle wurden auf der Grundlage
von Monte-Carlo-Simulationen bewertet und lagen wesentlich näher am nominellen Level als die in
der Literatur gefundenen Vorhersageintervalle, die keineÜberdispersion berücksichtigen (siehe Abschnitte
2.1 und 2.2).
In mehreren Anwendungen ist die abhängige Variable kontinuierlich und wird als normalverteilt angenommen.
Dennoch können die Daten durch verschiedene Zufallsfaktoren (zum Beispiel unterschiedliche Labore
die Proben von mehreren Patienten analysieren) beeinflusst werden. In diesem Fall können die Daten
durch lineareModelle mit zufälligen Effekten modelliert werden, bei denen Parameterschätzer mittels Restricted-
Maximum-Likelihood Verfahren geschätztwerden. Für dieses Szenariowerden in Abschnitt 2.3 zwei
Vorhersageintervalle vorgeschlagen. Eines dieser vorgeschlagenen Intervalle basiert auf einem Bootstrap-
Kalibrierungsverfahren, das es auch in Fällen anwendbar macht, in denen ein Vorhersageintervall für mehr
als eine zukünftige Beobachtung benötigt wird.
Abschnitt 2.4 beschreibt das R-Paket predint, in dem das in Abschnitt 2.3 beschriebene bootstrap-kalibrierte
Vorhersageintervall (sowie untere und obere Vorhersagegrenzen) implementiert ist. Darüber hinaus sind
Vorhersageintervalle für mindestens eine zukünftige Beobachtung für überdisperse Binomial- oder Zähldaten
implementiert.
Der Kern dieser Arbeit besteht in der Berechnung von Vorhersageintervallen für eine oder mehrere zukünftige
Beobachtungen, die auf überdispersen Binomialdaten, überdispersen Zähldaten oder linearen Modellen
mit zufälligen Effekten basieren. Nach Kenntnis des Autors ist dies das erste Mal, dass Vorhersageintervalle,
die Überdispersion berücksichtigen, vorgeschlagen werden. Darüber hinaus ist "predint" das erste
über CRAN verfügbare R-Paket, das Funktionen für die Anwendung von Vorhersageintervallen für die
genanntenModelle bereitstellt. Somit ist die in dieser Arbeit vorgeschlageneMethodik öffentlich zugänglich
und kann von anderen Forschenden leicht angewendet werden