Survival Analysis: An Investigation of Covid-19 Patient Data

Abstract

Ziel dieser Arbeit ist es die Realisierbarkeit einer Cox-Regression (CPH-Modell) für Covid-19 Patienten zu prüfen. Dafür wird das konstruierte Modell anhand von eingeführten Diagnostik-Methoden ausgewertet und mittels vorgestellter Erweiterungen modifiziert. Weiterhin wurde eine stichprobenartige Analyse der relevanten Literatur durchgeführt. Die Literaturanalyse hat aufgezeigt, dass die zugrundeliegenden Modell-Annahmen in lediglich 40% der untersuchten Artikel nachvollziehbar geprüft wurden. Der Neuigkeitswert dieser Arbeit begründet sich darin, dass gezeigt werden konnte, dass ein konventionelles CPHModell für den untersuchten Covid-19 Datensatz unangemessen ist. Um das CPH-Modell anwenden zu können war es notwendig die funktionale Form einer Variable anzupassen, Ausreißer zu entfernen, Zeitinteraktionsterme aufzunehmen und den Datensatz aufzuteilen. Schließlich konnte so ein finales Modell erstellt werden, welches alle Annahmen erfüllt. Allerdings erscheinen vier der geschätzten Koeffizienten fragwürdig. Daher ist die Angemessenheit des erweiterten Modells zweifelhaft. Dies impliziert, dass bei Anwendung des CPH-Modells auf Covid-19 Datensätzen die Erfüllung der Modell-Annahmen genauesten überprüft und bei Nichterfüllung robustere Schätzmethoden verwendet werden sollten. Keywords: Covid-19; Cox-Regression; CPH-Model; Proportional Hazards Model; Survival Analysis.The aim of this work is to test the feasibility of a model based on survival analysis for Covid- 19 patients. To investigate the feasibility, a Cox regression (CPH-Model) was constructed and evaluated using introduced diagnostic methods and modified using presented extensions. It is shown that disregarding the model assumptions can lead to biased estimation results. Furthermore, a sample analysis of the current literature in which CPH-Model was used revealed that the underlying model assumptions were comprehensibly tested in 40% of the articles reviewed. The novelty value of this work is based on the data analysis showing that the conventional CPH-Model is inappropriate for the Covid-19 dataset studied. In order to apply CPH-Model, the model had to be extended. It was necessary to adjust the functional form of a variable, remove outliers, include time interactions and stratify the data set. Finally, this allowed the creation of a final model that met all assumptions. However, four of the estimated coefficients appear questionable. Therefore, the adequacy of the extended model is doubtful. This implies that when CPH-Model is applied, the fulfillment of the model assumptions should be checked most carefully, and more robust estimation methods should be used in case of nonfulfillment. Keywords: Covid-19; Cox-Regression; CPH-Model; Proportional Hazards Model; Survival Analysis

    Similar works