5 research outputs found
Effiziente Algorithmen und KomplexitÀt in der robusten Statistik
Ein Ausgangspunkt der robusten Statistik ist, dass der
Least-Squares-SchÀtzer zwar einfach zu berechnen ist, aber Probleme
mit AusreiĂern hat. Es genĂŒgt, dass ein Punkt des Datensatzes von
den anderen weit entfernt ist, um das Ergebnis stark zu verfÀlschen.
Die robuste Statistik hat das Ziel, SchÀtzer zu finden, die wenig
sensitiv gegenĂŒber AusreiĂern sind. Allerdings haben diese robusten
SchÀtzer hÀufig den Nachteil, dass ad hoc kein schneller Algorithmus
fĂŒr ihre Berechnung zur VerfĂŒgung steht. In dieser Arbeit werden neue
Algorithmen fĂŒr einige robuste SchĂ€tzer vorgestellt:
FĂŒr Punktmengen in der Ebene der Least-Quartile-Difference-SchĂ€tzer
mit einer Rechenzeit von grob O(n^2 log n) und das Multiresolutions-
Kriterium mit einer Rechenzeit von O(n log n).
Im Kontext von Zeitreihen-Daten werden Update-Algorithmen fĂŒr den
Repeated-Median-SchÀtzer mit Update-Zeit O(n) und den Median-Absolute-
Deviation-SchÀtzer mit Update-Zeit O(log n) vorgestellt.
FĂŒr d-dimensionale Punktmengen werden Exponentialzeit-Algorithmen
fĂŒr den Least-Median-of-Squares-SchĂ€tzer und den Minimum-Covariance-
Determinant-SchĂ€tzer vorgestellt. AbschlieĂend wird die NP-HĂ€rte
vieler robuster SchÀtzer bewiesen sowie eine praxisrelevante
und schwierige Eingabe angegeben, so dass die Suchheuristik Fast-LTS
nur mit einer exponentiell kleinen Wahrscheinlichkeit das Optimum
findet. Damit wird aufgezeigt, dass die theoretischen Eigenschaften
robuster SchÀtzer in die Praxis nur schwer zu verwirklichen sind
An Improved Randomized Selection Algorithm With an Experimental Study
A common statistical problem is that of finding the median element in a set of data. This paper presents an ecient randomized high-level parallel algorithm for finding the median given a set of elements distributed across a parallel machine. In fact, our algorithm solves the general selection problem that requires the determination of the element of rank k, for an arbitrarily given integer k. Our general..