6 research outputs found

    An investigation on the power of unlabeled data

    No full text
    Diese Dissertation untersucht den Nutzen von ungelabelten Daten für das Lernen von binären Klassifikatoren und enthält drei wesentliche Beiträge: 1) Es wird bewiesen, dass Semi-Supervised Learning die Anzahl der zum Lernen benötigten Labels verglichen mit Supervised Learning nur um einen konstanten Faktor verringert, falls die Konzeptklasse endlich ist. Ein schwächeres Resultat gilt für Klassen mit endlicher VC-Dimension. Für Klassen unendlicher VC-Dimension wird hingegen gezeigt, dass die Reduktion beliebig groß sein kann. 2) Die Anzahl an benötigten Labels von Supervised Lernern im Co-Training-Framework mit bedingter Unabhängigkeit wird eingehend untersucht und mit der von Semi-Supervised Lernern verglichen. Es ergeben sich Verbindungen zur Analyse von agnostischen aktiven Lernern und dem Lernen aus positiven Beispielen. 3) Semi-Supervised und aktive Lerner werden erfolgreich zum Lösen von Audio-Captchas angewandt
    corecore