3 research outputs found

    Statistical facial feature extraction and lip segmentation

    Get PDF
    Facial features such as lip corners, eye corners and nose tip are critical points in a human face. Robust extraction of such facial feature locations is an important problem which is used in a wide range of applications including audio-visual speech recognition, human-computer interaction, emotion recognition, fatigue detection and gesture recognition. In this thesis, we develop a probabilistic method for facial feature extraction. This technique is able to automatically learn location and texture information of facial features from a training set. Facial feature locations are extracted from face regions using joint distributions of locations and textures represented with mixtures of Gaussians. This formulation results in a maximum likelihood (ML) optimization problem which can be solved using either a gradient ascent or Newton type algorithm. Extracted lip corner locations are then used to initialize a lip segmentation algorithm to extract the lip contours. We develop a level-set based method that utilizes adaptive color distributions and shape priors for lip segmentation. More precisely, an implicit curve representation which learns the color information of lip and non-lip points from a training set is employed. The model can adapt itself to the image of interest using a coarse elliptical region. Extracted lip contour provides detailed information about the lip shape. Both methods are tested using different databases for facial feature extraction and lip segmentation. It is shown that the proposed methods achieve better results compared to conventional methods. Our facial feature extraction method outperforms the active appearance models in terms of pixel errors, while our lip segmentation method outperforms region based level-set curve evolutions in terms of precision and recall results

    Verbesserung der Störsicherheit bei der Mimikanalyse in mono- und binokularen Farbbildsequenzen durch Auswertung geometrischer und dynamischer Merkmale

    Get PDF
    Magdeburg, Univ., Fak. fĂŒr Elektrotechnik und Informationstechnik, Diss., 2010Robert Nies

    Video-based Pedestrian Intention Recognition and Path Prediction for Advanced Driver Assistance Systems

    Get PDF
    Fortgeschrittene Fahrerassistenzsysteme (FAS) spielen eine sehr wichtige Rolle in zukĂŒnftigen Fahrzeugen um die Sicherheit fĂŒr den Fahrer, der FahrgĂ€ste und ungeschĂŒtzte Verkehrsteilnehmer wie FußgĂ€nger und Radfahrer zu erhöhen. Diese Art von Systemen versucht in begrenztem Rahmen, ZusammenstĂ¶ĂŸe in gefĂ€hrlichen Situationen mit einem unaufmerksamen Fahrer und FußgĂ€nger durch das Auslösen einer automatischen Notbremsung zu vermeiden. Aufgrund der hohen VariabilitĂ€t an FußgĂ€ngerbewegungsmustern werden bestehende Systeme in einer konservativen Art und Weise konzipiert, um durch eine Restriktion auf beherrschbare Umgebungen mögliche Fehlauslöseraten drastisch zu reduzieren, wie z.B. in Szenarien in denen FußgĂ€nger plötzlich anhalten und dadurch die Situation deeskalieren. Um dieses Problem zu ĂŒberwinden, stellt eine zuverlĂ€ssige FußgĂ€ngerabsichtserkennung und Pfad\-vorhersage einen großen Wert dar. In dieser Arbeit wird die gesamte Ablaufkette eines Stereo-Video basierten Systems zur IntentionsschĂ€tzung und Pfadvorhersage von FußgĂ€ngern beschrieben, welches in einer spĂ€teren Funktionsentscheidung fĂŒr eine automatische Notbremsung verwendet wird. Im ersten von drei Hauptbestandteilen wird ein Echtzeit-Verfahren vorgeschlagen, das in niedrig aufgelösten Bildern aus komplexen und hoch dynamischen Innerstadt-Szenarien versucht, die Köpfe von FußgĂ€ngern zu lokalisieren und deren Pose zu schĂ€tzen. Einzelbild-basierte SchĂ€tzungen werden aus den Wahrscheinlichkeitsausgaben von acht angelernten Kopfposen-spezifischen Detektoren abgeleitet, die im Bildbereich eines FußgĂ€ngerkandidaten angewendet werden. Weitere Robustheit in der Kopflokalisierung wird durch Hinzunahme von Stereo-Tiefeninformation erreicht. DarĂŒber hinaus werden die Kopfpositionen und deren Pose ĂŒber die Zeit durch die Implementierung eines Partikelfilters geglĂ€ttet. FĂŒr die IntentionsschĂ€tzung von FußgĂ€ngern wird die Verwendung eines robusten und leistungsstarken Ansatzes des Maschinellen Lernens in unterschiedlichen Szenarien untersucht. Dieser Ansatz ist in der Lage, fĂŒr Zeitreihen von Beobachtungen, die inneren Unterstrukturen einer bestimmten Absichtsklasse zu modellieren und zusĂ€tzlich die extrinsische Dynamik zwischen unterschiedlichen Absichtsklassen zu erfassen. Das Verfahren integriert bedeutsame extrahierte Merkmale aus der FußgĂ€ngerdynamik sowie Kontextinformationen mithilfe der menschlichen Kopfpose. Zum Schluss wird ein Verfahren zur Pfadvorhersage vorgestellt, welches die PrĂ€diktionsschritte eines Filters fĂŒr multiple Bewegungsmodelle fĂŒr einen Zeithorizont von ungefĂ€hr einer Sekunde durch Einbeziehung der geschĂ€tzten FußgĂ€ngerabsichten steuert. Durch Hilfestellungen fĂŒr den Filter das geeignete Bewegungsmodell zu wĂ€hlen, kann der resultierende PfadprĂ€diktionsfehler um ein signifikantes Maß reduziert werden. Eine Vielzahl von Szenarien wird behandelt, einschließlich seitlich querender oder anhaltender FußgĂ€nger oder Personen, die zunĂ€chst entlang des BĂŒrgersteigs gehen aber dann plötzlich in Richtung der Fahrbahn einbiegen
    corecore