19 research outputs found

    Artificial Bandwidth Extension of Speech Signals using Neural Networks

    Get PDF
    Although mobile wideband telephony has been standardized for over 15 years, many countries still do not have a nationwide network with good coverage. As a result, many cellphone calls are still downgraded to narrowband telephony. The resulting loss of quality can be reduced by artificial bandwidth extension. There has been great progress in bandwidth extension in recent years due to the use of neural networks. The topic of this thesis is the enhancement of artificial bandwidth extension using neural networks. A special focus is given to hands-free calls in a car, where the risk is high that the wideband connection is lost due to the fast movement. The bandwidth of narrowband transmission is not only reduced towards higher frequencies above 3.5 kHz but also towards lower frequencies below 300 Hz. There are already methods that estimate the low-frequency components quite well, which will therefore not be covered in this thesis. In most bandwidth extension algorithms, the narrowband signal is initially separated into a spectral envelope and an excitation signal. Both parts are then extended separately in order to finally combine both parts again. While the extension of the excitation can be implemented using simple methods without reducing the speech quality compared to wideband speech, the estimation of the spectral envelope for frequencies above 3.5 kHz is not yet solved satisfyingly. Current bandwidth extension algorithms are just able to reduce the quality loss due to narrowband transmission by a maximum of 50% in most evaluations. In this work, a modification for an existing method for excitation extension is proposed which achieves slight improvements while not generating additional computational complexity. In order to enhance the wideband envelope estimation with neural networks, two modifications of the training process are proposed. On the one hand, the loss function is extended with a discriminative part to address the different characteristics of phoneme classes. On the other hand, by using a GAN (generative adversarial network) for the training phase, a second network is added temporarily to evaluate the quality of the estimation. The neural networks that were trained are compared in subjective and objective evaluations. A final listening test addressed the scenario of a hands-free call in a car, which was simulated acoustically. The quality loss caused by the missing high frequency components could be reduced by 60% with the proposed approach.Obwohl die mobile Breitbandtelefonie bereits seit über 15 Jahren standardisiert ist, gibt es oftmals noch kein flächendeckendes Netz mit einer guten Abdeckung. Das führt dazu, dass weiterhin viele Mobilfunkgespräche auf Schmalbandtelefonie heruntergestuft werden. Der damit einhergehende Qualitätsverlust kann mit künstlicher Bandbreitenerweiterung reduziert werden. Das Thema dieser Arbeit sind Methoden zur weiteren Verbesserungen der Qualität des erweiterten Sprachsignals mithilfe neuronaler Netze. Ein besonderer Fokus liegt auf der Freisprech-Telefonie im Auto, da dabei das Risiko besonders hoch ist, dass durch die schnelle Fortbewegung die Breitbandverbindung verloren geht. Bei der Schmalbandübertragung fehlen neben den hochfrequenten Anteilen (etwa 3.5–7 kHz) auch tiefe Frequenzen unterhalb von etwa 300 Hz. Diese tieffrequenten Anteile können mit bereits vorhandenen Methoden gut geschätzt werden und sind somit nicht Teil dieser Arbeit. In vielen Algorithmen zur Bandbreitenerweiterung wird das Schmalbandsignal zu Beginn in eine spektrale Einhüllende und ein Anregungssignal aufgeteilt. Beide Anteile werden dann separat erweitert und schließlich wieder zusammengeführt. Während die Erweiterung der Anregung nahezu ohne Qualitätsverlust durch einfache Methoden umgesetzt werden kann ist die Schätzung der spektralen Einhüllenden für Frequenzen über 3.5 kHz noch nicht zufriedenstellend gelöst. Mit aktuellen Methoden können im besten Fall nur etwa 50% der durch Schmalbandübertragung reduzierten Qualität zurückgewonnen werden. Für die Anregungserweiterung wird in dieser Arbeit eine Variation vorgestellt, die leichte Verbesserungen erzielt ohne dabei einen Mehraufwand in der Berechnung zu erzeugen. Für die Schätzung der Einhüllenden des Breitbandsignals mithilfe neuronaler Netze werden zwei Änderungen am Trainingsprozess vorgeschlagen. Einerseits wird die Kostenfunktion um einen diskriminativen Anteil erweitert, der das Netz besser zwischen verschiedenen Phonemen unterscheiden lässt. Andererseits wird als Architektur ein GAN (Generative adversarial network) verwendet, wofür in der Trainingsphase ein zweites Netz verwendet wird, das die Qualität der Schätzung bewertet. Die trainierten neuronale Netze wurden in subjektiven und objektiven Tests verglichen. Ein abschließender Hörtest diente zur Evaluierung des Freisprechens im Auto, welches akustisch simuliert wurde. Der Qualitätsverlust durch Wegfallen der hohen Frequenzanteile konnte dabei mit dem vorgeschlagenen Ansatz um etwa 60% reduziert werden

    Die Psychodynamik in den psychoanalytisch begründeten Psychotherapieverfahren – Beiträge zu normativen, didaktischen und diagnostischen Anforderungen

    Get PDF
    Die kumulative Dissertation befasst sich mit der Psychodynamik, welche in den psychoanalytisch begründeten Psychotherapieverfahren das zentrale Störungskonzept darstellt. Die Anforderungen der Psychodynamik werden dabei aus normativer, didaktischer und diagnostischer Perspektive systematisch untersucht. Vor dem Hintergrund der Psychotherapie-Richtlinien-Reform 2017 werden die alten und neuen Vorgaben für die Psychodynamik erforscht (Beitrag 1). Mit der Bottom-Up/Top-Down/Mixed-Methode wird ein übergeordnetes Konzept zur Darstellung der Psychodynamik in der Praxis des Gutachterverfahrens formuliert. Unter einer didaktischen Perspektive wird am Beispiel der Traumafolgestörungen eine Heuristik zum richtlinienkonformen Verfassen der Psychodynamik konzipiert (Beitrag 2). Mit dem Komplementären Modell Psychodynamischer Konfliktdiagnostik (KMK) wird ein neuer Beitrag zur psychodynamischen Konfliktdiagnostik vorgelegt, welcher den bislang in der Forschung und Literatur ausgebliebenen Verbindungsschritt zwischen beobachtungs- und theoriegeleiteter Diagnostik auf diesem Gebiet entwickelt und begründet (Artikel 3). Relevanz und Aktualität erhält die Untersuchung vor dem Hintergrund der Reformen der Psychotherapie-Richtlinie; der Diskussion um die tonangebende Stellung der OPD sowie aktueller didaktischer Herausforderungen der Psychoanalyse (neues Psychotherapiestudium in Deutschland). Die 3 Hauptarbeiten werden durch 8 weitere Artikel ergänzt, welche u.a. am Beispiel der Psychodynamik-Animation und der Kasuistik im Verfahrensdialog weitere Beiträge auf dem Gebiet der Didaktik der Psychoanalyse vorlegen. Die Bedeutung der biografischen Perspektive für das psychodynamische Verständnis (psychogenetische Rekonstruktion) sowie die Implikationen der Ergebnisse mit Blick auf den neuen psychologischen M.Sc.-Studiengang Psychotherapie an Universitäten werden diskutiert.Alle Arbeiten verstehen sich als Plädoyer für die didaktische sowie konzeptionelle Erneuerung der Psychoanalyse bzw. psychodynamischen Psychotherapie

    Ăśber das Greisenalter bei Homer

    No full text
    von W. Jungclausse

    Knowledge corruption for visual perception in individuals high on paranoia

    No full text
    Studies revealed that patients with paranoid schizophrenia display overconfidence in errors for memory and social cognition tasks. The present investigation examined whether this pattern holds true for visual perception tasks. Nonclinical participants were recruited via an online panel. Individuals were asked to complete a questionnaire that included the Paranoia Checklist and were then presented with 24 blurry pictures; half contained a hidden object while the other half showed snowy (visual) noise. Participants were asked to state whether the visual items contained an object and how confident they were in their judgment. Data from 1966 individuals were included following a conservative selection process. Participants high on core paranoid symptoms showed a poor calibration of confidence for correct versus incorrect responses. In particular, participants high on paranoia displayed overconfidence in incorrect responses and demonstrated a 20% error rate for responses made with high confidence compared to a 12% error rate in participants with low paranoia scores. Interestingly, paranoia scores declined after performance of the task. For the first time, overconfidence in errors was demonstrated among individuals with high levels of paranoia using a visual perception task, tentatively suggesting it is a ubiquitous phenomenon. In view of the significant decline in paranoia across time, bias modification programs may incorporate items such as the one employed here to teach patients with clinical paranoia the fallibility of human cognition, which may foster subsequent symptom improvement

    Overconfidence in incorrect perceptual judgments in patients with schizophrenia

    Get PDF
    Background: Patients with schizophrenia show overconfidence in memory and social cognition errors. The present investigation examined whether this cognitive distortion also manifests in perceptual tasks. Methods: A total of 55 individuals with schizophrenia, 58 with obsessive–compulsive disorder (OCD) as well as 45 non-clinical controls were presented 24 blurry black and white pictures, half of which contained a hidden object; the other half contained (“snowy”) visual noise. Participants had to judge whether the pictures depicted an object or not and how confident they were in this judgment. Results: Participants with schizophrenia showed overconfidence in errors and an enhanced knowledge corruption index (i.e. rate of high-confident errors on all high-confident responses) relative to both control groups. In contrast, accuracy scores did not differ between clinical groups. Metacognitive parameters were correlated with self-rated levels of current paranoia. Discussion: To the best of our knowledge, this is the first study to demonstrate overconfidence in errors among individuals with psychosis using a visual perception task. Speaking to the specificity of this abnormality for schizophrenia and its pathogenetic relevance, overconfidence in errors and knowledge corruption were elevated in patients with schizophrenia relative to both control groups and were correlated with paranoia
    corecore