20 research outputs found

    k-Means-Clustering von Textdokumenten mit teilweise fixierten Clustermittelpunkten

    Get PDF
    von Techniken aus den Bereichen maschinelles Lernen und natĂŒrliche Sprachverarbeitung (Natural Language Processing, NLP) prĂ€sentiert. Die Arbeitsschritte der Textanalyse, von der Vorverarbeitung bis zur Merkmalsextraktion, wurden mit Schwerpunkt auf dem Einsatz des FCK-Means Clustering-Algorithmus detailliert beschrieben. Dieser Algorithmus ermöglicht die Gruppierung Ă€hnlicher Textdokumente auf Basis hochdimensionaler,semantischer Darstellungen, die durch den Einsatz von TF-IDF und BERT-Einbettungen gewonnen werden. In der vorliegenden Arbeit wurde ein System entwickelt und implementiert, das auf Python und mehreren maschinellen Lern- und NLP-Bibliotheken, einschließlich Scikit-Learn, NLTK und Transformers, basiert. Der entwickelte Ansatz wurde auf verschiedenen AnwendungsfĂ€llen getestet. Weiterhin wurden praktische Herausforderungen, die bei der Implementierung des Systems auftraten, wie das Management großer Datenmengen und die Sicherstellung der QualitĂ€t der Eingabedaten, grĂŒndlich diskutiert und LösungsansĂ€tze vorgeschlagen. Zusammenfassend bietet die Arbeit einen tiefgreifenden Einblick in die Methodik und Implementierung eines auf NLP und Clustering basierenden Textklassifikationssystems und unterstreicht dessen Potential in diversen Anwendungsgebieten

    Digitalisierung mit Arbeit und Berufsbildung nachhaltig gestalten

    Get PDF
    Welche Bedeutung hat die Digitalisierung fĂŒr die Aus- und Fortbildung in den elektro-, informations-, metall- und fahrzeugtechnischen Berufen? Der Einsatz digitaler Technik fĂŒhrt hier zu starken VerĂ€nderungen der TĂ€tigkeiten und ArbeitsablĂ€ufe. Gleichzeitig sind die BeschĂ€ftigten dieser Berufe durch die Verwendung und Herstellung digital innovativer Produkte im besonderen Maße Mitgestaltende dieser VerĂ€nderungen. Der vorliegende Sammelband ist in drei Teile gegliedert. Im Abschnitt zur ressourcenfokussierten Facharbeit geht es um die Gestaltung nachhaltiger Produktions-, Service- und Reparaturprozesse: Wie kann digitale Technik genutzt werden, um ressourcenschonend und -effizient zu arbeiten? Unter dem Stichwort ""Smartes Lernen"" diskutieren die Autorinnen und Autoren das Gelingen der didaktischen Transformation und neue Unterrichtsmethoden fĂŒr gewerblich-technische Schulen. Im Weiterem beschĂ€ftigt sich der Band mit der Informatik als Querschnittsdisziplin sĂ€mtlicher Digitalisierungsprozesse: Wie kann informatische Bildung in der beruflichen Aus- und Fortbildung gestaltet werden, obwohl Informatik kein verbindliches Schulfach ist? Dieser Sammelband enthĂ€lt BeitrĂ€ge der 29. Fachtagung der BAG Elektrotechnik, Informationstechnik, Metalltechnik, Fahrzeugtechnik 2019 im Rahmen der Hochschultage Berufliche Bildung (HTBB) in Siegen

    Ein Rahmenwerk fĂŒr Evaluierung von InterdisziplinĂ€ren Lerneinheiten fĂŒr den Informatikunterricht

    Get PDF
    Obwohl in den letzten 20 Jahren viele Informatik-Angebote in Form von Workshops und Lerneinheiten gezielt fĂŒr MĂ€dchen und junge Frauen entstanden sind, ist die Frauenquote in informatikbezogenen StudiengĂ€ngen und Berufen weiterhin sehr gering. AussagekrĂ€fige Evaluierungen von Lerneinheiten sind essentiell fĂŒr die Didaktik der Informatik, um Ursachen zu verstehen, wirkungsvolle LösungsansĂ€tze zu erarbeiten und einen fĂŒr MĂ€dchen und Jungen gleichermaßen erfolgreichen Informatikunterricht zu gewĂ€hrleisten. Ein vielversprechender aber noch kaum untersuchter Ansatz ist, SchĂŒlerinnen fĂŒr die Informatik zu begeistern, indem interdisziplinĂ€re Themen aus DomĂ€nen aufgegriffen werden,fĂŒr die sie generell grĂ¶ĂŸeres Interesse zeigen. Allerdings gibt es keine einheitliche VorschlĂ€ge zur Evaluierung des Begeisterungspotentials einer Lerneinheit. Diese Arbeit liefert einen Vorschlag fĂŒr ein Rahmenwerk zur Evaluierung von Lerneinheiten basierend auf 34 Studien. ZusĂ€tzlich wurde im Rahmen der Arbeit eine interdisziplinĂ€re Online-Lerneinheit zu den Themen Data Science und Bienensterben umgesetzt und in einer Fallstudie mittels des Rahmenwerks ausgewertet. An der Studie nahmen 131 SchĂŒler*innen der Klassenstufen 7 bis 10 teil (65 weiblich, 62 mĂ€nnlich). Erste Ergebnisse zeigen, dass die interdisziplinĂ€re Lerneinheit vor allem SchĂŒlerinnen begeistern konnte, aber auch, dass es deutliche Unterschiede je nach Rahmenbedingungen und Lernumgebungen geben kann, was die Notwendigkeit fĂŒr weiterfĂŒhrende differenzierte Analysen verdeutlicht

    Statistics between data science, artificial intelligence and big data: contributions of the colloquium “Make Statistics Great Again”

    Get PDF
    Die Statistik als fachliche Disziplin muss sich in einem rasch wandelnden Umfeld behaupten, das durch den Aufstieg der Data Science, den Bedeutungszuwachs der kĂŒnstlichen Intelligenz sowie neue Datenstrukturen charakterisiert wird. Wie kann sich die Statistik hier behaupten oder verlorenes Terrain wiedergewinnen? Unter dem provokanten Motto „Make Statistics great again“ wurden aus verschiedenen Blickwinkeln Entwicklungen, Strategien und positive Beispiele skizziert, wie sich das Fach Statistik an der UniversitĂ€t, im Wissenschaftsbetrieb und auf dem Arbeitsmarkt positionieren sollte. Willi Seidel schaut aus dem Blickwinkel eines HochschulprĂ€sidenten auf den Ressourcenkampf der FĂ€cher. Christine MĂŒller berichtet ĂŒber die Initiativen der Dachorganisation DAGStat die vielen Teildisziplinen der Statistik wirkungsvoll im Wissenschaftsbetrieb und in der Öffentlichkeit zu positionieren. Florian Meinfelder dokumentiert den Aufstieg des Masterstudiengangs in Survey Statistik zu einem der nachgefragtesten StudiengĂ€nge der Uni Bamberg. JĂŒrgen Chlumsky und Markus Zwick beleuchten die historische Wahrnehmung der Amtsstatistik bei Pflichterhebungen und die Entwicklung der Forschungsdatenzentren sowie moderner ZugĂ€nge zu neuen Datenquellen. Joachim Wagner schildert das VerhĂ€ltnis von Datenproduzenten und Datennutzern aus der Sicht eines unzufriedenen Datennutzers. Schließlich geht es um die Position der Statistik in der Datenwissenschaft. Ist „Data Science“ nur ein neumodisches Wort fĂŒr Statistik? Ein Konzeptionspapier der Gesellschaft fĂŒr Informatik (GI) hat zu Positionspapieren der DStatG und der DAGStat gefĂŒhrt, die von Ulrich Rendtel vorgestellt werden. Das Kolloquium fand anlĂ€sslich der Abschiedsvorlesung von Ulrich Rendtel im Juni 2019 am Fachbereich Wirtschaftswissenschaft der Freien UniversitĂ€t statt.Statistics as a subject has to sustain its position in a fast changing environment which is characterized by the rise of Data Science, the growth of the importance of Artificial Intelligence and the emergence of new Data Structures. How can Statistics keep its position or even regain lost territory? Under the provoking motto “Make Statistics great again” we sketch under different views developments, strategies and positive examples, how the subject statistics can evolve at universities, in scientific competition and at the labor market. Willi Seidel comments the competition of subjects for resources from the viewpoint of the head of a university. Christine MĂŒller reports the initiatives of the DAGStat umbrella organization, to promote the different subbranches of statistics in the scientific competition and in the public view. Florian Meinfelder documents the rise of the master program of Survey Statistics to one of the most requested master programs at the university of Bamberg. JĂŒrgen Chlumsky and Markus Zwick report the public notion of mandatory surveys of official statistics as well as the development of research data centers and alternative access to new data sources. Joachim Wagner comments the relationship of data producers and data users from the view of a discontent data analyst. Finally, the position of statistics in the subject data science is discussed. Is the term “Data Science” only a modern phrase for statistics? A White Paper of the Gesellschaft fĂŒr Informatik (GI) has provoked two position papers of the DStatG and the DAGStat which are presented by Ulrich Rendtel. The colloquium took place at the farewell lecture of Ulrich Rendtel at the Economic Faculty of the Freie UniversitĂ€t Berlin in June 2019

    ErklĂ€rbare KĂŒnstliche Intelligenz - Steigerung der Nachvollziehbarkeit ĂŒberwachter maschineller Lernverfahren

    Get PDF
    Das Thema KĂŒnstliche Intelligenz und insbesondere das Gebiet der maschinellen Lernverfahren findet immer mehr Einzug in das tĂ€gliche Leben. In Zukunft werden die Verfahren verstĂ€rkt beispielsweise in der Medizin bei der Diagnose einer Krankheit oder im Bankenwesen beim AufspĂŒren von GeldwĂ€schetransaktionen unterstĂŒtzen. Vorbehalte gegenĂŒber dem Einsatz der Verfahren sind oft mit der hohen KomplexitĂ€t und der einhergehenden fehlenden Nachvollziehbarkeit der Modelle verbunden. Modelle, die durch ein maschinelles Lernverfahren erzeugt werden, gelten als Blackbox, da diese meist fĂŒr die Anwender nicht nachvollziehbar sind. Es fehlen Erkenntnisse darĂŒber, wie das Modell die Ergebnisse erzeugt. Das Forschungsfeld der ErklĂ€rbaren KĂŒnstlichen Intelligenz versucht, Lösungen zu konzipieren, die die Nachvollziehbarkeit von gesamten Modellen oder bestimmten Modellergebnissen erhöhen. Die vorliegende Arbeit leistet einen Beitrag zum Forschungsfeld der ErklĂ€rbaren KI – insbesondere im Teilbereich des erklĂ€rbaren ĂŒberwachten maschinellen Lernens. Der erste wesentliche Beitrag der Arbeit umfasst den Entwurf eines Vorgehensmodells. Dieses definiert unterschiedliche Arten von ErklĂ€rungen, die im Bereich des ĂŒberwachten maschinellen Lernens generiert werden können. Insgesamt werden fĂŒnf Arten von ErklĂ€rungen unterschieden, die sich grob in Modell- und Instanz-ErklĂ€rungen einteilen lassen. Ein weiterer wesentlicher Beitrag der Arbeit sind die entworfenen Verfahren zur Erstellung von ErklĂ€rungen. Basierend auf diesem Vorgehensmodell wurden zwei Verfahren entworfen: ein globales Surrogat-Modell und ein lokales Surrogat-Modell. Ausgehend von einem neuronalen Netz wird ein globales Surrogat-Modell in Form eines nachvollziehbaren Modells erzeugt, das sich somit den Modell-ErklĂ€rungen zuweisen lĂ€sst. Das Surrogat wird mithilfe der Regularisierung generiert, sodass dieses sowohl die Eigenschaften der Nachvollziehbarkeit als auch die der Genauigkeit erfĂŒllt. Das lokale Surrogat-Modell hingegen versucht, die Nachvollziehbarkeit eines einzelnen Ergebnisses ausgehend von einer Blackbox zu erzeugen, und lĂ€sst sich den Instanz-ErklĂ€rungen zuordnen. Das Ziel ist es, eine ErklĂ€rung zu erhalten, die nahe an der Entscheidungsgrenze zur ursprĂŒnglichen Dateninstanz liegt. Diese Art der ErklĂ€rung ermöglicht es dem Anwender, bevorzugte Ergebnisse des Modells zu erzeugen. ErklĂ€rungen, die Modelle oder bestimmte Modellergebnisse nachvollziehbar gestalten, sind ein wichtiger Schritt im Prozess des erklĂ€rbaren maschinellen Lernens. Um die Nachvollziehbarkeit von ErklĂ€rungen zu untersuchen, ist es zwingend notwendig, den Nutzen generierter ErklĂ€rungen mit Anwendern zu analysieren. Daher umfasst ein weiterer wesentlicher Beitrag der Arbeit die Untersuchung der Nachvollziehbarkeit von ErklĂ€rungen im Rahmen von Benutzerstudien. Dabei wurden sowohl unterschiedliche Aufgabenstellungen als auch Anwendergruppen in die Untersuchungen miteinbezogen

    Digital twin as a service : Ressourcenmanagement mit Energiedaten aus cyber-physischen Systemen

    Get PDF
    Die Energiewende fĂŒhrt zu einer ParadigmenĂ€nderung. Der Zeitpunkt der Energieabnahme wird sich zunehmend an dem der Energieerzeugung orientierten. Die Steuerung des Energiebedarfs kann durch energieorientierte Produktionsplanung gesteigert werden. Dies erfordert eine Vorhersage des Energiebedarfs. HierfĂŒr wird ein System entwickelt, das eine Modellierung mittels maschinellen Lernens nutzt. Die Datenbasis wird durch eine Vorgehensweise zur Abstrahierung von Fertigungsmaschinen erzeugt. Das System besteht aus gruppierten Microservices, es berĂŒcksichtigt die unterschiedlichen Anforderungen der Modelle an die Infrastruktur. Die Modelle sind in digitalen Zwillingen integriert, die als Dienst genutzt werden. Hierdurch ist eine effiziente Adaption von ˜Äderungen an Fertigungsmaschine oder Modell-Methodik möglich. Eine exemplarische Anwendung der Abstraktionsmethode und der Modellierung mittels neuronalen Netzes demonstrieren die Umsetzbarkeit.The energy transition in Germany leads to a shift of paradigm. Time of energy consumption will increasingly be oriented to that of energy production. Control of the energy demand can be increased by energy-oriented production planning. This requires a prediction of the energy demand. For this purpose, a system is developed which uses modelling by machine learning. A procedure for abstraction of production machines generates the data basis. The models are integrated in digital twins as services, following the microservice architecture. An exemplary application of the abstraction method and modelling by means of neural networks demonstrate the feasibility

    Reflektierte algorithmische Textanalyse. InterdisziplinÀre(s) Arbeiten in der CRETA-Werkstatt

    Get PDF
    The Center for Reflected Text Analytics (CRETA) develops interdisciplinary mixed methods for text analytics in the research fields of the digital humanities. This volume is a collection of text analyses from specialty fields including literary studies, linguistics, the social sciences, and philosophy. It thus offers an overview of the methodology of the reflected algorithmic analysis of literary and non-literary texts

    Labore in der Hochschullehre

    Get PDF
    In der Hochschullehre ist das Labor als Raum des praktischen Lehrens und Lernens in den technischen FĂ€chern ein zentraler Bestandteil der Curricula. Damit der "Lernort Labor" einen positiven Beitrag zum Kompetenzerwerb der Lernenden leisten kann, mĂŒssen didaktische, organisatorische und sowie technische Gestaltungsfaktoren neu betrachtet werden. Was brauchen Labore, um zu einem effektiven, zukunftsfĂ€higen Lernort zu werden? Wie kann sich Laborlehre mit den aktuellen Möglichkeiten der Digitalisierung weiterentwickeln? Die Autorinnen und Autoren geben Antworten auf diese Fragen. Der erste Teil des Sammelbandes beleuchtet das Thema Labordidaktik unter den verĂ€nderten Kompetenzerwartungen. Die BeitrĂ€ge des zweiten Teils befassen sich mit der aktuellen und zukĂŒnftigen Entwicklung von Cross-Reality-Laboren als Einzelangebote sowie als Plattformen und Netzwerke. Bedingungen fĂŒr das Gelingen - und fĂŒr das Misslingen - von Cross-Reality-Laboren sind das zentrale Thema des dritten Teils, der besonders auf die infrastrukturelle und organisationale Ebene blickt und untersucht, wie diese Laborform technisch verlĂ€sslich und ökonomisch nachhaltig in die Lehre integriert werden kann. Der Sammelband richtet sich an Lehrende in ingenieur- und naturwissenschaftlichen StudiengĂ€ngen, die sich mit der Gestaltung, Weiterentwicklung und DurchfĂŒhrung der Laborlehre befassen sowie an Hochschuldidaktiker:innen, an Leitungen und Mitarbeitende in der Hochschulverwaltung sowie in technischen VerbĂ€nden

    QualitĂ€t in der Inhaltserschließung

    Get PDF
    corecore