870 research outputs found
Avatars:A Shifting Interaction
The intersection of theatre-performance, design, and informatics is a fertile area for a broader understanding of the possible design and interaction between people and avatars in simulated three dimensional information spaces. This paper outlines the theoretical modelling for the visualization of a generic avatar template applicable to information spaces. Such a representation, it is theorised, would indicate semantic and structural meanings between contents of a document collection of an
\u27Status Quaestionis\u27 of Dantean Digital Resources. Some Corrective Theoretical Perspectives and a Case Study (Database Allegorico Dantesco)
This paper reflects on the current configuration of Dantean digital resources and proposes some possible perspectives to implement their functionality (disambiguation, RDF and Semantic Web, Distant & Close Reading, attention to the processes of digitization of texts). The second part of the essay explains the structure and presents the basic functionality of the Database Allegorico Dantesco (DAD) a new repository on Dantean allegory
A hybrid algorithm for Bayesian network structure learning with application to multi-label learning
We present a novel hybrid algorithm for Bayesian network structure learning,
called H2PC. It first reconstructs the skeleton of a Bayesian network and then
performs a Bayesian-scoring greedy hill-climbing search to orient the edges.
The algorithm is based on divide-and-conquer constraint-based subroutines to
learn the local structure around a target variable. We conduct two series of
experimental comparisons of H2PC against Max-Min Hill-Climbing (MMHC), which is
currently the most powerful state-of-the-art algorithm for Bayesian network
structure learning. First, we use eight well-known Bayesian network benchmarks
with various data sizes to assess the quality of the learned structure returned
by the algorithms. Our extensive experiments show that H2PC outperforms MMHC in
terms of goodness of fit to new data and quality of the network structure with
respect to the true dependence structure of the data. Second, we investigate
H2PC's ability to solve the multi-label learning problem. We provide
theoretical results to characterize and identify graphically the so-called
minimal label powersets that appear as irreducible factors in the joint
distribution under the faithfulness condition. The multi-label learning problem
is then decomposed into a series of multi-class classification problems, where
each multi-class variable encodes a label powerset. H2PC is shown to compare
favorably to MMHC in terms of global classification accuracy over ten
multi-label data sets covering different application domains. Overall, our
experiments support the conclusions that local structural learning with H2PC in
the form of local neighborhood induction is a theoretically well-motivated and
empirically effective learning framework that is well suited to multi-label
learning. The source code (in R) of H2PC as well as all data sets used for the
empirical tests are publicly available.Comment: arXiv admin note: text overlap with arXiv:1101.5184 by other author
Impact of information presentation modes on online shopping: An empirical evaluation of a broadband interactive shopping service
With the increasing cost-effectiveness of communication technologies, online shopping has emerged as one of the most important areas of electronic commerce. A major problem facing online shopping service providers is the heterogeneity of user profile. Unlike organizational systems that have a well-defined universe of users and system boundary, these shopping services are designed for public users with very different cognitive and demographic profiles. The major challenge lies in designing friendly and effective user interfaces for online shoppers. Previous studies on online shopping suggest that a good user interface with an appropriate mode of information presentation is the key to system acceptance. In this article, we report on an empirical study that looks at product information presentation modes in an actual broadband supermarket shopping environment. Four prototypes with different combinations of text and picture displays were developed and evaluated in an experimental setting. The findings suggest that there is a close relation between product familiarity and shopping effectiveness. When the system is used to purchase familiar product items, pictures are better than text in terms of both efficiency and effectiveness. However, when users are not familiar with the product items, the advantages of pictures over text diminish. Implications of the findings and future research areas are discussed.published_or_final_versio
An axiomatic theory for information retrieval
Systemen die aan de hand van een vraagstelling relevante informatie opleveren worden
information retrieval (IR) systemen genoemd. Deze systemen spelen een steeds belang-
rijker rol in de informatievoorziening, zeker gezien de toenemende mate waarin docu-
menten met ongestructureerde informatie (zoals rapporten, memo's, verslagen, foto's en
video's) voor nader gebruik worden opgeslagen en het toenemend gebruik van digitale
bibliotheken voor dit doel. Helaas komt het maar al te vaak voor dat opgeslagen rele-
vante informatie, indien nodig, niet meer terug te vinden is. Dit is een gevolg van het
feit dat het heel lastig is om te bepalen of een document relevant is voor een gegeven
vraagstelling. Het terugvinden van relevante informatie, met uitsluiting van irrelevante
informatie, wordt bovendien bemoeilijkt door het feit dat informatie niet meer in een
statisch informatiedomein staat opgeslagen maar, mede door de opkomst van het digitale
wegennet (Internet), zich kan bevinden in diverse, over de wereld verspreide, dynamische
informatiedomeinen.
De essentie van het zoeken naar relevante informatie kan als volgt omschreven worden:
`Op welke wijze kan men relevante informatie onderscheiden van niet-relevante
informatie met betrekking tot een zekere informatiebehoefte.'
Naarmate een informatiedomein meer informatie bevat en er meer informatiedomeinen
moeten worden doorzocht, wordt de rol van een IR-systeem belangrijker. Handmatige
controle van het resultaat -is alle relevante informatie nu wel gevonden?- is onmogelijk
geworden. Het wordt zodoende steeds belangrijker om op een verantwoorde wijze een
IR-systeem, of een combinatie van meerdere IR-systemen, te selecteren.
Om te helpen bij het maken van een verantwoorde keuze wordt in dit proefschrift
een theoretisch raamwerk voor IR-systemen gepresenteerd. In dit raamwerk wordt vooral
gekeken naar de wijze waarop in een IR-systeem een relevantie-beslissing tot stand komt.
Aan de hand van deze studie zijn we in staat kwalitatieve uitspraken te doen over de
relevantie-beslissingen van verschillende IR-systemen en kunnen we op deze manier ko-
men tot een vergelijking van hun doelmatigheid.
Als uitgangspunt geldt dat ieder IR-systeem een bepaalde methode heeft om te beslis-
sen of een document relevant is gegeven een vraagstelling. Deze methode is afgeleid aan
de hand van een model. Een IR-model is gebaseerd op de volgende drie fundamenten:
191?192 Samenvatting
(i) de documentrepresentatie
voor de meeste IR-modellen is dit gewoon een verzameling representatieve tref-
woorden (keywords) maar steeds vaker gebruikt men tegenwoordig meer complexe
representaties die de inhoud van een document preciezer omschrijven.
(ii) de vraagstelling
deze wordt meestal zo samengesteld dat deze direct passend is op de documentre-
presentatie van het model. In veel modellen kan een vraagstelling worden samen-
gesteld met behulp van connectoren zoals `en', `of', en `niet'.
(iii) de matchingfunctie
deze functie bepaalt of een documentrepresentatie relevant geacht kan worden ge-
geven de vraagstelling. Sommige modellen maken hierbij gebruik van opgeslagen
kennis zoals die bijvoorbeeld aanwezig is in een thesaurus. Een matchingfunctie
kan in plaats van relevant of niet relevant ook gradaties aangeven door middel van
een rankingproces.
Information retrieval onderzoekers voeren vele discussies of de aanpak in model X beter
is dan de aanpak in model Y. In deze discussie kiest men vaak positie aan de hand van
toetsen die plaats vinden op grote, speciaal geprepareerde testcollecties (bijvoorbeeld de
TREC testcollectie die meer dan 3 gigabyte aan informatie bevat). In zogenaamde recall
en precision-berekeningen worden de resultaten van de toetsen omgezet in statistische
waarden, die aangeven hoe doortastend en accuraat een bepaald IR-systeem is. De
recallwaarde geeft aan hoeveel relevante documenten door het systeem zijn opgeleverd
ten opzichte van de in het informatiedomein aanwezige relevante documenten. Precision
geeft aan hoeveel opgeleverde documenten daadwerkelijk relevant zijn. Een hoge recall
geeft dus aan dat het IR-systeem min of meer alles gevonden heeft wat relevant is, een
hoge precision geeft aan dat alles wat door het systeem gevonden is, ook relevant is.
In dit proefschrift wordt, in plaats van een experimentele, een theoretische vergelij-
kingsmethode voor IR-systemen gepresenteerd. Omdat elk IR-model gebaseerd is op een
geschikt begrip van `relevantie', wordt eerst onderzocht hoe dit begrip kan worden ge-
formaliseerd. In 1971 introduceerde Cooper een objectieve notie van relevantie genaamd
`logisch relevant'. Deze notie plaatst het begrip relevantie in een logische context, en
onttrekt het aan subjectieve interpretaties. Bij logische relevantie gaat het erom of men
op een logische wijze een relevantie-beslissing kan a eiden. Om verwarring tussen de be-
grippen `relevant' en `logisch relevant' te vermijden, gebruiken we determ omtrentheid
(in het engels `aboutness') om aan te duiden dat informatie omtrent andere informatie
is. In 1986 presenteerde Van Rijsbergen het idee om te onderzoeken of er een logica,
dus een taal en een formeel bewijssysteem, bestaat die de omtrentheid-relatie kan de-
ni?eren. In dit proefschrift wordt aangetoond dat dit mogelijk is. Dit is vervolgens het?193
uitgangspunt van onze vergelijkingsmethode: stel dat omtrentheid is te karakteriseren in
termen van een logica, dan kan van ieder IR-model een bewijssysteem van omtrentheid
gegeven worden. Zo kunnen we dus IR-modellen aan de hand van hun bewijssystemen
gaan vergelijken.
In dit proefschrift worden de omtrentheidsbeslissingen van een aantal bekende IR-
modellen onderzocht en vervolgens vergeleken. Daarvoor wordt eerst in hoofdstuk 3
een theoretisch raamwerk samengesteld, waarin de fundamenten van de IR-systemen
uitgedrukt kunnen worden. Binnen dit raamwerk wordt een taal geformuleerd waarin
representaties van documenten en vraagstellingen beschreven kunnen worden. Deze taal
is gebaseerd op de zogenaamde Situation Theory. De representaties van documenten en
de vraagstellingen worden vertaald naar situaties. Rest de vraag wanneer een bepaalde
situatie omtrent een andere situatie is.
Om deze vraag te beantwoorden presenteren we een aantal axioma's en a eidingsre-
gels (tezamen postulaten genoemd). Deze postulaten drukken bepaalde karakteristieke
eigenschappen van `omtrentheid' uit. Zo is er bijvoorbeeld de regel Symmetry. Deze regel
stelt dat er geen enkel verschil bestaat tussen concluderen dat situatie S omtrent situatie
T is en concluderen dat situatie T omtrent situatie S is. Met behulp van een taal en een
keuze uit de axioma's en de regels, kan een bewijssysteem voor omtrentheid gecre?eerd
worden. In dit systeem kunnen we dan stapsgewijs, gegeven een aantal feitelijkheden
(de axioma's) en bepaalde regels, a eiden of een situatie omtrent een andere situatie is.
Deze manier van redeneren kunnen we op IR-modellen toepassen.
In hoofdstuk 4 postuleren we zes bekende IR-modellen vanuit deze invalshoek. Na de
presentatie van elk model worden de taal van situaties, de axioma's en de a eidingsregels
gegeven die horen bij het model. Om aan te kunnen tonen dat het bewijssysteem ook
inderdaad het IR-model representeert, worden gezondheid en volledigheid theorema's be-
wezen. Is een bewijssysteem gezond ten opzichte van het model dan betekent dit dat alles
wat in het bewijssysteem bewezen kan worden ook inderdaad een omtrentheidsbeslissing
van het model is. Volledigheid stelt het omgekeerde: alle omtrentheidsbeslissingen van
het model kunnen ook bewezen worden met het voorgestelde systeem.
In hoofdstuk 5 gebruiken we de theorie om IR-systemen te vergelijken. We vergelijken
IR-modellen op basis van hun bewijssystemen. Sommige systemen zijn `bevat' in andere
systemen. Een systeem A is bevat in een systeem B als iedere omtrentheidsbeslissing
van A ook een omtrentheidsbeslissing van B is en als bovendien de taal van A een
deelverzameling van de taal van B is. In hoofdstuk 5 deni?eren we verschillende niveaus
van bevat zijn, om vervolgens tot een overzicht tekomen op welke wijze de zes modellen
aan elkaar gerelateerd zijn.
Men kan zich nu richten op de vraag wat het voor een relevantie-beslissing van een
IR-model A ten opzichte van de relevantie-beslissing van model B betekent dat het
corresponderend bewijssysteem van A bevat is in het bewijssysteem van B. Het is dan?194 Samenvatting
mogelijk om kwalitatieve uitspraken te doen over kwantitatieve grootheden zoals recall
en precision. Zo wordt in hoofdstuk 5 bewezen dat als een omtrentheidsrelatie monotoon
1
is, een uitbreiding van de documentrepresentatie (zoals het toevoegen van woorden aan
de beschrijving van het een document) nooit zal leiden tot een verlaging van de recall.
Bovendien kunnen we uitspraken doen over de recall-waarde, en in enkele gevallen over
de precision-waarde, van de gepresenteerde modellen ten opzichte van elkaar.
In hoofdstuk 6 presenteren we drie door ons onderzochte mogelijke toepassingen van
de theorie. Allereerst gebruiken we de theorie om te analyseren op welke wijze men IR-
systemen met elkaar kan combineren. De aandachtspunten zijn dan welke systemen aan
elkaar gekoppeld kunnen worden, en op welke wijze, en of dit inderdaad leidt tot een beter
resultaat. Vervolgens geven we aan dat een ordening op bewijssystemen kan leiden tot
een preferenti?ele ordening van documenten. Bovendien kan men, gegeven een gewenste
ordening op bewijssystemen, het rankingproces van IR-systemen inspecteren. Tenslotte
wordt in hoofdstuk 6 getoond op welke wijze men de meta-theorie kan toepassen als
modelleringsmethode voor IR ge-ori?enteerde hypermedia toepassingen.
Samenvattend, met behulp van de theorie die in dit proefschrift wordt opgebouwd,
kan men analyseren op welke wijze IR-systemen besluiten dat een document relevant is
gegeven een vraagstelling. Deze analyse kan men op velerlei manieren toepassen. Het
is mogelijk om de beslisstappen te vergelijken, te verbeteren en te koppelen. De theorie
is ook toepasbaar om andere aspecten, zoals ordening van documenten en hypermedia-
toepassingen, te bestuderen.
1
Monotoon betekent hier: als voor iedere situatie S; T en U geldt dat: als S omtrent T is dan is S
verenigd met U omtrent T
Design of an E-learning system using semantic information and cloud computing technologies
Humanity is currently suffering from many difficult problems that threaten the life and survival of the human race. It is very easy for all mankind to be affected, directly or indirectly, by these problems. Education is a key solution for most of them. In our thesis we tried to make use of current technologies to enhance and ease the learning process.
We have designed an e-learning system based on semantic information and cloud computing, in addition to many other technologies that contribute to improving the educational process and raising the level of students. The design was built after much research on useful technology, its types, and examples of actual systems that were previously discussed by other researchers.
In addition to the proposed design, an algorithm was implemented to identify topics found in large textual educational resources. It was tested and proved to be efficient against other methods. The algorithm has the ability of extracting the main topics from textual learning resources, linking related resources and generating interactive dynamic knowledge graphs. This algorithm accurately and efficiently accomplishes those tasks even for bigger books. We used Wikipedia Miner, TextRank, and Gensim within our algorithm. Our algorithm‘s accuracy was evaluated against Gensim, largely improving its accuracy.
Augmenting the system design with the implemented algorithm will produce many useful services for improving the learning process such as: identifying main topics of big textual learning resources automatically and connecting them to other well defined concepts from Wikipedia, enriching current learning resources with semantic information from external sources, providing student with browsable dynamic interactive knowledge graphs, and making use of learning groups to encourage students to share their learning experiences and feedback with other learners.Programa de Doctorado en IngenierÃa Telemática por la Universidad Carlos III de MadridPresidente: Luis Sánchez Fernández.- Secretario: Luis de la Fuente ValentÃn.- Vocal: Norberto Fernández GarcÃ
The Theoretical Learning Impact of a Summer Engineering Program Curriculum for Underrepresented Middle School Students
This mixed methods, exploratory and confirmatory study was designed to evaluate the theoretical learning impact of a innovative summer engineering program curriculum would have on its audience, middle school minority students. Several theories were used to develop the innovative curriculum including Human Constructivism, cultural learning styles of African Americans, visual spatial learning and graphic design learning. This study was completed in two phases: evaluation of existing middle school summer engineering program curriculum for best practices and development of innovative curriculum and expert evaluation of the innovative curriculum. Three existing programs from across the country participated in this study. Five engineering education experts evaluated the innovative curriculum. The innovative curriculum is composed of three extensive units that include forces and motion, earth and space science and energy topics. A mixed methods design was used in data collection and analysis to provide a complete view of the theoretical impact of the curriculum. The resulting qualitative and quantitative data indicated the innovative program would enhance its target audience by providing a strong foundation in the fundamental understanding of science and engineering topics and spatial visualization. The qualitative narratives proved that many of the existing programs provide very similar learning environments that do not necessarily include cultural learning, meaningful learning and visual spatial learning. The expert evaluators collectively determined that the innovative program would have a positive and enriching academic impact with the chosen theoretical components. They believed that there was overwhelming evidence (3.7 rating average out of a 4.0) that the theoretical components existed in the curriculum and would provide middle school minority students with the proper knowledge to increase their interest which would inherently increase the science, technology, engineering, and mathematics career pipelines. They also strongly agreed (4.875 rating average out of 5) that the program differed from other program, has relevant learning theories for the target audience exceeded expectations and all the participants of the future program to “see themselves as engineers.
- …