10 research outputs found

    The relation between Pearson's correlation coefficient r and Salton's cosine measure

    Full text link
    The relation between Pearson's correlation coefficient and Salton's cosine measure is revealed based on the different possible values of the division of the L1-norm and the L2-norm of a vector. These different values yield a sheaf of increasingly straight lines which form together a cloud of points, being the investigated relation. The theoretical results are tested against the author co-citation relations among 24 informetricians for whom two matrices can be constructed, based on co-citations: the asymmetric occurrence matrix and the symmetric co-citation matrix. Both examples completely confirm the theoretical results. The results enable us to specify an algorithm which provides a threshold value for the cosine above which none of the corresponding Pearson correlations would be negative. Using this threshold value can be expected to optimize the visualization of the vector space

    Method for Determining the Similarity of Text Documents for the Kazakh language, Taking Into Account Synonyms: Extension to TF-IDF

    Full text link
    The task of determining the similarity of text documents has received considerable attention in many areas such as Information Retrieval, Text Mining, Natural Language Processing (NLP) and Computational Linguistics. Transferring data to numeric vectors is a complex task where algorithms such as tokenization, stopword filtering, stemming, and weighting of terms are used. The term frequency - inverse document frequency (TF-IDF) is the most widely used term weighting method to facilitate the search for relevant documents. To improve the weighting of terms, a large number of TF-IDF extensions are made. In this paper, another extension of the TF-IDF method is proposed where synonyms are taken into account. The effectiveness of the method is confirmed by experiments on functions such as Cosine, Dice and Jaccard to measure the similarity of text documents for the Kazakh language.Comment: 2022 International Conference on Smart Information Systems and Technologies (SIST

    How to Normalize Co-Occurrence Data? An Analysis of Some Well-Known Similarity Measures

    Get PDF
    In scientometric research, the use of co-occurrence data is very common. In many cases, a similarity measure is employed to normalize the data. However, there is no consensus among researchers on which similarity measure is most appropriate for normalization purposes. In this paper, we theoretically analyze the properties of similarity measures for co-occurrence data, focusing in particular on four well-known measures: the association strength, the cosine, the inclusion index, and the Jaccard index. We also study the behavior of these measures empirically. Our analysis reveals that there exist two fundamentally different types of similarity measures, namely set-theoretic measures and probabilistic measures. The association strength is a probabilistic measure, while the cosine, the inclusion index, and the Jaccard index are set-theoretic measures. Both our theoretical and our empirical results indicate that co-occurrence data can best be normalized using a probabilistic measure. This provides strong support for the use of the association strength in scientometric research

    Evaluación de aplicaciones educativas de AR con estudiantes adultos

    Get PDF
    There is a growing interest in the educational applications of Augmented Reality (AR). While most applications of these technologies have been examined in the context of children education, our knowledge about their usefulness in adult education is deficient and particularly more in the category of Location-Based Augmented Reality (LBMAR) games, so the aim of this thesis is to examine the opinions of adult learners (young, middle-aged and elderly) about one particular LBMAR game, the “Ingress”. The main problems addressed by this research comprise questions relating to the usefulness of some key technological components of AR in education (secondarily) and to aspects of training adults by using AR (primarily). As concerns the technological aspects, i.e. "which one of the three types of AR (marker-based, markerless, location-based) is more often associated with naturalistic approaches and what are their relative advantages?”, this research showed that naturalistic approaches applied to marker-based AR enhance active participation in virtual environments, motivate learners, promote personal involvement in conquering new information, offer different perspectives of the content and arouse interest for knowledge. In the case of markerless AR, naturalistic designs foster participants’ collaboration in games, enhance interactivity, offer panoramic views, visualization, and the possibility to examine the role of visual controls. Moreover, naturalistic approaches applied to location-based AR are suitable for designing multidisciplinary applications, can be used for training and have the possibility to be designed so as to account for locality and context. The fact that, as appears from the peer-reviewed literature that was examined, the location-based AR technologies are more appropriate for education and for smartphones, hints that a deeper examination of their potential usefulness for education (and for adult education in particular) might be interesting. As concerns the educational aspects, which also constitute the main focus of the thesis, these focus on the exploration of the usefulness of the LBMAR game “Ingress” in adult education, by answering two intertwined questions: a) how to assess opinions of adult learners about the LBMAR game “Ingress”? and b) what do adult learners think about this game and how do they perceive its features? Providing answers to these questions is tantamount to receiving adequate results from quantitative and qualitative empirical research which would be designed so as to explore their opinions, views and attitudes with respect to this LBMAR game. Hence, 45 adult persons from Greece, aged 20 to 62,cooperated as subjects of this research. They followed a short introductory informal training (on AR, VR, MAR and the games that are relevant to these technologies) by the researcher of this thesis and were subsequently given the instructions of how to use “Ingress” on a smartphone. The quantitative research was carried out before and after training and all trainees participated by filling 31 Likert-type closed questions before and after training. The qualitative research was based on the analysis of their responses to two different sets of open-ended questions. The first set consisted in 5 such questions to which answered 24 participants and the second set had 2 broader questions to which responded 36 participants. This research showed the advantages for adult education of integrating the ARCS model into the learning phase of an LBMAR game. Specifically, it was shown that using Keller’s widely known “ARCS model” (Attention – Relevance – Confidence - Satisfaction) enabled the classification of users’ responses with respect to their interaction with the game and is therefore useful in evaluating adult education with LBMAR games. The players’ responses did not change linearly with their age and the training has had different impact on each age group of learners. Also, statistical analyses proved that training increased the scores of the factors of ARCS model. Other results of this research showed that those over 36 years old focused more on the facts that the play of “Ingress” is primarily a geographical game and its scenario reflects interesting discussions about the evolution of humanity. Participants in the age groups 20–35 and >52 agreed that the game does not have idle phases, that it combines excitement with insecurity, and that it is pleasant to play locally a game of planetary proportions.Another age-related observation concerned the answers to the question (“How do you feel when you endow the geographical space with personal preferences?”) between age groups with age groups agreeing in pairs: the first two age groups (20–30) and (30–40) agreed more than with the last two (40–50) and (50–60). Yet, in question “Do you think that the game offers opportunities for learning and teaching geography, building on your previous geographical knowledge?” , there was an overlap in the responses of participants among age groups. As for the first question, the most critical concept was: “the users feel a kind of nostalgia”, followed by the concept “the users consider portals as personal creations”. In the case of the second question, the most critical concept was that the participants believe that the game offers entirely new opportunities for education in geography, compared with their previous experiences. This fosters an evidence of constructivist approaches to adult education and, also, relevance of some other prominent theories of adult education such as humanism. Methodologically, this research it was shown that content analysis is a valuable method for exploring opinions and attitudes of adult users towards MAR games and Jaccard indices can be used to quantitatively explore themes emerging from content analysis. Content analysis was performed on the users’ responses qualitatively in order to identify characteristic sentences expressing attitudes and opinions. For the quantitative assessment of similarities between responses for each question and subconcept, the Jaccard similarity index was calculated pair-wise for every pair of participants. In addition to the Jaccard indices and furthering the scope of new methods for content analysis, this thesis shows how to use Social Network Analysis (SNA) to model concept maps, thus opening up excellent opportunities to create visualizations of concepts and their inter-relationships. Quantitative aspects of SNA analysis (i.e. by using radial centrality and information centrality) provide mechanisms suitable to measure internal relationships in concept maps (in addition to visual inspection) that would not otherwise be visible. Using SNA enabled the classification of users’ responses with respect to their interaction with the game and therefore was a fruitful approach for education that involves MAR games. Furthermore, with this novelty, it is shown how texts derived from interviews or from responses to open questions by different individuals can be analyzed both qualitatively and quantitatively with SNA. Concluding, this research has produced novelties at both the educational and the methodological levels. As concerns adult education, it was shown that i) LBMAR games are suitable for it, ii) adult education about them can be enhanced by following Keller’s ARCS model, iii) perception and satisfaction of adult learners depends on age, and iv) certain theories of adult education (i.e. constructivism and humanism) can be relevant when adult learners use LBMAR games such as “Ingress”. As concerns methods of educational research, this research suggested entirely new methods, for first time ever, for analyzing data that are derived from trainees' responses to open questions. These new methods are content analysis of the participants’ responses with the use of Jaccard indices and methods of SNA and can have a wider applicability to educational research.Existe un creciente interés por las aplicaciones educativas de la Realidad Aumentada (RA). Mientras que la mayoría de las aplicaciones de estas tecnologías se han examinado en el contexto de la educación infantil, nuestro conocimiento sobre su utilidad en la educación de adultos es deficiente y, en particular, más en la categoría de juegos de Realidad Aumentada Basada en la Localización (LBMAR), por lo que el objetivo de esta tesis es examinar las opiniones de los estudiantes adultos (jóvenes, de mediana edad y mayores) sobre un juego LBMAR, el "Ingress". Los principales problemas que aborda esta investigación comprenden cuestiones relacionadas con la utilidad de algunos componentes tecnológicos de la RA en la educación (secundariamente) y con aspectos de la formación de adultos mediante el uso de la RA (principalmente). En cuanto a los aspectos tecnológicos, es decir "¿cuál de los tres tipos de RA (basada en marcadores, sin marcadores, basada en la localización) se asocia más a los enfoques naturalistas y cuáles son sus ventajas relativas?", esta investigación demostró que los enfoques naturalistas aplicados a la RA basada en marcadores potencian la participación activa en entornos virtuales, motivan a los alumnos, promueven la implicación personal en la conquista de nueva información, ofrecen diferentes perspectivas del contenido y despiertan el interés por el conocimiento. En el caso de la RA sin marcadores, los diseños naturalistas fomentan la colaboración de los participantes en los juegos, mejoran la interactividad, ofrecen vistas panorámicas, visualización y la posibilidad de examinar los controles visuales. Además, los enfoques naturalistas aplicados a la RA basada en la localización son adecuados para el diseño de aplicaciones multidisciplinares, pueden utilizarse para la formación y tienen la posibilidad de diseñarse teniendo en cuenta la localidad y el contexto. El hecho de que, como se desprende de la literatura revisada por pares que se examinó, las tecnologías de RA basadas en la localización son más apropiadas para la educación y para los teléfonos smartphones, sugiere que podría ser interesante un examen más profundo de su utilidad potencial para la educación (y para la educación de adultos en particular). En cuanto a los aspectos educativos, que también constituyen el foco principal de la tesis, éstos se centran en la exploración de la utilidad del juego LBMAR "Ingress" en la educación de adultos, respondiendo a dos preguntas entrelazadas: a) ¿cómo evaluar las opiniones de los alumnos adultos sobre el juego LBMAR "Ingress"? y b) ¿qué piensan los alumnos adultos sobre este juego y cómo perciben sus características? Dar respuesta a estas preguntas equivale a recibir resultados adecuados de una investigación empírica, cuantitativa y cualitativa, que se diseñaría para explorar sus opiniones, puntos de vista y actitudes con respecto a este juego LBMAR. Por lo tanto, 45 personas adultas de Grecia, con edades entre 20 y 62 años, colaboraron como sujetos de esta investigación. Siguieron una breve formación informal introductoria por parte del investigador de esta tesis (sobre RA, realidad virtual, RA móvil, y sobre los juegos relacionados con estas tecnologías) y posteriormente se les dieron las instrucciones de cómo utilizar "Ingress" en un smartphone. La investigación cuantitativa se llevó a cabo antes y después de la formación y todos los alumnos participaron respondiendo a 31 preguntas cerradas del tipo Likert antes y después de la formación. La investigación cualitativa se basó en el análisis de sus respuestas a dos conjuntos diferentes de preguntas abiertas. El primer conjunto constaba de 5 preguntas de este tipo (a las que respondieron 24 participantes) y el segundo conjunto tenía 2 preguntas más amplias, a las que respondieron 36 participantes. La investigación cuantitativa mostró las ventajas para la educación de adultos de integrar el modelo ARCS en la fase de aprendizaje de un juego LBMAR. En concreto, se demostró que la utilización del conocido "modelo ARCS" de Keller (Atención - Relevancia - Confianza - Satisfacción) permitió clasificar las respuestas de los usuarios con respecto a sus interacciones con el juego y, también, es útil para evaluar la educación de adultos con juegos LBMAR. Las respuestas de los jugadores no cambiaron linealmente con su edad y el entrenamiento ha tenido un impacto diferente en cada grupo de edad de los alumnos. Además, los análisis estadísticos demostraron que el entrenamiento aumentó las puntuaciones de los factores del modelo ARCS. Otros resultados de esta investigación mostraron que los mayores de 36 años se centraron más en el hecho de que el juego "Ingress" es principalmente un juego geográfico y su escenario refleja interesantes debates sobre la evolución de la humanidad. Las opiniones de los participantes de los grupos de edad de 20-35 y >52 coincidieron en que el juego no tiene fases ociosas, que combina la emoción con la inseguridad y que es agradable jugar a nivel local a un juego de proporciones planetarias. Otra observación relacionada con la edad se refería a las respuestas a la pregunta ("¿Cómo te sientes cuando dotas al espacio geográfico de preferencias personales?") entre grupos de edad que coincidían: los dos primeros grupos de edad (20-30) y (30-40) estaban más de acuerdo que los dos últimos (40-50) y (50-60). Sin embargo, en la pregunta "¿Crees que el juego ofrece oportunidades para aprender y enseñar geografía, aprovechando tus conocimientos geográficos previos?" hubo un solapamiento en las respuestas de los participantes entre los grupos de edad. En cuanto a la primera pregunta, el concepto más crítico fue: "los usuarios sienten una especie de nostalgia", seguido del concepto "los usuarios consideran los portales como creaciones personales". En el caso de la segunda pregunta, el concepto más crítico fue que los participantes creen que el juego ofrece oportunidades totalmente nuevas para la educación en geografía en comparación con sus experiencias anteriores. Esto fomenta una evidencia de los enfoques constructivistas de la educación de adultos y, también, la relevancia de algunas otras teorías prominentes de la educación de adultos, como el humanismo. Metodológicamente, esta investigación demostró también que el análisis de contenido es un método valioso para explorar las opiniones y actitudes de los usuarios adultos hacia los juegos MAR y los índices de Jaccard pueden utilizarse para explorar cuantitativamente los temas que surgen del análisis de contenido. El análisis de contenido se realizó sobre las respuestas de los usuarios de forma cualitativa para identificar las frases características que expresan actitudes y opiniones. Para la evaluación cuantitativa de las similitudes entre las respuestas de cada pregunta y subconcepto, se calculó el índice de similitud de Jaccard por parejas para cada par de participantes. Además de los índices de Jaccard y de ampliar el alcance de los nuevos métodos de análisis de contenido, esta tesis muestra cómo utilizar el Análisis de Redes Sociales (Social Networks Analysis - SNA) para modelar los mapas conceptuales, abriendo así excelentes oportunidades para crear visualizaciones de los conceptos y sus interrelaciones. Los aspectos cuantitativos del análisis SNA (es decir mediante el uso de la centralidad radial y la centralidad de la información) proporcionan mecanismos adecuados para medir las relaciones internas en los mapas conceptuales (además de la inspección visual) que de otro modo no serían visibles. El uso del SNA permitió la clasificación de las respuestas de los usuarios con respecto a su interacción con el juego y, por lo tanto, fue un enfoque fructífero para la educación que involucra los juegos MAR. Además, con esta novedad, se muestra cómo los textos derivados de las entrevistas o de las respuestas a las preguntas abiertas de diferentes individuos pueden ser analizados tanto cualitativamente como cuantitativamente usando SNA. En conclusión, esta investigación ha aportado novedades, tanto a nivel educativo como metodológico. En lo que respecta a la educación de adultos, se ha demostrado que i) los juegos LBMAR son adecuados para ella, ii) la educación de adultos sobre ellos puede mejorarse siguiendo el modelo ARCS de Keller, iii) la percepción y la satisfacción de los alumnos adultos depende de la edad, y iv) ciertas teorías de la educación de adultos (es decir, el constructivismo y el humanismo) pueden ser relevantes cuando los alumnos adultos utilizan juegos LBMAR como "Ingress". En cuanto a los métodos de investigación educativa, esta investigación sugirió métodos totalmente nuevos para analizar los datos que se derivan de las respuestas de los alumnos a las preguntas abiertas. Estos nuevos métodos son el análisis de contenido de las respuestas de los participantes con el uso de los índices de Jaccard y los métodos de SNA y pueden tener una aplicabilidad más amplia a la investigación educativa

    Ultrasound imaging system combined with multi-modality image analysis algorithms to monitor changes in anatomical structures

    Get PDF
    This dissertation concerns the development and validation of an ultrasound imaging system and novel image analysis algorithms applicable to multiple imaging modalities. The ultrasound imaging system will include a framework for 3D volume reconstruction of freehand ultrasound: a mechanism to register the 3D volumes across time and subjects, as well as with other imaging modalities, and a playback mechanism to view image slices concurrently from different acquisitions that correspond to the same anatomical region. The novel image analysis algorithms include a noise reduction method that clusters pixels into homogenous patches using a directed graph of edges between neighboring pixels, a segmentation method that creates a hierarchical graph structure using statistical analysis and a voting system to determine the similarity between homogeneous patches given their neighborhood, and finally, a hybrid atlas-based registration method that makes use of intensity corrections induced at anatomical landmarks to regulate deformable registration. The combination of the ultrasound imaging system and the image analysis algorithms will provide the ability to monitor nerve regeneration in patients undergoing regenerative, repair or transplant strategies in a sequential, non-invasive manner, including visualization of registered real-time and pre-acquired data, thus enabling preventive and therapeutic strategies for nerve regeneration in Composite Tissue Allotransplantation (CTA). The registration algorithm is also applied to MR images of the brain to obtain reliable and efficient segmentation of the hippocampus, which is a prominent structure in the study of diseases of the elderly such as vascular dementia, Alzheimer’s, and late life depression. Experimental results on 2D and 3D images, including simulated and real images, with illustrations visualizing the intermediate outcomes and the final results are presented.

    Localización y visualización de las principales líneas de investigación a través del análisis de co-palabras y del análisis de redes sociales. Propuesta metodológica para la delimitación temática de dominios científicos

    Get PDF
    Premio Extraordinario de Doctorado de la UAH en el año académico 2016-2017El objetivo principal de esta tesis doctoral se basa, fundamentalmente, en el diseño de una propuesta metodológica que posibilite la localización, identificación y visualización de las principales subdisciplinas científicas y líneas de investigación, favoreciendo así la delimitación temática de dominios científicos. La ciencia se caracteriza cada vez más por su multi e interdisciplinariedad. Esto dificulta la demarcación de los distintos ámbitos del conocimiento y complica la delimitación, definición y distribución de las diferentes áreas, categorías o aspectos temáticos involucrados en el desarrollo científico. Desde el punto de vista bibliométrico, este hecho plantea un gran reto metodológico, especialmente, en niveles de agregación muy concretos o en dominios caracterizados por una gran especificidad temática y más aún cuando la mayoría de las bases de datos bibliográficas no permiten una delimitación temática más específica que el nivel de áreas, categorías o disciplinas científicas. De este modo, el diseño metodológico ha consistido en la selección de distintos dominios científicos en cuanto a su cobertura temporal, geográfica y temática para comprobar su aplicabilidad con independencia del dominio científico que se analice. Por un lado, se ha utilizado la producción científica recogida en la base de datos Medline sobre salud y mujer durante el período 1965-2005 y por otro, la investigación española con células madre recogida en la base de datos Science Citation Expanded durante los años 1997-2012. Asimismo, la propuesta metodológica se caracteriza por el desarrollo y combinación de diferentes técnicas bibliométricas. En primer lugar, se basa en el empleo del análisis de co-palabras para la identificación de los términos más representativos a partir de su aparición conjunta en los documentos (Co-words Analysis). Concretamente, se han utilizado como unidades de análisis los términos de indización de las bases de datos bibliográficas utilizadas para el estudio, es decir, descriptores MeSH en el caso de Medline y los términos clave KeyWords Plus y Author Keywords en el caso del Science Citation Index Expanded. En segundo lugar, se han combinado técnicas bibliométricas procedentes del Análisis de Redes Sociales y de la representación y visualización de la información, fundamentalmente, mediante el uso de dos programas informáticos especializados como son Pajek y VOSviewer. En el caso del primero, éste se centra en la generación de mapas basados en grafos que en esta tesis han sido simplificados a través del algoritmo de poda Pathfinder Networks (PFNETs) y representados mediante el algoritmo de visualización Kamada Kawai. En el caso de VOSviewer éste se centra en la generación de mapas basados en la distancia a través de la visualización de similitudes (visualization of similarities ̶ VOS) y que utiliza diferentes técnicas de clustering en la representación gráfica. Dada las ventajas y limitaciones que conllevan el uso de una técnica frente a la otra se han utilizado ambos con la intención de que puedan ser utilizados de manera complementaria.Los resultados que se han obtenido en esta tesis doctoral han sido presentados en las seis publicaciones que la integran y que son consecuencia de las distintas fases de trabajo que fueron diseñadas. Concretamente, los resultados permiten concluir que la propuesta metodológica planteada es adecuada para la localización, identificación y visualización de las principales tendencias o líneas de investigación que caracterizan la producción científica, con independencia de la amplitud o especificidad del dominio utilizado y de la cobertura de las fuentes de información empleadas. Su adecuación metodológica para la delimitación temática la convierten en una herramienta con un gran potencial de cara al desarrollo de nuevos estudios bibliométicos en posibles investigaciones futuras. No obstante, y pese a ello, también esta propuesta metodológica puede ser objeto de mejora. En el futuro, podría ser interesante emplear otras técnicas de análisis como el Análisis de co-citación de Autores (ACA) o el empleo de otros términos como pueden ser los procedentes del título, resumen, palabras clave, etc., como unidades de análisis
    corecore