612 research outputs found
Probabilistic models for human behavior learning
The problem of human behavior learning is a popular interdisciplinary research topic that
has been explored from multiple perspectives, with a principal branch of study in the
context of computer vision systems and activity recognition. However, the statistical methods
used in these frameworks typically assume short time scales, usually of minutes or even
seconds. The emergence of mobile electronic devices, such as smartphones and wearables,
has changed this paradigm as long as we are now able to massively collect digital records
from users. This collection of smartphone-generated data, whose attributes are obtained in
an unobtrusive manner from the devices via multiple sensors and apps, shape the behavioral
footprint that is unique for everyone of us. At an individual level, the data projection also
di ers from person to person, as not all sensors are equal, neither the apps installed, or the
devices used in the real life. This point actually reflects that learning the human behavior
from the digital signature of users is an arduous task, that requires to fuse irregular data.
For instance, collections of samples that are corrupted, heterogeneous, outliers or have shortterm
correlations. The statistical modelling of this sort of objects is one of the principal
contributions of this thesis, that we study from the perspective of Gaussian processes (gp).
In the particular case of humans, as well as many other life species in our world, we are
inherently conditioned to the diurnal and nocturnal cycles that everyday shape our behavior,
and hence, our data. We can study these cycles in our behavioral representation to see that
there exists a perpetual circadian rhytm in everyone of us. This tempo is the 24h periodic
component that shapes the baseline temporal structure of our behavior, not the particular
patterns that change for every person. Looking to the trajectories and variabilities that our
behavior may take in the data, we can appreciate that there is not a single repetitive behavior.
Instead, there are typically several patterns or routines, sampled from our own dictionary,
that we choose for every special situation. At the same time, these routines are arbitrary
combinations of di erents timescales, correlations, levels of mobility, social interaction, sleep
quality or will for working during the same hours on weekdays. Together, the properties of
human behavior already indicate to us how we shall proceed to model its structure, not as
unique functions, but as a dictionary of latent behavioral profiles. To discover them, we have
considered latent variable models.
The main application of the statistical methods developed for human behavior learning
appears as we look to medicine. Having a personalized model that is accurately fitted to
the behavioral patterns of some patient of interest, sudden changes in them could be early
indicators of future relapses. From a technical point of view, the traditional question use to
be if newer observations conform or not to the expected behavior indicated by the already
fitted model. The problem can be analyzed from two perspectives that are interrelated, one
more oriented to the characterization of that single object as outlier, typically named as
anomaly detection, and another focused in refreshing the learning model if no longer fits to
the new sequential data. This last problem, widely known as change-point detection (cpd)
is another pillar of this thesis. These methods are oriented to mental health applications,
and particularly to the passive detection of crisis events. The final goal is to provide an
early detection methodology based on probabilistic modeling for early intervention, e.g. prevent
suicide attempts, on psychiatric outpatients with severe a ective disorders of higher
prevalence, such as depression or bipolar diseases.El problema de aprendizaje del comportamiento humano es un tema de investigación interdisciplinar
que ha sido explorado desde múltiples perspectivas, con una línea de estudio
principal en torno a los sistemas de visión por ordenador y el reconocimiento de actividades.
Sin embargo, los métodos estadísticos usados en estos casos suelen asumir escalas de tiempo
cortas, generalmente de minutos o incluso segundos. La aparición de tecnologías móviles,
tales como teléfonos o relojes inteligentes, ha cambiado este paradigma, dado que ahora es
posible recolectar ingentes colecciones de datos a partir de los usuarios. Este conjunto de
datos generados a partir de nuestro teléfono, cuyos atributos se obtienen de manera no invasiva
desde múltiples sensores y apps, conforman la huella de comportamiento que es única
para cada uno de nosotros. A nivel individual, la proyección sobre los datos difiere de persona
a persona, dado que no todos los sensores son iguales, ni las apps instaladas así como
los dispositivos utilizados en la vida real. Esto precisamente refleja que el aprendizaje del
comportamiento humano a partir de la huella digital de los usuarios es una ardua tarea,
que requiere principalmente fusionar datos irregulares. Por ejemplo, colecciones de muestras
corruptas, heterogéneas, con outliers o poseedoras de correlaciones cortas. El modelado estadístico de este tipo de objetos es una de las contribuciones principales de esta tesis, que
estudiamos desde la perspectiva de los procesos Gaussianos (gp).
En el caso particular de los humanos, así como para muchas otras especies en nuestro
planeta, estamos inherentemente condicionados a los ciclos diurnos y nocturnos que cada
día dan forma a nuestro comportamiento, y por tanto, a nuestros datos. Podemos estudiar
estos ciclos en la representación del comportamiento que obtenemos y ver que realmente
existe un ritmo circadiano perpetuo en cada uno de nosotros. Este tempo es en realidad
la componente periódica de 24 horas que construye la base sobre la que se asienta nuestro
comportamiento, no únicamente los patrones que cambian para cada persona. Mirando a las
trayectorias y variabilidades que nuestro comportamiento puede plasmar en los datos, podemos
apreciar que no existe un comportamiento único y repetitivo. En su lugar, hay varios
patrones o rutinas, obtenidas de nuestro propio diccionario, que elegimos para cada situación
especial. Al mismo tiempo, estas rutinas son combinaciones arbitrarias de diferentes escalas
de tiempo, correlaciones, niveles de movilidad, interacción social, calidad del sueño o iniciativa
para trabajar durante las mismas horas cada día laborable. Juntas, estas propiedades
del comportamiento humano nos indican como debemos proceder a modelar su estructura,
no como funciones únicas, sino como un diccionario de perfiles ocultos de comportamiento,
Para descubrirlos, hemos considerado modelos de variables latentes.
La aplicación principal de los modelos estadísticos desarrollados para el aprendizaje de
comportamiento humano aparece en cuanto miramos a la medicina. Teniendo un modelo
personalizado que está ajustado de una manera precisa a los patrones de comportamiento
de un paciente, los cambios espontáneos en ellos pueden ser indicadores de futuras recaídas.
Desde un punto de vista técnico, la pregunta clásica suele ser si nuevas observaciones encajan
o no con lo indicado por el modelo. Este problema se puede enfocar desde dos perspectivas
que están interrelacionadas, una más orientada a la caracterización de aquellos objetos como
outliers, que usualmente se conoce como detección de anomalías, y otro enfocado en refrescar
el modelo de aprendizaje si este deja de ajustarse debidamente a los nuevos datos secuenciales.
Este último problema, ampliamente conocido como detección de puntos de cambio (cpd) es otro de los pilares de esta tesis. Estos métodos se han orientado a aplicaciones de salud
mental, y particularmente, a la detección pasiva de eventos críticos. El objetivo final es
proveer de una metodología de detección temprana basada en el modelado probabilístico
para intervenciones rápidas. Por ejemplo, de cara a prever intentos de suicidio en pacientes
fuera de hospitales con trastornos afectivos severos de gran prevalencia, como depresión o
síndrome bipolar.Programa de Doctorado en Multimedia y Comunicaciones por la Universidad Carlos III de Madrid y la Universidad Rey Juan CarlosPresidente: Pablo Martínez Olmos.- Secretario: Daniel Hernández Lobato.- Vocal: Javier González Hernánde
Estudio experimental de costes para aprendizaje estadístico con etiquetas parciales
En este trabajo se aborda el estudio del comportamiento de conjuntos
de datos dotados tanto de un etiquetado supervisado como
de etiquetas parciales. Dicho estudio se realiza mediante el análisis
de costes para la función NLL o verosimilitud logarítmica negativa.
Se realizan además procesos de optimización con dos algoritmos
clásicos, steepest descent y Newton's method. La optimización
se realiza sobre la función NLL, empleándose observaciones generadas
artificialmente. La creación de los datos y su etiquetado, tanto
supervisado como parcial, viene acompañada de un modelo probabilístico ofrecido por la regresión logística. Se trata por tanto de
una evaluación de algoritmos de entrenamiento para un problema
de clasificación basado en etiquetas parciales. Todas las implementaciones
se llevan a cabo empleando técnicas de aprendizaje máquina y
siguiendo metodologías del aprendizaje. La evaluación y las conclusiones
sobre los resultados ofrecen las diferencias entre ambos tipos
de etiquetas y las pérdidas que se producen con los dos modelos.This work deals with the study of di erent types of data clusters.
These ones are classiffied with supervised labels and partial labels.
An analysis is performed about costs over the function NLL or negative
log-likelihood. Also classic optimization methods are applied,
for example: steepest descent and Newton's method. All the optimization
process is done using arti cially generated observations. The
creation of data and its labeling, both partial as supervised, is followed
by a probabilistic model originated with logistic regression.
Each implementation is made with machine learning techniques and
using also learning methodology. Evaluation of results and conclusions
provide di erences between both types of labeling and losses
that are produced by the two models.Ingeniería en Tecnologías de Telecomunicació
La estrategia global de conservación de plantas en España: protección in situ de la flora vascular
On Masked Pre-training and the Marginal Likelihood
Masked pre-training removes random input dimensions and learns a model that
can predict the missing values. Empirical results indicate that this intuitive
form of self-supervised learning yields models that generalize very well to new
domains. A theoretical understanding is, however, lacking. This paper shows
that masked pre-training with a suitable cumulative scoring function
corresponds to maximizing the model's marginal likelihood, which is de facto
the Bayesian model selection measure of generalization. Beyond shedding light
on the success of masked pre-training, this insight also suggests that Bayesian
models can be trained with appropriately designed self-supervision.
Empirically, we confirm the developed theory and explore the main learning
principles of masked pre-training in large language models
Big data in tourism marketing: past research and future opportunities
[EN] Purpose – The purpose of this study was to uncover representative emergent areas and to examine the
research area of marketing, tourism and big data (BD) to assess how these thematic areas have developed
over a 27-year time period from 1996 to 2022. This study analyzed 1,152 studies to identify the principal
thematic areas and emergent topics, principal theories used, predominant forms of analysis and the most
productive authors in terms of research.
Design/methodology/approach – The articles for this research were all selected from the Web of
Science database. A systematic and quantitative literature review was performed. This study used
SciMAT software to extract indicators. Specifically, this study analyzed productivity and produced
a science map.
Findings – The findings suggest that interest in this area has increased gradually. The outputs also
reveal the innovative effort of industry in new technologies for developing models for tourism marketing.
Ten research areas were identified: “destination marketing,” “mobility patterns,” “co-creation,”
“gastronomy,” “sustainability,” “tourist behavior,” “market segmentation,” “artificial neural networks,”
“pricing” and “tourist satisfaction.”
Originality/value – This work is unique in proposing an agenda for future research into tourism
marketing research with new technologies such as BD and artificial intelligence techniques. In addition, the
results presented here fill the current gap in the research since while there have been literature reviews
covering tourism with BD or marketing, these areas have not been studied as a whole.[ES] El objetivo de esta investigación fue descubrir nichos representativos de áreas emergentes y examinar el área de Marketing, Turismo y Big Data, evaluando cómo han evolucionado estas áreas temáticas durante un período de 27 años desde 1996–2022. Analizamos 1.152 investigaciones para identificar las principales áreas temáticas y temas emergentes, las principales teorías utilizadas, las formas de análisis predominantes y los autores mas productivos en términos de investigación. Metodología – Todos los artículos para esta investigación fueron seleccionados de la base de datos Web of Science. Realizamos una revisión sistemática y cuantitativa de la literatura. Utilizamos el software SciMAT para extraer indicadores. Específicamente, analizamos la productividad y elaboramos un mapeo científico. Hallazgos – Los hallazgos sugieren que el inter es en esta área ha aumentado gradualmente. Los resultados también revelan el esfuerzo innovador de la industria en nuevas tecnologías para desarrollar modelos de marketing turístico. Se identificaron diez áreas de investigación (“marketing de destinos”, “patrones de movilidad”, “cocreación”, “gastronomía”, “sostenibilidad”, “comportamiento turístico”, “segmentación de mercado”, “redes neuronales artificiales”, “precios”, y “satisfacción del turista”). Valor – Este trabajo es único al proponer una agenda para futuras investigaciones en investigación de Marketing Turístico con nuevas tecnologías como Big Data y técnicas de Inteligencia Artificial. Además, los resultados presentados aquí llenan el vacío actual en la investigación ya que si bien se han realizado revisiones de literatura que cubren Turismo con Big Data o Marketing, estas áreas no se han estudiado como un conjunto.SIThis research was funded by Ministerio de Industria, Comercio y Turismo (Spain), AEI-010500–2020-253(DTI^A Project: 4.0 technological tools for measurement, evaluation and monitoring of the Friendliness concept linked to the Smart Tourist Destinations
How can destinations get engagement on Instagram? Artificial Intelligence as a tool for photo analysis
[EN] What type of content should be published on Instagram to get more engagement? This article highlights the different characteristics that the images of tourists show on Instagram with the most engagement, that is likes and comments. Understanding the behavior in a destination helps tourism managers in marketing strategies. Based on the stimulus-organism-response model, a content analysis of 49,540 photographs shared by tourists that received 3,734,384 likes and 133,497 comments is carried out. By combining the content analysis with Kruskal-Wallis non-parametric tests, the results show that the different characteristics found in the images imply different amounts between comments and likes, demonstrating that the behavior of users on Instagram is influenced by the different attributes of the images. Specifically, images that feature people get more engagement than destination-focused ones. Additionally, scenes such as gastronomy and nature get less engagement than scenes such as old and new heritage, outdoors, and entertainment. Specifically, photos with people get greater rate of comments than likes, and if the format is selfie, they also get more comments. The implications of this research directly affect destination managers, offering clues about the content generated by tourists that produces the most engagement, thus attracting potential tourists and Instagram users.Blanco-Moreno, S.; González-Fernández, AM.; Muñoz-Gallego, PA. (2023). How can destinations get engagement on Instagram? Artificial Intelligence as a tool for photo analysis. Editorial Universitat Politècnica de València. 123-124. http://hdl.handle.net/10251/20171412312
- …