    Making Machines Learn. Applications of Cultural Analytics to the Humanities

    The digitization of several million books by Google in 2011 meant the popularization of a new kind of humanities research powered by the treatment of cultural objects as data. Culturomics, as it is called, was born, and other initiatives resonated with such a methodological approach, as is the case with the recently formed Digital Humanities or Cultural Analytics. Intrinsically, these new quantitative approaches to culture all borrow from techniques and methods developed under the wing of the exact sciences, such as computer science, machine learning or statistics. There are numerous examples of studies that take advantage of the possibilities that treating objects as data has to offer for the understanding of the human. This new data science that is now applied to the current trends in culture can also be replicated to study more traditional humanities. Led by proper intellectual inquiry, an adequate use of technology may bring answers to questions intractable by other means, or add evidence to long held assumptions based on a canon built from few examples. This dissertation argues in favor of such approach. Three different case studies are considered. First, in the more general sense of the big and smart data, we collected and analyzed more than 120,000 pictures of paintings from all periods of art history, to gain a clear insight on how the beauty of depicted faces, in the framework of neuroscience and evolutionary theory, has changed over time. A second study covers the nuances of modes of emotions employed by the Spanish Golden Age playwright Calderón de la Barca to empathize with his audience. By means of sentiment analysis, a technique strongly supported by machine learning, we shed some light into the different fictional characters, and how they interact and convey messages otherwise invisible to the public. The last case is a study of non-traditional authorship attribution techniques applied to the forefather of the modern novel, the Lazarillo de Tormes. In the end, we conclude that the successful application of cultural analytics and computer science techniques to traditional humanistic endeavours has been enriching and validating

    A framework for the analytical and visual interpretation of complex spatiotemporal dynamics in soccer

    Pla de Doctorat Industrial de la Generalitat de CatalunyaSports analytics is an emerging field focused on the application of advanced data analysis for assessing the performance of professional athletes and teams. In soccer, the integration of data analysis is in its initial steps, primarily due to the difficulty of making sense of soccer's complex spatiotemporal relationships and effectively translating findings to practitioners. Recently, the availability of spatiotemporal data has given rise to applying statistical approaches to address problems such as estimating passing and scoring probability, or the evaluation of players' mental pressure. However, most of these approaches focus on isolated aspects of the sport, while coaches tend to focus on the broader interplay of all 22 players on the pitch. To address the non-stop flow of questions that coaching staff deal with daily, we identify the need for a flexible analysis framework that allows us to answer these questions quickly, accurately, and in a visually-interpretable way while capturing the complex spatial and contextual factors that rule the game. We propose developing such a comprehensive framework through the concept of the expected possession value (EPV). First introduced in basketball, EPV constitutes an instantaneous estimate of the expected points to be scored at the end of a possession. However, aside from a shared high-level goal, our focus on soccer necessitates a drastically different approach to account for the sport's nuances, such as looser notions of possession, the ability of passes to happen at any location, and space-time dependent turnover evaluation. Following this, we propose modeling EPV in soccer by addressing the question, "can we estimate the expectation of a team scoring or conceding the next goal at any time in the game?" From here, we address a series of derived interrogations, such as how should the EPV expression be structured so coaches can more easily interpret it? Can we produce calibrated and interpretable estimates for each of its components? Can we develop representative and soccer-specific features with the aid of coaches? Is it possible to learn complex features from raw level spatiotemporal data? Finally, and most importantly, can we produce compelling practical applications? These questions are successfully addressed in this thesis, where we present a series of contributions for both the machine learning and soccer analytics fields related to the modeling and practical interpretation of complex spatiotemporal dynamics. We propose a decomposed modeling approach where a series of foundational soccer components can be estimated separately and then merged to provide a single EPV estimation, providing flexibility to this integrated model. From a practical standpoint, we leverage several function approximation approaches to exploit complex relationships in spatiotemporal tracking data. An essential contribution of this work is the proposal of SoccerMap, a flexible deep learning architecture capable of producing accurate and visually-interpretable probability surfaces in a broad range of problems. Based on a large set of spatial and contextual features developed, we model and provide accurate estimates for each of the components of the EPV components. The flexibility and interpretation capabilities of the proposed model allow us to produce a broad set of practical applications related to on-ball performance, off-ball performance, and match analysis in soccer, and open the door for its future adaption to other sports. This thesis was developed under an Industrial Ph.D. program and carried out entirely at Fútbol Club Barcelona, which promoted a close collaboration with professional coaches. As a result, a vast part of the ideas developed in this thesis is now part of the club's daily player and team performance analysis pipeline.Sports analytics es una área de investigación de gran crecimiento y que se encuentra enfocada en la aplicación de análisis avanzado de datos para la evaluación del rendimiento de equipos y deportistas profesionales. En el fútbol, la integración del análisis de datos se encuentra en una etapa incipiente, principalmente dado la dificultad de evaluar los complejos factores espacio-temporales del juego, y de traducir los hallazgos al lenguaje de los entrenadores. La reciente disponibilidad de datos espacio-temporales ha dado pie a la aplicación de métodos estadísticos para explorar problemas tales como la estimación de la probabilidad de pasar o rematar exitosamente, o la evaluación de la presión mental durante el juego, entre muchos otros. Sin embargo, la mayoría de los estudios hasta la fecha se han enfocado en aspectos aislados del juego, mientras que el análisis de los entrenadores suele tomar una óptica más integral en la que considera la interacción de los 22 jugadores en el campo. En base a todo esto, identificamos la necesidad de contar con un completo sistema (framework) de análisis que permite responder al contínuo flujo de preguntas de los cuerpos técnicos de forma ágil y visualmente interpretable, y que al mismo tiempo permita capturar los complejos fenómenos espaciales y contextuales que rigen al fútbol. Proponemos el desarrollo de este sistema a través del concepto del valor esperado de la posesión (EPV, por sus siglas en inglés). El EPV, que fue introducido inicialmente en el baloncesto, constituye la estimación segundo a segundo de los puntos que se esperan obtener al final de una posesión de balón. Sin embargo, su adaptación al fútbol requiere de un enfoque completamente diferente para poder captar conceptos esenciales tales como que los pases pueden ir a cualquier ubicación en el campo, una definición menos rígida de la posesión de balón, y los efectos de perder el balón de acuerdo al espacio y tiempo en que este ocurre. En base esto, proponemos modelar el EPV enfocándonos en responder la siguiente pregunta ¿podemos estimar la esperanza de que un equipo marque o reciba el próximo gol, en cualquier instante del partido? A partir de aquí, desarrollamos una serie de preguntas derivadas relacionadas con la capacidad de proveer flexibilidad e interpretabilidad a nuestro modelo, así como desarrollar aplicaciones prácticas de forma ágil. Estas interrogantes son desarrolladas con éxito en esta tesis, donde presentamos una serie de contribuciones tanto al área de machine learning como a la de sports analytics. Proponemos un novedoso enfoque en el que se descompone el EPV en una serie de componentes esenciales, que pueden ser estimados de forma separada y luego integrados para producir una estimación única del EPV, dotando de mayor flexibilidad a este modelo integrado. Desde un punto de vista práctico, nos apoyamos en una serie de métodos de aproximación de funciones para sacar provecho de relaciones complejas en datos espacio-temporales de tracking. Derivado de esto, proponemos SoccerMap, una flexible arquitectura de deep learning capaz de producir superficies de probabilidad precisas y visualmente interpretables. Adicionalmente, nos apoyamos en una larga serie de variables espaciales y contextuales, desarrolladas en este trabajo, para modelar y proveer estimaciones acuradas de cada uno de los componentes del EPV. La flexibilidad de este modelo nos permite producir una vasta cantidad de aplicaciones prácticas relacionadas al rendimiento con y sin balón, y al análisis de partidos en fútbol, y marca un camino para su integración en otros deportes. Esta tesis fue desarrollada con el apoyo del Plan de Doctorados Industriales del Departamento de Investigación y Universidades de la Generalitat de Catalunya, y llevado a cabo en el Fútbol Club Barcelona, contando con la colaboración de entrenadores y profesionales del club.Postprint (published version

    Hábitos de actividad física y costes socioeconómicos de la obesidad y sus patologías asociadas

    46 páginas.Tutor de la tesis: Raimundo Prieto Mendoza. Se ha llevado a cabo un estudio cuasiexperimental y transversal habiéndose realizado la medida de las variables entre los meses de marzo y abril de 2007, sobre una población urbana de Andalucía con objeto de analizar el coste socioeconómico que suponen el sobrepeso y la obesidad y sus patologías asociadas en comparación con un grupo de normopeso y entre ellos, a la vez que se compara la realización de actividad física y se comprueban las patologías más frecuentes asociadas a estos grupos. La población a estudio la componen 1367 sujetos que corresponden a las edades comprendidas entre 14 y 64 años de los que se ha extraído un muestra aleatoria de 98 sujetos con semejantes porcentajes por sexo y edad. La media del IMC para mujeres ha sido de 25.1 y para los hombre de 28.2. El perímetro de la cintura ha tenido una media de 100.4 para hombres y de 85.7 para mujeres con una desviación típica semejante. Se observa que el grado de actividad física, tanto en mujeres como en varones es escaso, con un alto porcentaje de actividad ligera. En cuanto al grado de obesidad, destaca el alto porcentaje de sobrepeso en los dos sexos, así como de obesidad en los varones y de normopeso en las mujeres. A mayor grado de obesidad hemos detectado menor grado de realización de actividad física para ambos sexos. A mayor grado de obesidad y menor grado de actividad física, encontramos mayores porcentajes de toma de medicación, de enfermedades y de días de baja laboral, lo que implica mayor uso de recursos sociosanitarios y mayor coste global. En conclusión, el perímetro abdominal a nivel de cintura no se debería de tener en cuenta a la hora de valorar el grado de obesidad en las mujeres y sí el índice cintura-cadera, se deberían de revisar los valores de referencia del IMC para las mujeres, la actividad física realizada en grupos de peso elevado es baja y el sobrepeso y obesidad suponen un aumento de recursos sociosanitarios de forma global

    Convergence and divergence regarding the modernity paradigm in the first sociological schools

    Se revisa el debate entre las corrientes sociológicas positivistas y no positivistas de finales del siglo XIX y principios del XX, y se concluye que se trata, en el fondo, de un falso debate, pues, más allá de sus diferencias, ambas comparten los principios básicos del paradigma de la modernidad.In this article, we will revisit the debate between the sociological positivists and non-positivists schools at the end of the nineteenth century and the beginning of the twentieth century and we conclude that it is in fact a false debate because they both share the same basic principles of the modernity paradigm despite their differences

    The Basque Language (Euskera) As an Ideological Instrument in the Historical Construction of Basque Ethnic Identity

    This paper analyzes how studies of a language and the language itself can be used as symbolic instruments to construct or support a differential ideological identity. The analyses of these studies have allowed us to undertake a sort of “archaeology” of the process of Basque ethnogenesis. All the authors instrumentalized philological studies as a way of expressing and claiming their ethnic identity, building their arguments on the basis of previous works (the “archaeological” layer being immediately underneath) at the same time that they reformulated them in order to better suit their specific conception of Basque identity as well as their particular sociopolitical interests. As if we were looking at a stratigraphic cut of an uninterrupted human settlement, the research unravels the existence of a narrative thread that, stratum upon stratum (that is, author upon author) connects the Basque chroniclers of the 16th to 18th centuries with the romantic fuerista writers of the 19th century, as well as Sabino de Arana-Goiri, the founder of the contemporary Basque Nationalist Party

    A metaheuristic approach for the repositioning problem in bike sharing systems (bss): a study case in Toluca, México

    The impact of Bike Sharing Systems (BSS) in the world had experienced such success that nowadays most iconic cities in the world have adopted its own system. The particular characteristics of the user’s mobility in every city have not allowed developing a generalized procedure to operate the systems. Moreover, the lack of symmetry in the mobility patterns, and the dynamic users’ behavior lead to eventually “unbalance” the system, this is, to a lack of bikes at stations, and therefore bikes have to be repositioned to stations where effective demand is present, and there is no unified or scientifically supported methodology. In this paper we deal with a study case in Toluca city (Huizi system), in which the entity in charge of current operational activities wants to design a procedure scientifically based to perform repositioning daily activities at the minimum operational cost guarantying the availability of bikes for the users (service level). Due to operational requirements, this bi-objective problem was formulated using a dynamic scope and stated as a combinatorial optimization model and finally solved using a multi-objective evolutionary algorithm

    La construcción del indio domesticado como categoría social y cognitiva entre los ticuna: para una psicología social de las relaciones de dominación en el alto Amazonas

    El artículo explora las percepciones recíprocas que indígenas y occidentales se forjaron de los otros en el proceso histórico de dominación a partir de un ejemplo concreto, el de los indios ticuna del Alto Amazonas. Los ticuna aceptaron la dominación e interiorizaron la visión estereotípica que de ellos había generado el dominador occidental como seres inferiores, adaptándola a su propia cosmovisión nativa. Se creó entre los indios un complejo de actitudes de subordinación que hacía que la profecía de superioridad del occidental se autosatisficiese y que ejerció una función de control social indirecto, permitiendo a una pequeña élite de amos coloniales gobernar sobre un gran número de indígenas sin tener que recurrir constantemente al costoso ejercicio de la coerción física. Reinterpretada la subordinación en clave sobrenatural los ticuna sólo podían entender la liberación en clave sobrenatural. Así, los movimientos políticos o de resistencia militar fueron inexistentes y su historia está marcada por una sucesión de movimientos milenaristas.This paper explores the reciprocal perceptions of «the other» that Indians and Westerners developed during the historical process of colonial domination. The Ticuna accepted domination and internalized the stereotypical image of the Indian as an inferior creature, which was created by the Western culture, adapting it to their own native worldview. This generated among the Indians a complex of subordination that in turn made the Western superiority prophecy come true and functioned as a mechanism of indirect social control, allowing a small elite of colonial masters to govern over a great number of Indians without resorting constantly to the onerous exercise of physical coertion. Subordination was reinterpreted in terms of the supernatural and the Ticuna therefore could only understand deliverance in terms of the supernatural. Thus, political or military resistance movements never occurred whereas Ticuna history is sprinkled with millenarianist movements

    Los indios ticuna del alto Amazonas ante los procesos actuales de cambio cultural y globalización.

    Los indios ticuna están sujetos en la actualidad a fuerzas de sentidos contrarios aparentemente contradictorio& Por un lado están experimentando un proceso acelerado de aculturación, deculturación e integración a las sociedades nacionales de Brasil, Colombia y Perú a partir del momento de su asentamiento masivo en aldeas a orillas dcl Amazonas. Por otro, el momento presente es tcstigo de una revitalización cultural y política de los ticuna en dirección hacia la autonomia y la defensa de su diferencia cultural. La aparente paradoja descansa en el hecho de que estos segundos procesos han sido puestos en marcha y están posibilitados por las sociedades mayores y los mismos procesos de aculturación. Desde los principios de una Antropologia Aplicada nos proponemos humildemente proponer soluciones al reto al que se enfrenta la diversidad cultural como la que representan los ticuna ante los presentes procesos de cambio diferenciando entre los fenómenos de globalización y aculturación.The contemporary Ticuna lndians are subjected to apparently contradictory forces of opposite senses. On the one hand they undergo an accelerating process of acculturation and integration to the national societies of Brazil, Colombia and 291 E Javier Ullán de la Rosa Los indios ticuna del Alto Amazonas ante los procesos actuales,.. Peru since their settling down in villages by the Amazon riverside. On the other hand, the moment is witnessing a political and cultural reactivation of the Ticuna towards autonomy and the defense of their cultural difference. The apparent paradox lies in the fact that this last trend is been set in motion and enabled by the major societies and the process of acculturation itself. From the principIes of an applied anthropology we humbly aim to propose solutions to the challenge that cultural diversity, as the one represented by the Ticuna, is facing before the present processes of social change by differentiating the phenomenon of globalization from that of acculturation

    Los límites de la ingeniería indigenista: la reestructuración del autogobierno entre los indios ticunas del Alto Amazonas

    El artículo analiza el proceso de reestructuración política de los ticunas tras su reconcentración en aldeas ribereñas después de un largo periodo de dispersión territorial y atomización social iniciado con la dominación de los patronos del caucho. El artículo hace énfasis en el origen externo, impuesto por los órganos indigenistas de los estados nacionales, de las nuevas instituciones políticas aldeanas y su debilidad debido al fuerte individualismo e igualitarismo de la sociedad ticuna.The essay analyses the process of political reestructuration of the Tikuna Indians after their resettling in riverside villages subsequent to a long period of territorial scattering and social disruption stemming from the rubber patron's domination. The essay stresses the external origin of the new political institutions in the villages, imposed by indigenist organisms of the national states, and their weakness, due to strong individualism and social egalitarianism of the Tikuna society