193 research outputs found

    Present i futur de l'àrea de tecnologia a l'educació secundària

    Get PDF

    Aprenentatge a partir de currículums per a xarxes neuronals recurrents

    Get PDF
    Video object segmentation (VOS) is a computer vision task that aims at determining the pixels of an object of interest along a video sequence. This thesis explores different curriculum learning strategies for a deep neural network trained to solve this task. Curriculum learning defines a methodology where the training data are not randomly presented to the model, instead, they are organized in a meaningful way. Simple concepts are first presented and gradually become more complex. Four different curriculum strategies are explored: schedule sampling, frame skipping, the effect of temporal and spatial recurrence variations and loss penalization by the object's area. This work focuses on the RVOS neural architecture, a recurrent architecture originally tested on the DAVIS and YouTube-VOS datasets for one-shot video object segmentation, over the cars class of the KITTI-MOTS dataset. Even though this architecture is a fast solution for the VOS task, the model struggles with the KITTI-MOTS dataset, whose videos are more crowded and challenging. For the schedule sampling curriculum, both the classic and inverse implementations are evaluated. Results show how inverse schedule sampling strategies improve the model's performance instead of the classic approach, the forward one. The different frame skipping schemes are also beneficial, but only when training with the ground truth mask instead of the predicted ones. Lastly, both the curriculums that vary the temporal and spatial recurrence or penalize the loss by the object's area have shown poor model's performance. These results show how curriculum learning strategies affect greatly the performance of recurrent neural networks. Moreover, the results on the inverse schedule sampling and frame skipping strategies invite to further explore these schemes to exploit their benefits.La segmentación de objetos en video es una tarea de visión por computadores que tiene como objetivo determinar los píxeles de los objetos de interés en una secuencia de video. Esta tesis explora diferentes estrategias de aprendizaje con currículos para redes neuronales profundes entrenadas para solucionar esta tarea. El aprendizaje con currículos define una metodología de trabajo donde los datos de entrenamiento no se muestran de forma aleatoria al modelo, sino que están organizados de manera significativa. Los conceptos fáciles son presentados primero y, gradualmente, se vuelven más complejos. Cuatro estrategias han sido exploradas: muestreo programado, omisión de fotogramas, el efecto de la variación de la recurrencia temporal y espacial y la penalización de la función de coste según el área de los objetos. Este trabajo se centra en la arquitectura neuronal RVOS, una arquitectura recurrente originalmente probada en el conjunto de datos de DAVIS y YouTube-VOS, que aborda la tarea de segmentación de objetos en video one-shot en la clase de coches del conjunto de datos de KITTI-MOTS. A pesar de que esta arquitectura ofrece una solución rápida para la tarea de segmentación de video, el modelo tiene dificultades con el conjunto de datos de KITTI-MOTS, los videos del cual son más concurridos y desafiantes. Para el currículum muestreo programado, tanto la implementación clásica como la inversa han sido evaluadas. Los resultados muestran como las estrategias inversas mejoran el rendimiento del modelo en comparación con el enfoque clásico. Los diferentes esquemas de omisión de fotogramas también son beneficiosos, pero solo cuando el entrenamiento se realiza con las verdaderas anotaciones y no con las predicciones. Finalmente, los dos currículos que varían la recurrencia temporal y espacial y penalizan la función de coste según el área de los objetos han resultado en un mal rendimiento. El conjunto de resultados demuestran como estrategias de aprendizaje con currículos afectan notablemente al rendimiento de las redes neuronales recurrentes. Además, los resultados de la estrategia inversa de muestreo programado, y de las estrategias de omisión de fotogramas invitan a investigar con más detenimiento estos esquemas para aprovechar sus beneficios.La segmentació d'objectes en vídeo és una tasca de visió per computadors que té com a objectiu determinar els píxels dels objectes d'interès en una seqüència de vídeo. Aquesta tesi explora diferents estratègies d'aprenentatge a partir de currículums per a xarxes neuronals profundes entrenades per a solucionar aquesta tasca. L'aprenentatge a partir de currículums defineix una metodologia de treball on les dades d'entrenament no es mostren de manera aleatòria al model sinó que estan organitzades de manera significativa. Els conceptes fàcils són presentats primer i, gradualment, esdevenen més complexes. Quatre estratègies són explorades: mostratge programat, omissió de fotogrames, l'efecte de la variació de la recurrència temporal i espacial i la penalització de la funció de cost segons l'àrea dels objectes. Aquest treball es centra en l'arquitectura neuronal RVOS, una arquitectura recurrent originalment provada en el conjunt de dades de DAVIS i YouTube-VOS, que aborda la tasca de segmentació d'objectes en vídeos one-shot en la classe de cotxes del conjunt de dades de KITTI-MOTS. Tot i que aquesta arquitectura és una solució ràpida per a la tasca de segmentació de vídeo, el model té dificultats amb el conjunt de dades de KITTI-MOTS, els vídeos del qual són més concorreguts i desafiants. Pel currículum de mostratge programat, tant la implementació clàssica com la inversa han sigut avaluades. Els resultats mostren com les estratègies inverses milloren el rendiment del model en comparació amb l'enfocament clàssic. Els diferents esquemes d'omissió de fotogrames també són beneficiosos, però només quan l'entrenament és realitzat amb les verdaderes anotacions manuals en comptes de les prediccions. Finalment, els dos currículums que varien la recurrència temporal i espacial i penalitzen la funció de cost segons l'àrea dels objectes han resultat en un mal rendiment. Aquests resultats mostren com les estratègies d'aprenentatge a partir de currículums afecten notablement el rendiment de les xarxes neuronals recurrents. A més a més, els resultats en l'estratègia inversa de mostratge programat i les estratègies d'omissió de fotogrames conviden a investigar amb més profunditat aquests esquemes per a beneficiar-se'n

    Una Visió actual de l'estat de la dona en les enginyeries

    Get PDF

    Carry a big stick, or no stick at all: punishment and endowment heterogeneity in the trust game

    Get PDF
    We investigate the effect of costly punishment in a trust game with endowment heterogeneity. Our findings indicate that the difference between the investor and the allocator’s initial endowments determines the effect of punishment on trust and trustworthiness. Punishment fosters trust only when the investor is wealthier than the allocator. Otherwise, punishment fails to promote trusting behavior. As for trustworthiness, the effect is just the opposite. The higher the difference between the investor and the allocator’s initial endowments, the less willing allocators are to pay back. We discuss the consistency of our findings with social preference models (like inequality aversion, reciprocity), the capacity of punishment (i.e., the deterrence hypothesis) and hidden costs of punishment (i.e., models of intrinsic and extrinsic motivation). Our results are hardly coherent with the first two (inequality aversion and deterrence), but roughly consistent with the latter

    4t Seminari sobre educació tecnològica

    Get PDF
    corecore