4 research outputs found
Reutilización de componentes entre cursos virtuales, presenciales y mixtos (b-learning). Un caso de estudio en Sistemas de Información Gerencial
The integration between virtual and face-to-face (ftf) classroom learning is increasing. This is leading to an increase in mixed learning or blended-learning. Due to this growing trend there is a need to reuse course components between these strategies in the interest of efficiency. Additionally, the wide availability of open source software facilitates the construction of learning activities without incurring in licences expenses; activities which can then also be included in other courses. The reuse of these learning activities between virtual, ftf and mixed education may require significant efforts to adapt them if this possibility has not been considered in advance. Adoption of certain architectures and methodologies, that facilitate flexibility and reuse, can simplify this process, as proposed in this paper. A case study is presented on reusing learning activities on Management Information Systems (MIS) developed for either ftf instruction or for an edX MOOC, that are reused in courses in various learning modes: online, blended learning and face-to-face.Cada vez es mayor la integración entre enseñanza virtual y presencial. Esto está produciendo un incremento de la enseñanza mixta o blended-learning. Dada la creciente tendencia de integración de la enseñanza virtual en la formación presencial, surge la necesidad de reutilizar componentes entre dichas estrategias en interés de la eficiencia. Adicionalmente, la gran disponibilidad de software de código abierto facilita la construcción de actividades docentes sin incurrir en costes de licencias, las cuales que pueden formar parte de distintos cursos de formación. La reutilización de estas actividades docentes en la enseñanza virtual y mixta puede requerir importantes esfuerzos de adaptación de las mismas si previamente no se ha tenido en cuenta esta posibilidad en su diseño. Estas labores pueden simplificarse mediante la adopción de arquitecturas y metodologías que favorezcan la flexibilidad y la reutilización, tal como se propone en este trabajo. Adicionalmente, se presenta un caso de reutilización de actividades docentes de un MOOC de la plataforma edX dedicado a Sistemas de Información, en el que actividades docentes son reutilizadas en otros cursos de distinta modalidad: online, híbridos y presenciales.Acción financiada por la Comunidad de Madrid en el marco del convenio plurianual con la Universidad Carlos III de Madrid en su línea de Excelencia del Profesorado
Marco de referencia para el análisis comparativo de métodos de generación de poblaciones sintéticas
La generación de poblaciones y datos sintéticos es un proceso básico en múltiples áreas tales
como la estimación de small area, microsimulación, simulación basada en agentes,
simulación basada en actividad, anonimización de datos o validación y pruebas de
aplicaciones. La principal finalidad es obtener una población de agentes, o microdatos
sintéticos, con distribuciones de atributos correlacionados que se asemeje a una población o
datos reales. Se han desarrollado múltiples métodos orientados a tal fin, sin que existan claras
recomendaciones para la elección entre ellos.
Dentro del ámbito de los métodos de generación de poblaciones, no existe un marco de
referencia de general aceptación para realizar de forma efectiva la evaluación comparativa
de la eficacia y precisión de estos métodos, por lo que el objetivo general de esta
investigación es definir dicho marco de referencia en el que posicionar los distintos métodos
de generación de poblaciones sintéticas respecto a los escenarios de uso (necesidades y datos
disponibles), y establecer una clara metodología para llevar a cabo un análisis cuantitativo
del rendimiento de estos métodos.
Una vez establecido el marco de referencia se plantean tres estudios cuantitativos
experimentales conforme al marco propuesto, con los que se obtienen conclusiones sobre el
rendimiento relativo de los métodos. En los dos primeros se plantean escenarios de
generación de poblaciones en los que se diseñan los experimentos con los que se efectúan
los correspondientes análisis comparativos concretos. A partir de necesidades y datos de
partida concretos, se determinan los métodos más adecuados para obtener los microdatos
sintéticos. Se desarrolla un esquema de validación comparativa entre métodos que permite
comparar las poblaciones sintetizadas con la población real, utilizando una comparativa
estadística con contraste de hipótesis.
El tercer estudio se apoya en la metodología del análisis cuantitativo para comparar distintas
estrategias que se utilizan para abordar el problema de muestras con algún valor marginal
nulo. Este problema se presenta cuando se extraen muestras pequeñas de poblaciones con
categorías poco frecuentes, por lo que es habitual que en las muestras obtenidas falten
representantes de dichas categorías.
Para los experimentos se utiliza una población real de 60 “small areas” y múltiples muestras
de distinto tamaño. Entre los métodos de generación de poblaciones que se comparan se
encuentran métodos de amplia difusión como: Iterative Proportional Fitting con redondeo y
con muestreo de Monte Carlo, Simulated Annealing, Generalized Raking e Iterative
Proportional Updating.
En esta tesis se describen y clasifican los principales métodos de generación de poblaciones.
Se construye un mapa con los métodos más adecuados según distintos escenarios de
generación. También se analizan diversos sistemas de medida de similitud de poblaciones
con objeto de facilitar la selección de métricas de la calidad de la población generada. Con
respecto a la utilización de diferentes métricas, se constata que clasifican y ordenan los
métodos comparados de forma equivalente, por lo que la recomendación de uso se basa en
su simplicidad y su fácil comprensión.
El marco de referencia permite determinar si hay diferencias estadísticamente significativas
entre los rendimientos de los métodos; por tanto, permite posicionar los métodos, y analizar
la influencia de distintos factores en el rendimiento de los mismos.
A raíz de los resultados obtenidos con los experimentos planteados pueden extraerse
distintas conclusiones e implicaciones, tales como la importancia del redondeo o del tamaño
de la muestra y la superioridad de ciertos métodos sobre otros.
Entre los factores utilizados en la generación de poblaciones se han considerado el numero
de atributos y categorías que describen la población, el tamaño de la muestra y el tamaño de
la “small area”.
El conjunto de esta tesis aporta claridad en el campo de los métodos y técnicas de generación
de poblaciones sintéticas, facilitando el análisis y la toma de decisiones ante la necesidad de
disponer de una población de agentes, y proporcionando una guía para llevar a cabo un
análisis comparativo entre métodos.
Esta tesis contribuye a ayudar al investigador a determinar, en cada situación, los métodos
que generan las poblaciones que representan al mundo real con mayor precisión,
permitiéndole mejorar la calidad de los resultados de las simulaciones y obtener resultados
mas verídicos. También permite probar algoritmos en condiciones más próximas a la realidad
utilizando los datos generados por estos métodos, con la posibilidad de difundir y compartir
dichos datos y los resultados de los algoritmos sin problemas de confidencialidad, como datos
abiertos.Synthetic population generation is a basic process in multiple areas such as microsimulation,
agent-based simulation, activity-based simulation, validation and application testing or data
anonymization. The main purpose is to obtain a population of agents, or synthetic microdata,
with distributions of correlated attributes that resemble a population or real data. Multiple
methods have been developed for this purpose, with no recommendations regarding their
comparative use.
In the academic world of population generation methods, there is no generally accepted
reference framework to effectively perform the comparative assessment of the effectiveness
and precision of these methods, so this study has the objective of defining such reference
framework in which to position the different methods of population generation methods with
respect to the scenarios (needs and available data), and establish a clear methodology to
carry out a quantitative analysis of the performance of these methods.
Three experimental quantitative research studies are accomplished according to the
proposed framework and conclusions are obtained on the relative performance of the
methods. Two scenarios of population generation are suggested in the two first researches
where experiments are designed and comparative analyzes are carried out according to the
proposed reference framework.
Based on specific data and input data, the most appropriate methods are determined for
obtaining the best synthetic microdata. A comparative validation scheme between methods
is developed to compare the synthesized populations with the real population, based on a
statistical comparison with hypothesis testing.
The quantitative analysis methodology is also used to compare the strategies used to address
the zero-marginal problem of the sample in the third research. This problem occurs when
there are rare categories in the population, from which a small sample is extracted in which
the representation of these rare categories are missing.
For the research experiments, a true population of 60 "small areas" and multiple samples of
different sizes are used. The population generation methods that are compared are widely
diffused methods such as Iterative Proportional Fitting with rounding and with Monte Carlo
sampling, Simulated Annealing, Generalized Raking and Iterative Proportional Update.
The main methods of population generation are described and classified. A map is
constructed with the most appropriate methods according to the generation scenario.
Metrics for evaluating the goodness of fit between estimated and observed sets of population
microdata are also analyzed in order to facilitate the selection of measurements for the accuracy of the generated population. Metrics are found that it classifies and rank the
compared methods in an equivalent way, so a goodness-of-fit evaluation metric for synthetic
data is recommended to use based on its simplicity and its easy interpretation of results.
The reference framework allows to determine if there are statistically significant differences
between methods performance; therefore, it allows methods positioning, and analyze the
influence of multiple factors on the performance.
Following the results obtained with the experiments, final conclusions and implications are
extracted, such as the importance of rounding or sample size, and the superiority of some
methods.
The number of categories and attributes that describe the population, the sample size, and
the "small area" size have been considered among the factors that were used in the
population generation process.
This thesis as a whole provides clarity in the field of methods and techniques for synthetic
population generation, facilitates the analysis and decision making in the posed scenarios
when a population of agents is needed and provides a guide to performing a comparative
analysis between methods.
This thesis helps the researcher to establish the methods that generate populations that best
depicts the real world, and it allows to improve the quality of the simulations results and to
obtain the most truthful trending values. It also allows them to test algorithms in conditions
more similar to reality using the data generated by these methods, with the possibility of
spreading and sharing these data and algorithms results without confidentiality problems, as
open data.Programa Oficial de Doctorado en Ingeniería Mecánica y de Organización IndustrialPresidente: Manuel Alonso Castro Gil.- Secretario: Bernardo Prida Romero.- Vocal: Raúl Poler Escot
Reutilización de componentes entre cursos virtuales, presenciales y mixtos (b-learning).: un caso de estudio en Sistemas de Información Gerencial
The integration between virtual and face-to-face (ftf) classroom learning is increasing. This is leading to an increase in mixed learning or blended-learning. Due to this growing trend there is a need to reuse course components between these strategies in the interest of efficiency. Additionally, the wide availability of open source software facilitates the construction of learning activities without incurring in licences expenses; activities which can then also be included in other courses. The reuse of these learning activities between virtual, ftf and mixed education may require significant efforts to adapt them if this possibility has not been considered in advance. Adoption of certain architectures and methodologies, that facilitate flexibility and reuse, can simplify this process, as proposed in this paper. A case study is presented on reusing learning activities on Management Information Systems (MIS) developed for either ftf instruction or for an edX MOOC, that are reused in courses in various learning modes: online, blended learning and face-to-face.Cada vez es mayor la integración entre enseñanza virtual y presencial. Esto está pro-duciendo un incremento de la enseñanza mixta o blended-learning. Dada la creciente tendencia de integración de la enseñanza virtual en la formación presencial, surge la necesidad de reutilizar componentes entre dichas estrategias en interés de la eficiencia. Adicionalmente, la gran disponibilidad de software de código abierto facilita la cons-trucción de actividades docentes sin incurrir en costes de licencias, las cuales que pue-den formar parte de distintos cursos de formación. La reutilización de estas actividades docentes en la enseñanza virtual y mixta puede requerir impor-tantes esfuerzos de adaptación de las mismas si previamente no se ha tenido en cuenta esta posibilidad en su diseño. Estas labores pueden simplificarse mediante la adopción de arquitecturas y metodologías que favorezcan la flexibilidad y la reutilización, tal como se propone en este trabajo. Adicionalmente, se presenta un caso de reutilización de actividades do-centes de un MOOC de la plataforma edX dedicado a Sistemas de Información, en el que actividades docentes son reutilizadas en otros cursos de distinta modalidad: online, híbridos y presenciales