54 research outputs found
PLATERO: A calibration protocol for plate reader green fluorescence measurements
One of the most common sources of information in Synthetic Biology is the data coming from plate reader fluorescence measurements. These experiments provide a measure of the light emitted by a certain fluorescent molecule, such as the Green Fluorescent Protein (GFP). However, these measurements are generally expressed in arbitrary units and are affected by the measurement device gain. This limits the range of measurements in a single experiment and hampers the comparison of results among experiments. In this work, we describe PLATERO, a calibration protocol to express fluorescence measures in concentration units of a reference fluorophore. The protocol removes the gain effect of the measurement device on the acquired data. In addition, the fluorescence intensity values are transformed into units of concentration using a Fluorescein calibration model. Both steps are expressed in a single mathematical expression that returns normalized, gain-independent, and comparable data, even if the acquisition was done at different device gain levels. Most important, the PLATERO embeds a Linearity and Bias Analysis that provides an assessment of the uncertainty of the model estimations, and a Reproducibility and Repeatability analysis that evaluates the sources of variability originating from the measurements and the equipment. All the functions used to build the model, exploit it with new data, and perform the uncertainty and variability assessment are available in an open access repository
Inter-Rater Variability in the Evaluation of Lung Ultrasound in Videos Acquired from COVID-19 Patients
12 páginas, 7 figuras, 1 tablaLung ultrasound (LUS) allows for the detection of a series of manifestations of COVID-19,
such as B-lines and consolidations. The objective of this work was to study the inter-rater reliability
(IRR) when detecting signs associated with COVID-19 in the LUS, as well as the performance of the
test in a longitudinal or transverse orientation. Thirty-three physicians with advanced experience in
LUS independently evaluated ultrasound videos previously acquired using the ULTRACOV system
on 20 patients with confirmed COVID-19. For each patient, 24 videos of 3 s were acquired (using
12 positions with the probe in longitudinal and transverse orientations). The physicians had no
information about the patients or other previous evaluations. The score assigned to each acquisition
followed the convention applied in previous studies. A substantial IRR was found in the cases of
normal LUS (κ = 0.74), with only a fair IRR for the presence of individual B-lines (κ = 0.36) and for
confluent B-lines occupying 50%
(κ = 0.50). No statistically significant differences between the longitudinal and transverse scans were
found. The IRR for LUS of COVID-19 patients may benefit from more standardized clinical protocols.This research was partially funded by CDTI (Spanish acronym: Centre for Industrial Tech-
nological Development), funding number COI-20201153. Partially supported by the Google Cloud
Research Credits program with the funding number GCP19980904, by the project RTI2018-099118-
A-I00 founded by MCIU/AEI/FEDER UE and by the European Commission–NextGenerationEU,
through CSIC’s Global Health Platform (PTI Salud Global)
PhDAY 2020 -FOO (Facultad de Óptica y Optometría)
Por cuarto año consecutivo los doctorandos de la Facultad de Óptica y Optometría de la Universidad Complutense de Madrid cuentan con un congreso propio organizado por y para ellos, el 4º PhDAY- FOO. Se trata de un congreso gratuito abierto en la que estos jóvenes científicos podrán presentar sus investigaciones al resto de sus compañeros predoctorales y a toda la comunidad universitaria que quiera disfrutar de este evento. Apunta en tu agenda: el 15 de octubre de 2020. En esta ocasión será un Congreso On-line para evitar que la incertidumbre asociada a la pandemia Covid-19 pudiera condicionar su celebración
patrimonio intelectual
Actas de congresoLas VI Jornadas se realizaron con la exposición de ponencias que se incluyeron en cuatro ejes temáticos, que se desarrollaron de modo sucesivo para facilitar la asistencia, el intercambio y el debate, distribuidos en tres jornadas.
Los ejes temáticos abordados fueron:
1. La enseñanza como proyecto de investigación. Recursos de enseñanza-aprendizaje como mejoras de la calidad educativa.
2. La experimentación como proyecto de investigación. Del ensayo a la aplicabilidad territorial, urbana, arquitectónica y de diseño industrial.
3. Tiempo y espacio como proyecto de investigación. Sentido, destino y usos del patrimonio construido y simbólico.
4. Idea constructiva, formulación y ejecución como proyecto de investigación. Búsqueda y elaboración de resultados que conforman los proyectos de la arquitectura y el diseño
Statistical Machine Learning in Biomedical Engineering
[ES] Esta tesis, desarrollada bajo una beca de formación de personal investigador de la Universitat Politècnica de València, tiene como objetivo proponer y aplicar metodologías de Statistical Machine Learning en contextos de Ingeniería Biomédica. Este concepto pretende aunar el uso de modelos de aprendizaje automático junto con la búsqueda de comprensión e interpretabilidad clásica del razonamiento estadístico, dando lugar a soluciones tecnológicas de problemas biomédicos que no pasen únicamente por el objetivo de optimizar el desempeño predictivo de los modelos. Para ello, se han dibujado dos objetivos principales que vertebran además el documento: proponer metodologías novedosas dentro del paraguas del Statistical Machine Learning, y aplicar soluciones a problemas biomédicos reales manteniendo esta filosofía en mente. Estos objetivos se han materializado en contribuciones metodológicas para la simulación de valores atípicos y la imputación de datos faltantes en presencia de datos atípicos, y en contribuciones aplicadas a casos reales para la mejora de procesos de atención médica, la mejora en el diagnóstico y pronóstico de enfermedades, y la estandarización de procedimientos de medición en entornos biotecnológicos. Dichas contribuciones se han artículado en capítulos correspondientes a las dos partes principales ya mencionadas. Finalmente, las conclusiones y líneas futuras cierran el documento, recalcando los mensajes principales de las contribuciones de la tesis doctoral en general, y sentando además las bases para líneas futuras que se han dibujado a consecuencia del trabajo realizado a lo largo del doctorado.[CA] Aquesta tesi, desenvolupada sota una beca de formació de personal investigador de la Universitat Politècnica de València, té com a objectiu proposar i aplicar metodologies de Statistical Machine Learning en contextos d'Enginyeria Biomèdica. Aquest concepte pretén unir l'ús de models d'aprenentatge automàtic juntament amb la cerca de comprensió i interpretació clàssica del raonament estadístic, donant lloc a solucions tecnològiques de problemes biomèdics que no passen únicament per l'objectiu d'optimitzar el rendiment predictiu dels models. Per a això, s'han dibuixat dos objectius principals que vertebren a més el document: proposar metodologies noves dins del paraigua del Statistical Machine Learning, i aplicar solucions a problemes biomèdics reals mantenint aquesta filosofia en ment. Aquests objectius s'han materialitzat en contribucions metodològiques per a la simulació de valors atípics i la imputació de dades mancants en presència de valors atípics, i en contribucions aplicades a casos reals per a la millora de processos d'atenció mèdica, la millora en el diagnòstic i pronòstic de malalties, i l'estandardització de procediments de mesurament en entorns biotecnològics. Aquestes contribucions s'han articulat en capítols corresponents a les dues parts principals ja esmentades. Finalment, les conclusions i línies futures tanquen el document, recalant els missatges principals de les contribucions, de la tesi doctoral en general, i assentant a més les bases per a línies futures que s'han dibuixat com a consequència del treball realitzat al llarg del doctorat.[EN] This thesis, developed under a research personnel formation grant from the Universitat Politècnica de València, aims to propose and apply methodologies of Statistical Machine Learning in Biomedical Engineering contexts. This concept seeks to combine machine learning models with the classic understanding and interpretability of statistical reasoning, resulting in technological solutions for biomedical problems that go beyond solely optimizing the predictive performance of models. To achieve this, two main objectives have been outlined, which also structure the document: proposing novel methodologies within the umbrella of Statistical Machine Learning and applying solutions to real biomedical problems while keeping this philosophy in mind. These objectives have materialized into methodological contributions for simulating outliers and imputing missing data in the presence of outliers and applied contributions to real cases for improving healthcare processes, enhancing disease diagnosis and prognosis, and standardizing measurement procedures in biotechnological environments. These contributions are articulated in chapters corresponding to the aforementioned two main parts. Finally, the conclusions and future lines of research conclude the document, reiterating the main messages of the contributions and the overall doctoral thesis and laying the groundwork for future lines of inquiry stemming from the work conducted throughout the doctorate.González Cebrián, A. (2024). Statistical Machine Learning in Biomedical Engineering [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/20352
Scoring y análisis del sueño con técnicas de clasificación basadas en proyección sobre estructuras latentes y aprendizaje automático
The goal of this project is the use of classifiers based on projection to latent structures and machine learning techniques in order to perform automatic sleep scoring. The main purpose of the classifier is to assign a sleep stage to each 30 seconds phase of polysomnographies from different patients. The feature extraction process has been perfomed by implementing the Discrete Wavelet Transform to the Electroencephalography (EEG), Electrooculography (EOG) and Electromiography (EMG), obtaining series of coefficients related to different frequency bands. These series have been parameterized obtaining a matrix with the explanatory variables, which has been used as input data for different classifiers, comparing their performance.En este trabajo se propone la aplicación de clasificadores basados en técnicas de proyección sobre estructuras latentes y técnicas de aprendizaje automático, para un scoring automático del sueño. El propósito del clasificador es asignar una fase del ciclo a cada tramo de 30 segundos (epoch) de Polisomnografías de distintos pacientes. Para ello se recurre a la extracción de características de la señal mediante la Transformada Wavelet Discreta sobre el Electroencefalograma (EEG), Electrooculograma (EOG) y Electromiograma (EMG), obteniendo series de coeficientes referentes a distintas bandas de frecuencia. Estas series han sido parametrizadas constituyendo la matriz de variables explicativas, sobre la que se han aplicado distintas herramienta de clasificación, comparando finalmente los resultados obtenidos con cada técnica.[CA]
Les alteracions de l’hàbit de son posseïxen una alta prevalença i ocasionen disfuncions en processos fisiològics bàsics. Un dels passos crítics per a la monitorització i diagnòstic del son és el seu scoring, un procés d’anàlisi per mitjà del que s’assigna una fase del cicle a cada tram de 30 segons (epoch) de la Polisomnografia (PSG). La realització manual bassada en un anàlisi visual dels senyals, sense un protocol quantitatiu establit com a estàndard, comporta variabilitat inter i intraprofessional en el diagnòstic. En aquest treball es proposa l’aplicació de tècniques de projecció sobre estructures latents i d’aprenentatge automàtic, a fi d’obtindre classificadors que assignen una fase del son a cadascuna de les epochs de PSGs pertanyents a pacients distints. Així, doncs, es pretén caracteritzar el son en cada epoch basant-se en criteris quantitatius a fi d’arribar a una metodología que proporcione resultats repetibles, comparables i robustos. Per a aconseguir-ho s’ha realizat una extracció de característiques basades en la morgologia de l’Electroencefalograma (EEG), Electrooculograma (EOG) i Electromiograma (EMG), i en una anàlisi temps-freqüència d’estos senyals. La transformació a l’espai tempsfreqüència s’ha realitzat per mitjà de la Transformada Wavelet Discreta (TWD), obtenint sèries de coeficients referents a distintes bandes espectrals, que han sigut parametritzades. D’aquesta manera s’ha construït una matriu de variables explicatives que posteriorment ha sigut dividida en un conjunt d’entrenament i altre de validació. Prenent les fases assignades per un profesional metge com a referencia, s’han construït i avaluat classificadors basats en les diferents tècniques estudiades, establint una comparació final entre els resultats.González Cebrián, A. (2017). Scoring y análisis del sueño con técnicas de clasificación basadas en proyección sobre estructuras latentes y aprendizaje automático. http://hdl.handle.net/10251/89704TFG
Modelado y caracterización de señales cerebrales mediante wavelets y proyección sobre variables latentes
[ES] En el presente trabajo se ha realizado la caracterización y clasificación de trastornos del
sueño a partir de los EEGs registrados en Polisomnografías. Mediante la Transformada Wavelet
Discreta, se han obtenido series de coeficientes referentes a distintas bandas de frecuencia con
información sobre el registro. Posteriormente se ha realizado un Análisis de Componentes
Principales con los parámetros calculados sobre las series de coeficientes. Finalmente se ha
obtenido una matriz de observaciones formada por tantos vectoresfila de características, como
individuos. Esta ha sido empleada en modelos K-Vecinos Más Próximos y Análisis Discriminante
basado en Mínimos Cuadrados Parciales, para el análisis y estudio de las diversas patologías.[CA] En el present treball s’ha realitzat la caracterització i classificació de desordres del somni
partint de dades dels EEGs obtinguts en Polisomnografies. Mitjançant la Transformada Wavelet
Discreta, s’han obtingut sèries de coeficients referents a diferents intervals de freqüència amb
informació del registre. Posteriorment s’ha realitzat un Anàlisi de Components Principals amb el
paràmetres calculats sobre les sèries de coeficients. Finalment s’ha obtingut una matriu
d’observacions formada per tants vectors fila de característiques, com individus. Aquesta s’ha
emprat en models K-Veïns Més Pròxims i Anàlisi Discriminant basat en Mínims Quadrats Parcials,
per tal d’analitzar i estudiar les diverses patologies.[EN] The goal of this project is the characterization and classification of sleeping disorders
using EEG from Polysomnography records. Using the Discrete Wavelet Transform, series of
coefficients with information about different frequency bands of the EEG signal were obtained.
Afterwards a Principal Component Analysis was performed with the parameters calculated
about Wavelet Transform coefficients. Finally, an observation matrix was obtained, having as
many row vectors as individuals. This matrix was imputed in the generation of K-Nearest
Neighbour models and Partial Least Square – Discriminant Analysis, for the analysis and study of
various illnesses.González Cebrián, A. (2016). Modelado y caracterización de señales cerebrales mediante wavelets y proyección sobre variables latentes. http://hdl.handle.net/10251/67473.TFG
Standardised Versioning of Datasets: a FAIR–compliant Proposal
Abstract This paper presents a standardised dataset versioning framework for improved reusability, recognition and data version tracking, facilitating comparisons and informed decision-making for data usability and workflow integration. The framework adopts a software engineering-like data versioning nomenclature (“major.minor.patch”) and incorporates data schema principles to promote reproducibility and collaboration. To quantify changes in statistical properties over time, the concept of data drift metrics (d) is introduced. Three metrics (d P , d E , PCA , and d E,AE ) based on unsupervised Machine Learning techniques (Principal Component Analysis and Autoencoders) are evaluated for dataset creation, update, and deletion. The optimal choice is the d E , PCA metric, combining PCA models with splines. It exhibits efficient computational time, with values below 50 for new dataset batches and values consistent with seasonal or trend variations. Major updates (i.e., values of 100) occur when scaling transformations are applied to over 30% of variables while efficiently handling information loss, yielding values close to 0. This metric achieved a favourable trade-off between interpretability, robustness against information loss, and computation time
Multivariate Six Sigma: A case study in an outpatient pharmaceutical care unit
[EN] Six Sigma strategies for process improvement are widely used in industry and manufactur-ing. The spreading tendency to gather process data about hospital activity is leading to anincrease of process improvement projects in the healthcare context. The complexity of thesedatabases requires upgrading the classical statistical Six Sigma toolkit. In this paper we pre-sent a Six Sigma project carried out in an Outpatient Pharmaceutical Care Unit at HospitalUniversitario Doctor Peset in Valencia (Spain), where we illustrate the benefits of usinglatent variables-based models, specifically Partial Least Squares Regression (PLS), integratingthem into the DMAIC phases of the project.This work was supported by the Universitat Politecnica de Valencia under the program PAID-01-17 and the Valencian regional government research grant: AICO/2021/111, INDOPT4.0.González-Cebrián, A.; Hermenegildo, M.; Climente, M.; Ferrer, A. (2022). Multivariate Six Sigma: A case study in an outpatient pharmaceutical care unit. Quality Engineering. 34(2):277-289. https://doi.org/10.1080/08982112.2022.204201827728934
Data Drift for Automatic FAIR-compliant Dataset Versioning in Large Repositories
Construed as a shift in the distribution or structure of data over time, data drift can adversely affect the performance of machine learning models and data-driven decisions. This study examines two data drift metrics, denoted as d E,PCA and d E,AE , that are derived from unsupervised ML models: the reconstruction error-based metrics of Principal Component Analysis (PCA) and Autoencoders (AE). To investigate the robustness of these metrics, we have systematically accessed time-series datasets from the European Data Portal. Our experiments have examined data versioning through three basic events: creation, update, and deletion. The results are summarised and aggregated for all datasets, and unsupervised analysis based on Robust PCA and AE has been performed to examine patterns within the impact of dataset characteristics on data drift detection and computational efficiency. Our results indicate that both metrics aligned closely in performance with new records, suggesting consistent drift detection under normal conditions with FAIR compliance. However, high-dimensional datasets posed challenges for both PCA and AE models. Update events revealed discrepancies between the two metrics, suggesting that non-linear shifts affected AE-based metrics more than PCA-based ones. Deletion events demonstrated the resilience of these metrics against data loss, but also revealed variability in the reliability of the PCA model; i.e., data drift metrics derived from PCA and AE can be effective but sensitive to certain dataset characteristics
- …