28 research outputs found

    Hypothesis Transfer Learning with Surrogate Classification Losses: Generalization Bounds through Algorithmic Stability

    Full text link
    Hypothesis transfer learning (HTL) contrasts domain adaptation by allowing for a previous task leverage, named the source, into a new one, the target, without requiring access to the source data. Indeed, HTL relies only on a hypothesis learnt from such source data, relieving the hurdle of expansive data storage and providing great practical benefits. Hence, HTL is highly beneficial for real-world applications relying on big data. The analysis of such a method from a theoretical perspective faces multiple challenges, particularly in classification tasks. This paper deals with this problem by studying the learning theory of HTL through algorithmic stability, an attractive theoretical framework for machine learning algorithms analysis. In particular, we are interested in the statistical behaviour of the regularized empirical risk minimizers in the case of binary classification. Our stability analysis provides learning guarantees under mild assumptions. Consequently, we derive several complexity-free generalization bounds for essential statistical quantities like the training error, the excess risk and cross-validation estimates. These refined bounds allow understanding the benefits of transfer learning and comparing the behaviour of standard losses in different scenarios, leading to valuable insights for practitioners

    Sharp error bounds for imbalanced classification: how many examples in the minority class?

    Full text link
    When dealing with imbalanced classification data, reweighting the loss function is a standard procedure allowing to equilibrate between the true positive and true negative rates within the risk measure. Despite significant theoretical work in this area, existing results do not adequately address a main challenge within the imbalanced classification framework, which is the negligible size of one class in relation to the full sample size and the need to rescale the risk function by a probability tending to zero. To address this gap, we present two novel contributions in the setting where the rare class probability approaches zero: (1) a non asymptotic fast rate probability bound for constrained balanced empirical risk minimization, and (2) a consistent upper bound for balanced nearest neighbors estimates. Our findings provide a clearer understanding of the benefits of class-weighting in realistic settings, opening new avenues for further research in this field

    Desarrollo y caracterización de aerogeles biobasados

    Get PDF
    Avui dia, és essencial tenir en compte l'impacte mediambiental a l'hora d'escollir els materials, per això cal trobar alternatives ecològiques a les escumes derivades del petroli. En aquest estudi es van sintetitzar aerogels de base biològica mitjançant liofilització a partir del biopolímer alginat d'amoni. Es va decidir elaborar un aerogel híbrid afegint argila i additius naturals, montmorillonita i àcid tànnic respectivament. Aquests van millorar les propietats tèrmiques i de resistència al foc, així com les propietats mecàniques del material. Per optimitzar encara més les propietats mecàniques, en aquest projecte es va decidir, d'una banda, afegir glutaraldehid (GTA) com a agent reticulant i, de l'altra, estudiar els aerogels en diferents orientacions estructurals (radial o longitudinal/unidireccional) controlades durant el procés de congelació del gel. Un cop creats els diferents aerogels, es van caracteritzar mitjançant diferents tècniques, com l’assaig de compressió, con calorimètric, picnòmetre, anàlisi microscòpic SEM, espectroscòpia infraroja FTIR, anàlisi termogravimètrica TGA. Es va observar que els aerogels unidireccionals presentaven propietats mecàniques superiors (3,8 vegades superiors) a les de treballs anteriors amb aerogels radials, a causa de la seva orientació longitudinal a la direcció d’aplicació de les forces durant l’assaig. També es va observar que una reticulació in-situ mostrava un augment de 13 vegades en comparació amb les mostres sense reticulació, fet que va portar a la conclusió de l'eficiència i l'alt grau de reticulació resultat d'una reticulació homogènia a tot el volum de l'aerogel. No obstant això, l'addició de molècules orgàniques de GTA va induir una inflamabilitat més gran dels aerogels, amb l'aparició de flames durant els 10 primers segons de la combustió i amb un pic d'alliberament de calor de 67,4 kW/m2, tres vegades més gran per a l'aerogel reticulat in-situ, en comparació amb l'aerogel sense reticulació, per al qual no es va desenvolupar cap flama durant la prova.Hoy en día, es esencial tener en cuenta el impacto medioambiental a la hora de elegir los materiales, por lo que es necesario encontrar alternativas ecológicas a las espumas derivadas del petróleo. En este estudio se sintetizaron aerogeles de base biológica mediante liofilización a partir del biopolímero alginato de amonio. Se decidió elaborar un aerogel híbrido añadiendo arcilla y aditivos naturales, montmorillonita y ácido tánico respectivamente. Estos mejoraron las propiedades térmicas y de resistencia al fuego, así como las propiedades mecánicas del material. Para optimizar aún más las propiedades mecánicas, en este proyecto se decidió, por un lado, añadir glutaraldehído (GTA) como agente reticulante y, por otro, estudiar los aerogeles en diferentes orientaciones estructurales (radial o longitudinal/unidireccional) controladas durante el proceso de congelación del gel. Una vez creados los diferentes aerogeles, se caracterizaron mediante diferentes técnicas, como ensayo de compresión, cono calorimétrico, picnómetro, análisis microscópico SEM, espectroscopia infrarroja FTIR, análisis termogravimétrico TGA. Se observó que los aerogeles unidireccionales presentaban propiedades mecánicas superiores (3,8 veces superiores) a las de trabajos anteriores con aerogeles radiales, debido a su orientación longitudinal a la dirección de aplicación de las fuerzas durante el ensayo. También se observó que una reticulación in-situ mostraba un aumento de 13 veces en comparación con las muestras sin reticulación, lo que llevó a la conclusión de la eficiencia y el alto grado de reticulación resultado de una reticulación homogénea en todo el volumen del aerogel. Sin embargo, la adición de moléculas orgánicas de GTA indujo una mayor inflamabilidad de los aerogeles, con la aparición de llamas durante los 10 primeros segundos de la combustión y con un pico de liberación de calor de 67,4 kW/m2 , tres veces mayor para el aerogel reticulado in-situ, en comparación con el aerogel sin reticulación para el que no se desarrolló ninguna llama durante la prueba.Aujourd'hui, il est essentiel de prendre en compte l'impact environnemental lors du choix des matériaux, et c'est pourquoi il est nécessaire de trouver des alternatives écologiques aux mousses à base de pétrole. Dans cette étude, des aérogels biosourcés ont été synthétisés par lyophilisation à partir du biopolymère alginate d'ammonium. Il a été décidé ensuite de créer un aérogel hybride en ajoutant de l'argile et des additifs d’origines naturelles, respectivement, la montmorillonite et l’acide tannique. Ces derniers ont permis d’améliorer autant les propriétés thermiques et de résistance au feu que les propriétés mécaniques du matériau. Pour optimiser davantage les propriétés mécaniques, il a été décidé dans ce projet, d’une part, d’ajouter le glutaraldéhyde (GTA) comme un agent de réticulation, et d’autre part d’étudier les aérogels selon différentes orientations structurales (radiale ou longitudinale/unidirectionnelle) contrôlées lors du processus de congélation du gel. Une fois les différents aérogels créés, ils ont été caractérisés à l'aide de différentes techniques, tels que l'essai de compression, le cône calorimétrique, le pycnomètre, l'analyse microscopique MEB, la spectroscopie infrarouge FTIR, l'analyse thermogravimétrique TGA. Il a été observé que les aérogels à structure unidirectionnelle, présentaient des propriétés mécaniques supérieures (3.8 fois supérieures) par rapport aux travaux précédents réalisés avec des aérogels à structure radiale, du fait de leur orientation longitudinale à la direction d’application des forces lors du test. Il a également été observé qu'en termes de propriétés mécaniques, la méthode de réticulation in-situ a montré une augmentation 13 fois plus importante par rapport aux échantillons sans réticulation, ce qui a permis de conclure sur l'efficacité et le haut degré de réticulation suite à une réticulation homogène sur tout le volume de l’aerogel. Cependant, l’ajout de molécules organiques de GTA a induit à une inflammabilité plus importante des aérogels, avec l’apparition de flammes au cours des 10 premières secondes de la combustion et avec un pic de libération de chaleur de 67,4 kW/m2 , soit 3 fois plus élevé pour un aérogel réticulé in-situ, en comparaison avec un aérogel sans réticulation pour lequel aucune flamme ne s’est développé au cours du test.Today, it is essential to consider the environmental impact when choosing materials, and therefore it is necessary to find environmentally friendly alternatives to petroleum-based foams. In this study, biobased aerogels were synthesized by freeze-drying of ammonium alginate biopolymer. It was then decided to create a hybrid aerogel by adding clay and additives of natural origin, respectively, montmorillonite and tannic acid. These additives improved both the fire resistance and mechanical properties of the material. To further optimize the mechanical properties, it was decided in this project, on the one hand, to add glutaraldehyde (GTA) as a cross-linking agent, and on the other hand, to study the aerogels according to different structural orientations (radial or longitudinal/unidirectional) controlled during the gel freezing process. Once the different aerogels were created, they were characterized using different techniques, such as compression test, calorimetric cone, pycnometer, SEM microscopic analysis, FTIR infrared spectroscopy and TGA thermogravimetric analysis. It was observed that the aerogels with unidirectional structure presented superior mechanical properties (3.8 times higher) as compared to previous works carried out with aerogels with radial structure, due to their longitudinal orientation to the direction of application of the forces during the test. It was also observed that in terms of mechanical properties, the in-situ cross-linking method showed a 13- fold increase as compared to the samples without cross-linking, which demonstrated the effectiveness which led to conclude on the efficiency and high degree of cross-linking due to a homogeneous cross-linking on the whole volume of the aerogel. However, the addition of organic molecules of GTA induced a higher flammability of the aerogels, with the appearance of flames during the first 10 seconds of combustion and with a 3 times higher peak heat release for an in-situ cross-linked aerogel, as compared to an aerogel without cross-linking for which no flame developed during the test.Incomin

    A Probabilistic Assessment Approach for Wind Turbine-Site Matching

    Get PDF
    This article provides a new methodology for wind turbine-site matching by using a probabilistic approach. The random behavior of the wind speed climate and the uncertainties of wind turbine characteristics are important to take into account in models used to evaluate the performance of the wind turbine. The proposed formulation of the wind turbine-site matching is derived based on the probabilistic reliability assessment approach. It was experimented using different power curve approximation models, for different random conditions, using time series of wind speed in two sites in Morocco: Dakhla and Essaouira. A comparison based on methods used in literature for the estimation of two-parameter of the Weibull function to fit the wind speed distribution is also carried out. The results revealed that the introduced performance indicators are less sensitive to the models used to approximate the wind power curves compared to the deterministic conventional indicator that leads to different rankings and problems of over-sizing or under-sizing. However, those performance indicators are more sensitive to the variation of the wind speed distribution parameter’s and can help on accurately estimate the wind power. Moreover, the proposed formulation allows a global sensitivity analysis using Sobol’s indices to observe the influence of each input parameter on the observed variances of the performance of a wind turbine. A numerical application illustrates the interpretation of sensitivity indices and shows the impact of the wind speed and the rated wind speed on the variance of the wind turbine performance. This method can help wind energy developers and manufacturers to optimally select WTGs for their future project and accurately forecast the performance of their WTGs for monitoring and maintenance scheduling under uncertainty

    A Bayesian Regularized Artificial Neural Network for Up-Scaling Wind Speed Profile

    Get PDF
    Maximizing gains from wind energy potential is the principle objective of the wind power sector. Consequently, wind tower size is radically increasing. However, choosing an appropriate wind turbine for a selected site requires having an accurate estimation of vertical wind profile. This is also imperative from the cost and maintenance strategy point of view. Installing tall towers or other expensive devices such as LIDAR or SODAR raises the costs of a wind power project. In this work, we aim to investigate the ability of a Neural Network trained using the Bayesian Regularization technique to estimate wind speed profile up to a height of 100m based on knowledge of wind speed at lower heights. Results show that the proposed approach can achieve satisfactory predictions and prove the suitability of the proposed method for generating wind speed profile and probability distributions based on knowledge of wind speed at lower heights

    La didáctica de las traducciones jurídica y jurada en la combinación árabe- español: propuesta de un manual didáctico

    No full text
    La asignatura de Traducción Jurídica es una de las asignaturas más pesadas; dada la dificultad de la materia en sí por su vinculación al derecho, y la ambigüedad de los términos que caracterizan este campo. La cuestión se dificulta aún más cuando las dos culturas son totalmente desemejantes como es el caso de las culturas española y la cultura árabe caracterizada por su fuerte vinculación con la religión. Por ello, en el presente estudio, se ha prestado una especial atención al desarrollo de la competencia temática y cultural con el objetivo de capacitar a los futuros traductores a traducir uno de los géneros más demandados en el mercado laboral, según los resultados de la encuesta realizada a los traductores jurídicos y jurados en la especialidad árabe/español. según estos traductores el 90% de los documentos pertenecen a la rama del Derecho de Familia, a saber, es la única rama en que se aplica el Derecho Islámico. A la disimilitud de las dos culturas en cuestión, se añaden otros desafíos como la disimilitud de niveles, la multiculturalidad y la multi-direccionalidad en la misma aula. Así como, la inexistencia de asignaturas que introducen el estudiante en el Derecho comparado, y las pocas horas dedicadas en algunas asignaturas para conocer tanto la cultura árabe como la española. Además de, la escasez del material bibliográfico, lo que ardua aún más la tarea del profesor y del estudiante en esta combinación lingüística. Se ha llevado acabo la presente investigación con la esperanza de poder ofrecer a los futuros traductores una herramienta que les sea de utilidad tanto para realizar sus primeros encargos de traducción, como para auto-formarse

    Tail inverse regression:Dimension reduction for prediction of extremes

    No full text
    We consider the problem of supervised dimension reduction with a particular focus on extreme values of the target Y ∈ R to be explained by a covariate vector X ∈ Rp. The general purpose is to define and estimate a projection on a lower dimensional subspace of the covariate space which is sufficient for predicting exceedances of the target above high thresholds. We propose an original definition of Tail Conditional Independence which matches this purpose. Inspired by Sliced Inverse Regression (SIR) methods, we develop a novel framework (TIREX, Tail Inverse Regression for EXtreme response) in order to estimate an extreme sufficient dimension reduction (SDR) space of potentially smaller dimension than that of a classical SDR space. We prove the weak convergence of tail empirical processes involved in the estimation procedure and we illustrate the relevance of the proposed approach on simulated and real world data.</p

    Long Term Forecasting of Wind Speed for Wind Energy Application

    Get PDF
    International audienceA novel method for long term forecasting of wind speed distribution is proposed based on the concept of training neural network. A phase space reconstruction method is used to track the evolution of the wind speed distribution function parameters in a dynamic system. Then, the neural network training and forecasting features are used to learn nonlinear model between historical data and next observation. Moreover, different estimators have been applied and compared to fit the annual distribution of the wind speed in the studied sites before applying the proposed approach. The proposed method shows a good performance and could be successfully applied in wind energy yield
    corecore