114 research outputs found

    Exploiting the accumulated evidence for gene selection in microarray gene expression data

    Get PDF
    Machine Learning methods have of late made signicant efforts to solving multidisciplinary problems in the field of cancer classification using microarray gene expression data. Feature subset selection methods can play an important role in the modeling process, since these tasks are characterized by a large number of features and a few observations, making the modeling a non-trivial undertaking. In this particular scenario, it is extremely important to select genes by taking into account the possible interactions with other gene subsets. This paper shows that, by accumulating the evidence in favour (or against) each gene along the search process, the obtained gene subsets may constitute better solutions, either in terms of predictive accuracy or gene size, or in both. The proposed technique is extremely simple and applicable at a negligible overhead in cost.Postprint (published version

    Experimental study of flow through a Savonius wind turbine

    Get PDF
    The main objective is intended to be the experimental investigation in wind tunnel to determine the structure of the real flow in a fixed Savonius wind turbine.  A secondary objective of this experimental study will be to obtain the aerodynamic performance of studied wind turbine and also information about velocity field around the rotor. Due to its principle of operation and the continuous variation of flow angle with respect to blades, strong unsteady effects including separation and vortex shedding are observed in a Savonius wind turbine . The flow analysis helps to qualify the design of the wind turbine and to assess the quality of numerical simulations, data concerning the mechanism of torque creation, the vortex structure downstream of the rotor and aerodynamic performance. The experimental investigation in wind tunnel is carried out using flow visualization technique.The main tasks will be:- State of the art of efficient wind turbines- Theoretical study of a Savonius wind turbine- Study of the different available geometries of Savonius to the wind tunnel- Choose the best experimental method for the flow visualization and learn how to use it- Design and construction of the Savonius wind turbine model and the test bench- Experimental running- Results analysi

    Acolliment lingüístic en dones nouvingudes

    Get PDF
    Curs 2012-2013La immigració és una característica de la societat actual, moltes persones marxen del seu país amb l’objectiu de millorar la seva qualitat de vida. Els governs han desenvolupat accions per facilitar la inserció de la persona en el país d’acollida. Un fet que facilita la inserció és la llengua, aquesta és la clau per poder participar en el nou context. A més fomenta la cohesió perquè és l’instrument de relació amb altres persones. Per aquesta raó una de les accions del govern de Catalunya és l’acolliment lingüístic. La immigració és un tema molt ampli, la investigació es centrarà en les dones immigrants analitzant una entitat civil de Vic que ofereix acolliment lingüístic en dones.Immigration is feature of society. Nowadays, a lot of people leave their country with the aim of improving their quality of life. Governments of some countries do projects for hosting the immigrants. The Intention of this the insertion of this people in their new country. One fact to facilitate the insertion is language. Speak the language of country is the key for participate in their new context. Moreover,it is an item of cohesion, because is the instrument to relate to other persons. The Government of Catalonia created a project for immigrants to learn catalan. The immigrations is divers, for this reason the research focus is on imigrant women. The research analyze a civil organization dedicated to teach catalan to immigrant women

    Towards more reliable feature evaluations for classification

    Get PDF
    In this thesis we study feature subset selection and feature weighting algorithms. Our aim is to make their output more stable and more useful when used to train a classifier. We begin by defining the concept of stability and selecting a measure to asses the output of the feature selection process. Then we study different sources of instability and propose modifications of classic algorithms that improve their stability. We propose a modification of wrapper algorithms that take otherwise unused information into account to overcome an intrinsic source of instability for this algorithms: the feature assessment being a random variable that depends on the particular training subsample. Our version accumulates the evaluation results of each feature at each iteration to average out the effect of the randomness. Another novel proposal is to make wrappers evaluate the remainder set of features at each step to overcome another source of instability: randomness of the algorithms themselves. In this case, by evaluating the non-selected set of features, the initial choice of variables is more educated. These modifications do not bring a great amount of computational overhead and deliver better results, both in terms of stability and predictive power. We finally tackle another source of instability: the differential contribution of the instances to feature assessment. We present a framework to combine almost any instance weighting algorithm with any feature weighting one. Our combination of algorithms deliver more stable results for the various feature weighting algorithms we have tested. Finally, we present a deeper integration of instance weighting with feature weighting by modifying the Simba algorithm, that delivers even better results in terms of stabilityEl focus d'aquesta tesi és mesurar, estudiar i millorar l’estabilitat d’algorismes de selecció de subconjunts de variables (SSV) i avaluació de variables (AV) en un context d'aprenentatge supervisat. El propòsit general de la SSV en un context de classificació és millorar la precisió de la predicció. Nosaltres afirmem que hi ha un altre gran repte en SSV i AV: l’estabilitat des resultats. Un cop triada una mesura d’estabilitat entre les estudiades, proposem millores d’un algorisme molt popular: el Relief. Analitzem diferents mesures de distància a més de la original i estudiem l'efecte que tenen sobre la precisió, la detecció de la redundància i l'estabilitat. També posem a prova diferents maneres d’utilitzar els pesos que es calculen a cada pas per influir en el càlcul de distàncies d’una manera similar a com ho fa un altre algorisme d'AV: el Simba. També millorem la seva estabilitat incrementant la contribució dels pesos de les variables en el càlcul de la distància a mesura que avança el temps per minimitzar l’impacte de la selecció aleatòria de les primeres instàncies. Pel què fa als algorismes embolcall, (wrappers) els modifiquem per tenir en compte informació que era ignorada per superar una font intrínseca d’inestabilitat: el fet que l’avaluació de les variables és una variable aleatòria que depèn del subconjunt de dades utilitzat. La nostra versió acumula els resultats en cada iteració per compensar l’efecte aleatori mentre que els originals descarten tota la informació recollida sobre cada variable en una determinada iteració i comencen de nou a la següent, donant lloc a resultats més inestables. Una altra proposta és fer que aquests wrappers avaluïn el subconjunt de variables no seleccionat en cada iteració per evitar una altra font d’inestabilitat. Aquestes modificacions no comporten un gran augment de cost computacional i els seus resultats són més estables i més útils per un classificador. Finalment proposem ponderar la contribució de cada instància en l’AV. Poden existir observacions atípiques que no s'haurien de tenir tant en compte com les altres; si estem intentant predir un càncer utilitzant informació d’anàlisis genètics, hauríem de donar menys credibilitat a les dades obtingudes de persones exposades a grans nivells de radiació tot i que no tenir informació sobre aquesta exposició. Els mètodes d’avaluació d’instàncies (AI) pretenen identificar aquests casos i assignar-los pesos més baixos. Varis autors han treballat en esquemes d’AI per millorar la SSV però no hi ha treball previ en la combinació d'AI amb AV. Presentem un marc de treball per combinar algorismes d'AI amb altres d'AV. A més proposem un nou algorisme d’AI basat en el concepte de marge de decisió que utilitzen alguns algorismes d’AV. Amb aquest marc de treball hem posat a prova les modificacions contra les versions originals utilitzant varis jocs de dades del repositori UCI, de xips d'ADN i els utilitzats en el desafiament de SSV del NIPS-2003. Les nostres combinacions d'algorismes d'avaluació d'instàncies i atributs ens aporten resultats més estables per varis algorismes d'avaluació d'atributs que hem estudiat. Finalment, presentem una integració més profunda de l'avaluació d'instàncies amb l'algorisme de selecció de variables Simba consistent a utilitzar els pesos de les instàncies per ponderar el càlcul de les distàncies, amb la que obtenim resultats encara millors en termes d’estabilitat. Les contribucions principals d’aquesta tesi son: (i) aportar un marc de treball per combinar l'AI amb l’AV, (ii) una revisió de les mesures d’estabilitat de SSV, (iii) diverses modificacions d’algorismes de SSV i AV que milloren la seva estabilitat i el poder predictiu del subconjunt de variables seleccionats; sense un augment significatiu del seu cost computacional, (iv) una definició teòrica de la importància d'una variable i (v) l'estudi de la relació entre l'estabilitat de la SSV i la redundància de les variables.Postprint (published version

    Exploiting the accumulated evidence for gene selection in microarray gene expression data

    Get PDF
    Feature subset selection (FSS) methods play an important role for cancer classification using microarray gene expression data. In this scenario, it is extremely important to select genes by taking into account the possible interactions with other gene subsets. This paper shows that, by accumulating the evidence in favour (or against) each gene along a search process, the obtained gene subsets may constitute better solutions, either in terms of size or in predictive accuracy, or in both, at a negligible overhead in computational cost.Postprint (author’s final draft

    Remainder subset awareness for feature subset selection

    Get PDF
    Feature subset selection has become more and more a common topic of research. This popularity is partly due to the growth in the number of features and application domains. The family of algorithms known as plus-l-minus-r and its immediate derivatives (like forward selection) are very popular and often the only viable alternative when used in wrapper mode. In consequence, it is of the greatest importance to take the most of every evaluation of the inducer, which is normally the more costly part. In this paper, a technique is proposed that takes into account the inducer evaluation both in the current subset and in the remainder subset (its complementary set) and is applicable to any sequential subset selection algorithm at a reasonable overhead in cost. Its feasibility is demonstrated on a series of benchmark data sets.Peer ReviewedPostprint (published version

    Una proposta d'intervenció social contra el racisme aversiu mitjançant la mediació circular-narrativa

    Get PDF
    Màster en Mediació de conflictes, Facultat de Psicologia. Projecte d'intervenció social (Modalitat A). Curs: 2017-2018, Tutor: Esteve Espelt GranesEls models d’intervenció per tal de superar el racisme s’han centrat en combatre el racisme manifest. El propòsit del treball plantejat és generar un nou marc per tal de crear una intervenció que consisteixi en reduir el racisme aversiu o latent. Aquest marc idoni es durà a terme mitjançant la intersecció entre el model de Mediació Circular-Narratiu i la Teoria de l’Elaboració del Conflicte, prenent certes premisses de la Teoria de les Minories Actives. La proposta d’intervenció tindrà com a població diana estudiants de 2n de Batxillerat que es perceben a ells mateixos com no racistes (la majoria), ubicats a les escoles del Besòs. Els diferents participants duran a terme una activitat compresa en sis fases: la primera, el plantejament d’una denúncia; la segona, una dinàmica grupal de rols reveladora del conflicte existent i conversa generativa; la tercera, conscienciació del racisme aversiu latent i tractament d’aquest mitjançant el model circular-narratiu; la quarta, superació d’aquest a partir del conflicte socio-moral que genera la conducta; la cinquena, la valoració de l’activitat mitjançant la positivització de la narrativa; i sisena, la necessitat de la recerca d’un nou marc conceptual i d’un concepte constructiu i antagònic a “racisme”. Així doncs, quan el subjecte vegi despertat el seu racisme latent i prengui consciència d’aquest, degut al conflicte socio-moral generat per la influència de la minoria discriminada, podrà canviar les dinàmiques discriminatòries i racistes

    Notas arqueológicas de las sierras centrales

    Get PDF
    corecore