1 research outputs found

    Clasificaci贸n Jer谩rquica Multiclase

    Full text link
    [ES] La sociedad moderna se ha visto afectada por los acelerados avances de la tecnolog铆a. La aplicaci贸n de la inteligencia artificial se puede encontrar en todas partes, desde la televisi贸n inteligente hasta los coches aut贸nomos. Una tarea esencial del aprendizaje autom谩tico es la clasificaci贸n. A pesar de la cantidad de t茅cnicas y algoritmos de clasificaci贸n que existen, es un campo que sigue siendo relevante por todas sus aplicaciones. As铆, frente a la clasificaci贸n tradicional multiclase en la que a cada instancia se le asigna una 煤nica etiqueta de clase, se han propuesto otros m茅todos como la clasificaci贸n jer谩rquica y la clasificaci贸n multietiqueta. Esta tesis tiene como objetivo resolver la clasificaci贸n multiclase mediante una descomposici贸n jer谩rquica. Asimismo, se exploran diferentes m茅todos de extender la aproximaci贸n definida para su aplicaci贸n en contextos cambiantes. La clasificaci贸n jer谩rquica es una tarea de aprendizaje autom谩tico en la que el problema de clasificaci贸n original se divide en peque帽os subproblemas. Esta divisi贸n se realiza teniendo en cuenta una estructura jer谩rquica que representa las relaciones entre las clases objetivo. Como resultado el clasificador jer谩rquico es a su vez una estructura (un 谩rbol o un grafo) compuesta por clasificadores de base. Hasta ahora, en la literatura, la clasificaci贸n jer谩rquica se ha aplicado a dominios jer谩rquicos, independientemente que la estructura jer谩rquica sea proporcionada expl铆citamente o se asume impl铆cita (en cuyo caso se hace necesario inferir primero dicha estructura jer谩rquica). La clasificaci贸n jer谩rquica ha demostrado un mejor rendimiento en dominios jer谩rquicos en comparaci贸n con la clasificaci贸n plana (que no tiene en cuenta la estructura jer谩rquica del dominio). En esta tesis, proponemos resolver los problemas de clasificaci贸n multiclase descomponi茅ndolo jer谩rquicamente de acuerdo a una jerarqu铆a de clases inferida por un clasificador plano. Planteamos dos escenarios dependiendo del tipo de clasificador usado en la jerarqu铆a de clasificadores: clasificadores duros (crisp) y clasificadores suaves (soft). Por otra parte, un problema de clasificaci贸n puede sufrir cambios una vez los modelos han sido entrenados. Un cambio frecuente es la aparici贸n de una nueva clase objetivo. Dado que los clasificadores no han sido entrenados con datos pertenecientes a la nueva clase, no podr谩n encontrar predicciones correctas para las nuevas instancias, lo que afectar谩 negativamente en el rendimiento de los clasificadores. Este problema se puede resolver mediante dos alternativas: el reentrenamiento de todo el modelo o la adaptaci贸n del modelo para responder a esta nueva situaci贸n. Como parte del estudio de los algoritmos de clasificaci贸n jer谩rquica se presentan varios m茅todos para adaptar el modelo a los cambios en las clases objetivo. Los m茅todos y aproximaciones definidas en la tesis se han evaluado experimentalmente con una amplia colecci贸n de conjuntos de datos que presentan diferentes caracter铆sticas, usando diferentes t茅cnicas de aprendizaje para generar los clasificadores de base. En general, los resultados muestran que los m茅todos propuestos pueden ser una alternativa a m茅todos tradicionales y otras t茅cnicas presentadas en la literatura para abordar las situaciones espec铆ficas planteadas.[CA] La societat moderna s'ha vist afectada pels accelerats aven莽os de la tecnologia. L'aplicaci贸 de la intel路lig猫ncia artificial es pot trobar a tot arreu, des de la televisi贸 intel路ligent fins als cotxes aut貌noms. Una tasca essencial de l'aprenentatge autom脿tic 茅s la classificaci贸. Tot i la quantitat de t猫cniques i algoritmes de classificaci贸 que existeixen, 茅s un camp que segueix sent rellevant per totes les seves aplicacions. Aix铆, enfront de la classificaci贸 tradicional multiclase en la qual a cada inst脿ncia se li assigna una 煤nica etiqueta de classe, s'han proposat altres m猫todes com la classificaci贸 jer脿rquica i la classificaci贸 multietiqueta. Aquesta tesi t茅 com a objectiu resoldre la classificaci贸 multiclase mitjan莽ant una descomposici贸 jer脿rquica. Aix铆 mateix, s'exploren diferents m猫todes d'estendre l'aproximaci贸 definida per a la seva aplicaci贸 en contextos canviants. La classificaci贸 jer脿rquica 茅s una tasca d'aprenentatge autom脿tic en la qual el problema de classificaci贸 original es divideix en petits subproblemes. Aquesta divisi贸 es realitza tenint en compte una estructura jer脿rquica que representa les relacions entre les classes objectiu. Com a resultat el classificador jer脿rquic 茅s al seu torn una estructura (un arbre o un graf) composta per classificadors de base. Fins ara, en la literatura, la classificaci贸 jer脿rquica s'ha aplicat a dominis jer脿rquics, independentment que l'estructura jer脿rquica sigui proporcionada expl铆citament o s'assumeix impl铆cita (en aquest cas es fa necessari inferir primer aquesta estructura jer脿rquica). La classificaci贸 jer脿rquica ha demostrat un millor rendiment en dominis jer脿rquics en comparaci贸 amb la classificaci贸 plana (que no t茅 en compte l'estructura jer脿rquica de l'domini). En aquesta tesi, proposem resoldre els problemes de classificaci贸 multiclasse descomponent jer脿rquicament d'acord a una jerarquia de classes inferida per un classificador pla. Plantegem dos escenaris depenent de el tipus de classificador usat en la jerarquia de classificadors: classificadors durs (crisp) i classificadors suaus (soft). D'altra banda, un problema de classificaci贸 pot patir canvis una vegada els models han estat entrenats. Un canvi freq眉ent 茅s l'aparici贸 d'una nova classe objectiu. At猫s que els classificadors no han estat entrenats amb dades pertanyents a la nova classe, no podran trobar prediccions correctes per a les noves inst脿ncies, el que afectar脿 negativament en el rendiment dels classificadors. Aquest problema es pot resoldre mitjan莽ant dues alternatives: el reentrenament de tot el model o l'adaptaci贸 de el model per respondre a aquesta nova situaci贸. Com a part de l'estudi dels algoritmes de classificaci贸 jer脿rquica es presenten diversos m猫todes per adaptar el model als canvis en les classes objectiu. Els m猫todes i aproximacions definides en la tesi s'han avaluat experimentalment amb una 脿mplia col路lecci贸 de conjunts de dades que presenten diferents caracter铆stiques, usant diferents t猫cniques d'aprenentatge per generar els classificadors de base. En general, els resultats mostren que els m猫todes proposats poden ser una alternativa a m猫todes tradicionals i altres t猫cniques presentades en la literatura per abordar les situacions espec铆fiques plantejades.[EN] The modern society has been affected by rapid advances in technology. The application of artificial intelligence can be found everywhere, from intelligent television to autonomous cars. An essential task of machine learning is classification. Despite the number of classification techniques and algorithms that exist, it is a field that remains relevant for all its applications. Thus, as opposed to the traditional multiclass classification in which each instance is assigned a single class label, other methods such as hierarchical classification and multi-label classification have been proposed. This thesis aims to solve multiclass classification by means of a hierarchical decomposition. Also, different methods of extending the defined approach are explored for application in changing contexts. Hierarchical classification is an automatic learning task in which the original classification problem is divided into small sub-problems. This division is made taking into account a hierarchical structure that represents the relationships between the target classes. As a result the hierarchical classifier is itself a structure (a tree or a graph) composed of base classifiers. Up to now, in the literature, hierarchical classification has been applied to hierarchical domains, regardless of whether the hierarchical structure is explicitly provided or assumed to be implicit (in which case it becomes necessary to first infer the hierarchical structure). Hierarchical classification has demonstrated better performance in hierarchical domains compared to flat classification (which does not take into account the hierarchical structure of the domain). In this thesis, we propose to solve the problems of multiclass classification by breaking it down hierarchically according to a class hierarchy inferred by a plane classifier. We propose two scenarios depending on the type of classifier used in the classifier hierarchy: hard classifiers (crisp) and soft classifiers (soft). On the other hand, a classification problem may change once the models have been trained. A frequent change is the appearance of a new target class. Since the existing classifiers have not been trained with data belonging to the new class, they will not be able to find correct predictions for the new instances, which will negatively affect the performance of the classifiers. This problem can be solved by two alternatives: retraining the entire model or adapting the model to respond to this new situation. As part of the study of hierarchical classification algorithms, several methods are presented to adapt the model to changes in target classes. The methods and approaches defined in the thesis have been evaluated experimentally with a large collection of data sets that have different characteristics, using different learning techniques to generate the base classifiers. In general, the results show that the proposed methods can be an alternative to traditional methods and other techniques presented in the literature to address the specific situations raised.Silva Palacios, DA. (2021). Clasificaci贸n Jer谩rquica Multiclase [Tesis doctoral]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/167015TESI
    corecore