99 research outputs found

    Быстрая согласованность по Кемени на основе поиска по стандартным матрицам с минимальным расстоянием до усредненного экспертного ранжирования

    Get PDF
    Проблематика. Розглядається задача ранжування скінченної множини об’єктів. Мета дослідження. Розробка алгоритму, який дав би змогу пришвидшити пошук узгодженості за Кемені поряд з обґрунтуванням метрики для порівняння ранжувань. Методика реалізації. Пропонується й обґрунтовується підхід щодо об’єднання експертних ранжувань. Також пропонується й обґрунтовується метрика для порівняння ранжувань. Результати дослідження. Розроблений алгоритм знаходить множину ранжувань Кемені значно швидше, ніж класичний прямий пошук. Також ця множина часто містить єдину узгодженість за Кемені, що не вдається за прямого пошуку. Крім цього, єдина узгодженість за Кемені визначається відразу, якщо усереднене експертне ранжування виявляється ациклічним. Так розв’язується задача вибору єдиної узгодженості за Кемені. Висновки. Для 10 і більше об’єктів, де більшість відомих підходів стають незастосовними, алгоритм є реалізовним завдяки пошуку по тільки тих стандартних матрицях, чия відстань до першого ранжування відрізняється від відстані між цим ранжуванням та усередненим експертним ранжуванням на мінімальну величину.Background. The problem of ranking a finite set of objects is considered. Objective. The goal is to develop an algorithm that would let speed up the search of the Kemeny consensus along with substantiation of a metric to compare rankings. Methods. An approach for aggregating experts’ rankings is suggested and substantiated. Also a metric to compare rankings is suggested and substantiated. Results. The developed algorithm finds a set of Kemeny rankings much faster than the classical straightforward search. Also this set often contains a single Kemeny consensus, what fails by the straightforward search. Besides, a single Kemeny consensus is determined at one stroke if the averaged expert ranking turns out acyclic. Thus the problem of selecting a single Kemeny consensus is solved. Conclusions. For 10 objects and more, where most known approaches become intractable, the algorithm still is tractable due to searching over only those standard matrices whose distance to the first ranking differs minimally from the distance between this ranking and the averaged expert ranking.Проблематика. Рассматривается задача ранжирования конечного множества объектов. Цель исследования. Разработка алгоритма, который позволил бы ускорить поиск согласованности по Кемени вместе с обоснованием метрики для сравнения ранжирований. Методика реализации. Предлагается и обосновывается подход относительно объединения экспертных ранжирований. Также предлагается и обосновывается метрика для сравнения ранжирований. Результаты исследования. Разработанный алгоритм находит множество ранжирований Кемени гораздо быстрее, чем классический прямой поиск. Также это множество часто содержит единственную согласованность по Кемени, что не удается при прямом поиске. Кроме этого, единственная согласованность по Кемени определяется сразу, если усредненное экспертное ранжирование оказывается ациклическим. Так решается задача выбора единственной согласованности по Кемени. Выводы. Для 10 и более объектов, где большинство известных подходов становятся неисполнимыми, алгоритм является осуществимым благодаря поиску по только тем стандартным матрицам, чье расстояние к первому ранжированию отличается от расстояния между этим ранжированием и усредненным экспертным ранжированием на минимальную величину

    Fixed-Parameter Algorithms for Computing Kemeny Scores - Theory and Practice

    Full text link
    The central problem in this work is to compute a ranking of a set of elements which is "closest to" a given set of input rankings of the elements. We define "closest to" in an established way as having the minimum sum of Kendall-Tau distances to each input ranking. Unfortunately, the resulting problem Kemeny consensus is NP-hard for instances with n input rankings, n being an even integer greater than three. Nevertheless this problem plays a central role in many rank aggregation problems. It was shown that one can compute the corresponding Kemeny consensus list in f(k) + poly(n) time, being f(k) a computable function in one of the parameters "score of the consensus", "maximum distance between two input rankings", "number of candidates" and "average pairwise Kendall-Tau distance" and poly(n) a polynomial in the input size. This work will demonstrate the practical usefulness of the corresponding algorithms by applying them to randomly generated and several real-world data. Thus, we show that these fixed-parameter algorithms are not only of theoretical interest. In a more theoretical part of this work we will develop an improved fixed-parameter algorithm for the parameter "score of the consensus" having a better upper bound for the running time than previous algorithms.Comment: Studienarbei

    Improved Parameterized Algorithms for the Kemeny Aggregation Problem

    Full text link
    We give improvements over fixed parameter tractable (FPT) algo-rithms to solve the Kemeny aggregation problem, where the task is to summarize a multi-set of preference lists, called votes, over a set of alternatives, called candidates, into a single preference list that has the minimum total τ-distance from the votes. The τ-distance between two preference lists is the number of pairs of candidates that are or-dered differently in the two lists. We study the problem for preference lists that are total orders. We develop algorithms of running times O∗(1.403kt), O∗(5.823kt/m) ≤ O∗(5.823kavg) and O∗(4.829kmax) for the problem, ignoring the polynomial factors in the O ∗ notation, where kt is the optimum total τ-distance, m is the number of votes, and kavg (resp, kmax) is the average (resp, maximum) over pairwise τ-distances of votes. Our algorithms improve the best previously known running times of O∗(1.53kt) and O∗(16kavg) ≤ O∗(16kmax) [4, 5], which also implies an O∗(164kt/m) running time. We also show how to enumerate all optimal solutions in O∗(36kt/m) ≤ O∗(36kavg) time.

    Label Ranking with Probabilistic Models

    Get PDF
    Diese Arbeit konzentriert sich auf eine spezielle Prognoseform, das sogenannte Label Ranking. Auf den Punkt gebracht, kann Label Ranking als eine Erweiterung des herkömmlichen Klassifizierungproblems betrachtet werden. Bei einer Anfrage (z. B. durch einen Kunden) und einem vordefinierten Set von Kandidaten Labels (zB AUDI, BMW, VW), wird ein einzelnes Label (zB BMW) zur Vorhersage in der Klassifizierung benötigt, während ein komplettes Ranking aller Label (zB BMW> VW> Audi) für das Label Ranking erforderlich ist. Da Vorhersagen dieser Art, bei vielen Problemen der realen Welt nützlich sind, können Label Ranking-Methoden in mehreren Anwendungen, darunter Information Retrieval, Kundenwunsch Lernen und E-Commerce eingesetzt werden. Die vorliegende Arbeit stellt eine Auswahl an Methoden für Label-Ranking vor, die Maschinelles Lernen mit statistischen Bewertungsmodellen kombiniert. Wir konzentrieren wir uns auf zwei statistische Ranking-Modelle, das Mallows- und das Plackett-Luce-Modell und zwei Techniken des maschinellen Lernens, das Beispielbasierte Lernen und das Verallgemeinernde Lineare Modell

    Preference rules for label ranking: Mining patterns in multi-target relations

    Get PDF
    In this paper, we investigate two variants of association rules for preference data, Label Ranking Association Rules and Pairwise Association Rules. Label Ranking Association Rules (LRAR) are the equivalent of Class Association Rules (CAR) for the Label Ranking task. In CAR, the consequent is a single class, to which the example is expected to belong to. In LRAR, the consequent is a ranking of the labels. The generation of LRAR requires special support and confidence measures to assess the similarity of rankings. In this work, we carry out a sensitivity analysis of these similarity-based measures. We want to understand which datasets benefit more from such measures and which parameters have more influence in the accuracy of the model. Furthermore, we propose an alternative type of rules, the Pairwise Association Rules (PAR), which are defined as association rules with a set of pairwise preferences in the consequent. While PAR can be used both as descriptive and predictive models, they are essentially descriptive models. Experimental results show the potential of both approaches.This research has received funding from the ECSEL Joint Undertaking, the framework programme for research and innovation horizon 2020 (2014-2020) under grant agreement number 662189-MANTIS-2014-1, and by National Funds through the FCT — Fundação para a Ciência e a Tecnologia (Portuguese Foundation for Science and Technology) as part of project UID/EEA/50014/2013

    Analyses bioinformatiques et classements consensus pour les données biologiques à haut débit

    Get PDF
    It is thought to be more and more important to solve biological questions using Bioinformatics approaches in the post-genomic era. This thesis focuses on two problems related to high troughput data: bioinformatics analysis at a large scale, and development of algorithms of consensus ranking. In molecular biology and genetics, RNA splicing is a modification of the nascent pre-messenger RNA (pre-mRNA) transcript in which introns are removed and exons are joined. The U2AF heterodimer has been well studied for its role in defining functional 3’ splice sites in pre-mRNA splicing, but multiple critical problems are still outstanding, including the functional impact of their cancer-associated mutations. Through genome-wide analysis of U2AF-RNA interactions, we report that U2AF has the capacity to define ~88% of functional 3’ splice sites in the human genome. Numerous U2AF binding events also occur in other genomic locations, and metagene and minigene analysis suggests that upstream intronic binding events interfere with the immediate downstream 3’ splice site associated with either the alternative exon to cause exon skipping or competing constitutive exon to induce inclusion of the alternative exon. We further build up a U2AF65 scoring scheme for predicting its target sites based on the high throughput sequencing data using a Maximum Entropy machine learning method, and the scores on the up and down regulated cases are consistent with our regulation model. These findings reveal the genomic function and regulatory mechanism of U2AF, which facilitates us understanding those associated diseases.Ranking biological data is a crucial need. Instead of developing new ranking methods, Cohen-Boulakia and her colleagues proposed to generate a consensus ranking to highlight the common points of a set of rankings while minimizing their disagreements to combat the noise and error for biological data. However, it is a NP-hard questioneven for only four rankings based on the Kendall-tau distance. In this thesis, we propose a new variant of pivot algorithms named as Consistent-Pivot. It uses a new strategy of pivot selection and other elements assignment, which performs better both on computation time and accuracy than previous pivot algorithms.Cette thèse aborde deux problèmes relatifs à l’analyse et au traitement des données biologiques à haut débit: le premier touche l’analyse bioinformatique des génomes à grande échelle, le deuxième est consacré au développement d’algorithmes pour le problème de la recherche d’un classement consensus de plusieurs classements.L’épissage des ARN est un processus cellulaire qui modifie un ARN pré-messager en en supprimant les introns et en raboutant les exons. L’hétérodimère U2AF a été très étudié pour son rôle dans processus d’épissage lorsqu’il se fixe sur des sites d’épissage fonctionnels. Cependant beaucoup de problèmes critiques restent en suspens, notamment l’impact fonctionnel des mutations de ces sites associées à des cancers. Par une analyse des interactions U2AF-ARN à l’échelle génomique, nous avons déterminé qu’U2AF a la capacité de reconnaître environ 88% des sites d’épissage fonctionnels dans le génome humain. Cependant on trouve de très nombreux autres sites de fixation d’U2AF dans le génome. Nos analyses suggèrent que certains de ces sites sont impliqués dans un processus de régulation de l’épissage alternatif. En utilisant une approche d’apprentissage automatique, nous avons développé une méthode de prédiction des sites de fixation d’UA2F, dont les résultats sont en accord avec notre modèle de régulation. Ces résultats permettent de mieux comprendre la fonction d’U2AF et les mécanismes de régulation dans lesquels elle intervient.Le classement des données biologiques est une nécessité cruciale. Nous nous sommes intéressés au problème du calcul d’un classement consensus de plusieurs classements de données, dans lesquels des égalités (ex-aequo) peuvent être présentes. Plus précisément, il s’agit de trouver un classement dont la somme des distances aux classements donnés en entrée est minimale. La mesure de distance utilisée le plus fréquemment pour ce problème est la distance de Kendall-tau généralisée. Or, il a été montré que, pour cette distance, le problème du consensus est NP-difficile dès lors qu’il y a plus de quatre classements en entrée. Nous proposons pour le résoudre une heuristique qui est une nouvelle variante d’algorithme à pivot. Cette heuristique, appelée Consistent-pivot, s’avère à la fois plus précise et plus rapide que les algorithmes à pivot qui avaient été proposés auparavant

    Adaptation strategies of dam safety management to new climate change scenarios informed by risk indicators

    Full text link
    Tesis por compendio[ES] Las grandes presas, así como los diques de protección, son infraestructuras críticas cuyo fallo puede conllevar importantes consecuencias económicas y sociales. Tradicionalmente, la gestión del riesgo y la definición de estrategias de adaptación en la toma de decisiones han asumido la invariabilidad de las condiciones climáticas, incluida la persistencia de patrones históricos de variabilidad natural y la frecuencia de eventos extremos. Sin embargo, se espera que el cambio climático afecte de forma importante a los sistemas hídricos y comprometa la seguridad de las presas, lo que puede acarrear posibles impactos negativos en términos de costes económicos, sociales y ambientales. Los propietarios y operadores de presas deben por tanto adaptar sus estrategias de gestión y adaptación a medio y largo plazo a los nuevos escenarios climáticos. En la presente tesis se ha desarrollado una metodología integral para incorporar los impactos del cambio climático en la gestión de la seguridad de presas y en el apoyo a la toma de decisiones. El objetivo es plantear estrategias de adaptación que incorporen la variabilidad de los futuros riesgos, así como la incertidumbre asociada a los nuevos escenarios climáticos. El impacto del cambio climático en la seguridad de presas se ha estructurado utilizando modelos de riesgo y mediante una revisión bibliográfica interdisciplinaria sobre sus potenciales efectos. Esto ha permitido establecer un enfoque dependiente del tiempo que incorpore la evolución futura del riesgo, para lo cual se ha definido un nuevo indicador que evalúa cuantitativamente la eficiencia a largo plazo de las medidas de reducción de riesgo. Además, para integrar la incertidumbre de los escenarios futuros en la toma de decisiones, la metodología propone una estrategia robusta que permite establecer secuencias optimizadas de implementación de medidas correctoras para la adaptación al cambio climático. A pesar de las dificultades para asignar probabilidades a eventos específicos, esta metodología permite un análisis sistemático y objetivo, reduciendo considerablemente la subjetividad. Esta metodología se ha aplicado al caso real de una presa española susceptible a los efectos del cambio climático. El análisis se centra en el escenario hidrológico, donde las avenidas son la principal carga a la que está sometida la presa. Respecto de análisis previos de la presa, los resultados obtenidos proporcionan nueva y valiosa información sobre la evolución de los riesgos futuros y sobre cómo abordarlos. En general, se espera un aumento del riesgo con el tiempo; esto ha llevado a plantear nuevas medidas de adaptación que no están justificadas en la situación actual. Esta es la primera aplicación documentada de un análisis exhaustivo de los impactos del cambio climático sobre el riesgo de rotura de una presa que sirve como marco de referencia para la definición de estrategias de adaptación a largo plazo y la evaluación de su eficiencia.[CAT] Les grans preses, així com els dics de protecció, són infraestructures crítiques que si fallen poden produir importants conseqüències econòmiques i socials. Tradicionalment, la gestió del risc i la definició d'estratègies d'adaptació en la presa de decisions han assumit la invariabilitat de les condicions climàtiques, inclosa la persistència de patrons històrics de variabilitat natural i la probabilitat d'esdeveniments extrems. No obstant això, s'espera que el canvi climàtic afecte de manera important als sistemes hídrics i comprometi la seguretat de les preses, la qual cosa pot implicar possibles impactes negatius en termes de costos econòmics, socials i ambientals. Els propietaris i operadors de preses deuen per tant adaptar les seues estratègies de gestió i adaptació a mitjà i llarg termini als nous escenaris climàtics. En la present tesi s'ha desenvolupat una metodologia integral per a incorporar els impactes del canvi climàtic en la gestió de la seguretat de preses i en el suport a la presa de decisions. L'objectiu és plantejar estratègies d'adaptació que incorporen la variabilitat dels futurs riscos, així com la incertesa associada als nous escenaris climàtics. L'impacte del canvi climàtic en la seguretat de preses s'ha estructurat utilitzant models de risc i mitjançant una revisió bibliogràfica interdisciplinària sobre els seus potencials efectes. Això ha permès establir un enfocament dependent del temps que incorpori l'evolució futura del risc, per a això s'ha definit un nou indicador que avalua quantitativament l'eficiència a llarg termini de les mesures de reducció de risc. A més, per a integrar la incertesa dels escenaris futurs en la presa de decisions, la metodologia proposa una estratègia robusta que permet establir seqüències optimitzades d'implementació de mesures correctores per a l'adaptació al canvi climàtic. A pesar de les dificultats per a assignar probabilitats a esdeveniments específics, esta metodologia permet una anàlisi sistemàtica i objectiva, reduint considerablement la subjectivitat. Aquesta metodologia s'ha aplicat al cas real d'una presa espanyola susceptible a l'efecte del canvi climàtic. L'anàlisi se centra en l'escenari hidrològic, on les avingudes són la principal càrrega a la qual està sotmesa la presa. Respecte d'anàlisis prèvies de la presa, els resultats obtinguts proporcionen nova i valuosa informació sobre l'evolució dels riscos futurs i sobre com abordar-los. En general, s'espera un augment del risc amb el temps; això ha portat a plantejar noves mesures d'adaptació que no estarien justificades en la situació actual. Aquesta és la primera aplicació documentada d'una anàlisi exhaustiva dels impactes del canvi climàtic sobre el risc de trencament d'una presa que serveix com a marc de referència per a la definició d'estratègies d'adaptació a llarg termini i l'avaluació de la seua eficiencia.[EN] Large dams as well as protective dikes and levees are critical infrastructures whose failure has major economic and social consequences. Risk assessment approaches and decision-making strategies have traditionally assumed the stationarity of climatic conditions, including the persistence of historical patterns of natural variability and the likelihood of extreme events. However, climate change has a major impact on the world's water systems and is endangering dam safety, leading to potentially damaging impacts in terms of economic, social and environmental costs. Owners and operators of dams must adapt their mid- and long-term management and adaptation strategies to new climate scenarios. This thesis proposes a comprehensive approach to incorporate climate change impacts on dam safety management and decision-making support. The goal is to design adaptation strategies that incorporate the non-stationarity of future risks as well as the uncertainties associated with new climate scenarios. Based on an interdisciplinary review of the state-of-the-art research on its potential effects, the global impact of climate change on dam safety is structured using risk models. This allows a time-dependent approach to be established to consider the potential evolution of risk with time. Consequently, a new indicator is defined to support the quantitative assessment of the long-term efficiency of risk reduction measures. Additionally, in order to integrate the uncertainty of future scenarios, the approach is enhanced with a robust decision-making strategy that helps establish the consensus sequence of measures to be implemented for climate change adaptation. Despite the difficulties to allocate probabilities to specific events, such framework allows for a systematic and objective analysis, reducing considerably the subjectivity. Such a methodology is applied to a real case study of a Spanish dam subjected to the effects of climate change. The analysis focus on hydrological scenarios, where floods are the main load to which the dam is subjected. The results provide valuable new information with respect to the previously existing analysis of the dam regarding the evolution of future risks and how to cope with it. In general, risks are expected to increase with time and, as a result, new adaptation measures that are not justifiable for the present situation are recommended. This is the first documented application of a comprehensive analysis of climate change impacts on dam failure risk and serves as a reference benchmark for the definition of long-term adaptation strategies and the evaluation of their efficiency.Fluixá Sanmartín, J. (2020). Adaptation strategies of dam safety management to new climate change scenarios informed by risk indicators [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/157634TESISCompendi
    corecore