    Fouille de données par extraction de motifs graduels : contextualisation et enrichissement

    This thesis's works belongs to the framework of knowledge extraction and data mining applied to numerical or fuzzy data in order to extract linguistic summaries in the form of gradual itemsets: the latter express correlation between attribute values of the form « the more the temperature increases, the more the pressure increases ». Our goal is to contextualize and enrich these gradual itemsets by proposing different types of additional information so as to increase their quality and provide a better interpretation. We propose four types of new itemsets: first of all, reinforced gradual itemsets, in the case of fuzzy data, perform a contextualization by integrating additional attributes linguistically introduced by the expression « all the more ». They can be illustrated by the example « the more the temperature decreases, the more the volume of air decreases, all the more its density increases ». Reinforcement is interpreted as increased validity of the gradual itemset. In addition, we study the extension of the concept of reinforcement to association rules, discussing their possible interpretations and showing their limited contribution. We then propose to process the contradictory itemsets that arise for example in the case of simultaneous extraction of « the more the temperature increases, the more the humidity increases » and « the more the temperature increases, the less the humidity decreases ». To manage these contradictions, we define a constrained variant of the gradual itemset support, which, in particular, does not only depend on the considered itemset, but also on its potential contradictors. We also propose two extraction methods: the first one consists in filtering, after all itemsets have been generated, and the second one integrates the filtering process within the generation step. We introduce characterized gradual itemsets, defined by adding a clause linguistically introduced by the expression « especially if » that can be illustrated by a sentence such as « the more the temperature decreases, the more the humidity decreases, especially if the temperature varies in [0, 10] °C »: the additional clause precise value ranges on which the validity of the itemset is increased. We formalize the quality of this enrichment as a trade-off between two constraints imposed to identified interval, namely a high validity and a high size, as well as an extension taking into account the data density. We propose a method to automatically extract characterized gradual based on appropriate mathematical morphology tools and the definition of an appropriate filter and transcription.Les travaux de cette thèse s'inscrivent dans le cadre de l'extraction de connaissances et de la fouille de données appliquée à des bases de données numériques ou floues afin d'extraire des résumés linguistiques sous la forme de motifs graduels exprimant des corrélations de co-variations des valeurs des attributs, de la forme « plus la température augmente, plus la pression augmente ». Notre objectif est de les contextualiser et de les enrichir en proposant différents types de compléments d'information afin d'augmenter leur qualité et leur apporter une meilleure interprétation. Nous proposons quatre formes de nouveaux motifs : nous avons tout d'abord étudié les motifs dits « renforcés », qui effectuent, dans le cas de données floues, une contextualisation par intégration d'attributs complémentaires, ajoutant des clauses introduites linguistiquement par l'expression « d'autant plus que ». Ils peuvent être illustrés par l'exemple « plus la température diminue, plus le volume de l'air diminue, d'autant plus que sa densité augmente ». Ce renforcement est interprété comme validité accrue des motifs graduels. Nous nous sommes également intéressées à la transposition de la notion de renforcement aux règles d'association classiques en discutant de leurs interprétations possibles et nous montrons leur apport limité. Nous proposons ensuite de traiter le problème des motifs graduels contradictoires rencontré par exemple lors de l'extraction simultanée des deux motifs « plus la température augmente, plus l'humidité augmente » et « plus la température augmente, plus l'humidité diminue ». Pour gérer ces contradictions, nous proposons une définition contrainte du support d'un motif graduel, qui, en particulier, ne dépend pas uniquement du motif considéré, mais aussi de ses contradicteurs potentiels. Nous proposons également deux méthodes d'extraction, respectivement basées sur un filtrage a posteriori et sur l'intégration de la contrainte du nouveau support dans le processus de génération. Nous introduisons également les motifs graduels caractérisés, définis par l'ajout d'une clause linguistiquement introduite par l'expression « surtout si » comme par exemple « plus la température diminue, plus l'humidité diminue, surtout si la température varie dans [0, 10] °C » : la clause additionnelle précise des plages de valeurs sur lesquelles la validité des motifs est accrue. Nous formalisons la qualité de cet enrichissement comme un compromis entre deux contraintes imposées à l'intervalle identifié, portant sur sa taille et sa validité, ainsi qu'une extension tenant compte de la densité des données.Nous proposons une méthode d'extraction automatique basée sur des outils de morphologie mathématique et la définition d'un filtre approprié et transcription

    Sequencing fiscal decentralization

    While there is extensive knowledge about how to design fiscal decentralization policies, considerably less is understood about how a decentralization program should be sequenced and implemented. Countries embarking on decentralization often struggle with decisions about the essential components of decentralization, including the order of an introduction of decentralization policies, the number of years necessary to bring a full program on line, and the components of the transition strategy. The authors argue that the sequencing of decentralization policies is an important determinant of its success. The consequences of a poorly sequenced decentralization program can range from minor delays and complications to ineffectiveness and subsequent failing support of decentralization efforts, macroeconomic instability, and fundamental failure in public sector delivery. At a minimum, the strategy of"making it up as we go"will not lead to the same structure of decentralization as will a planned strategy. The paper raises two questions: First, is there an optimal sequencing for decentralization policies and implementation? The answer is that there is, and that following these sequencing rules can reduce the costs and risks of implementing fiscal decentralization. Second, to what extent do countries follow these optimal sequencing rules? The answer is, in general, they do not. The gap between theory and practice is a result of the complexity of sequencing design, which discourages fiscal planners from implementing the full process. In addition, sequencing requires a sustained discipline and vision for its implementation, as well as overcoming pressures from political actors, especially in developing countries.Decentralization,Subnational Regional Economics,Economic Theory&Research,Teaching and Learning,Regional Rural Development

    Inflation: Its Mechanics and Welfare Costs

    macroeconomics, inflation

    Chinese elements : a bridge of the integration between Chinese -English translation and linguaculture transnational mobility

    [Abstract] As the popularity of Chinese elements in the innovation of the translation part in Chinese CET, we realized that Chinese elements have become a bridge between linguaculture transnational mobility and Chinese-English translation.So, Chinese students translation skills should be critically improved; for example, on their understanding about Chinese culture, especially the meaning of Chinese culture. Five important secrets of skillful translation are introduced to improve students’ translation skills

    Eger Journal of English Studies (Vol. 10.)

    A history of emotive interjections in English: what, why and how

    W pracy omówiono ewolucję form oraz funkcję wykrzyknień i wtrąceń what, why i how na podstawie korpusu tekstów powieści angielskich (XVII- XX wiek). Opierając się na dotychczasowych opracowaniach językoznawczych, podjęto próbę odpowiedzi na pytanie, czy można mówić o konwencjonalizacji treści wykrzyknień przy współistnieniu tradycyjnej funkcji pytającej i wtórnej funkcji eksklamatywnej tych zaimków . Jak wiadomo, każdy akt komunikacji związany jest z emocjonalnym zaangażowaniem rozmówców, co powoduje, że semantyka postaw uczuciowych i stosunków międzyludzkich wyraża się między innymi w różnych sposobach mówienia. Zasadne jest zatem omówienie wielorakich emocji, takich jak radość, zachwyt, rozczarowanie lub zdenerwowanie. Temat ten rozważany jest w rozdziale II. Ponadto zwrócono uwagę na złożoność problemu, która wyraża się także w różnicach definicyjnych pomiędzy pojęciem wykrzyknienia (exclamation) i pojęciem wykrzyknika (interjection), szczególnie gdy wykrzyknienie jest formą jednowyrazową typu What!, Why!, How!. Oba te terminy zostały jednoznacznie zdefiniowane. Rozdział trzeci omawia diachroniczny rozwój wykrzyknień. Zjawisko współistnienia dwóch różnych funkcji opisywanej klasy pojawia się już w okresie staroangielskim. Różnice w poszczególnych przykładach wskazują na wymienność badanych funkcji w różnym stopniu i z różną częstotliwością dla what, why i how. Można też zaobserwować syntaktyczną mobilność badanych zaimków, które pojawiają się nie tylko na początku zdania, ale mogą również zajmować dalszą pozycję charakterystyczną dla zdania podrzędnego. W rozdziale czwartym (poświęconym wykrzyknieniu what), piątym (opisującym leksem how), i szóstym (omawiającym why), przeprowadzono analizę zgromadzonego materiału badawczego - wybranych powieści angielskich opublikowanych pomiędzy 1621 a 1950 rokiem. Przeanalizowano modyfikację wyrażeń wykrzyknikowych z what, why i how występujących zarówno w zdaniach pojedynczych (exclamations), jak i pojawiających się jako jednowyrazowe formy (interjections). Zwrócono także uwagę na znaczącą różnorodność użycia znaków interpunkcyjnych (znak wykrzyknika, znak zapytania, kropka, itp.) stosowanych w języku pisanym w celu zasygnalizowania konturu intonacyjnoakcentacyjnego wypowiedzi. Rozdział siódmy stanowi podsumowanie badań opartych na materiale historycznym, wskazując że silny preskryptywizm w XVIII i XIX wieku, jak również proces gramatykalizacji mógł mieć znaczny wpływ na współistnienie funkcji pytającej oraz wykrzyknikowej. Badania dużych korpusów tekstów przy użyciu konkordacyjnych i wyszukujących programów komputerowych wykazały, że te konstrukcje zachowują moc illokucyjną, gdyż są często zaznaczone znakiem graficznym w formie wykrzyknienia, który podkreśla jeszcze bardziej ich funkcję emotywną. W tym samym materiale można zaobserwować asymetrię pomiędzy współfunkcjonalnością badanych zaimków. Podczas gdy why nadal jest używane jako wykrzyknik, what i how są coraz rzadziej spotykane w tej funkcji, zatem badanie wymyka się z ram sztywnej klasyfikacji

    Vagueness as a political strategy: weasel words in security council resolutions relating to the second gulf war

    Over the last few years the diplomatic language of UN resolutions has repeatedly been questioned for the excessive presence of vagueness. In an era of expanding international contacts between different legal systems, international institutions such as the UN are constantly faced with the need to overcome cultural divergences of their recipient countries. In order to meet these requirements, UN diplomatic texts may use vague words quite extensively. Such terms, whose meaning is very flexible, variable and strictly dependent on context and interpretation, have been defined by Mellinkoff (1963: 21) as “weasel words”. The use of vague terms could be connected to the genre of diplomatic texts, as resolutions should be applicable to every international contingency. However, excessive vagueness could also lead to biased or even strategically-motivated interpretations of resolutions, undermining their legal impact and triggering conflicts instead of diplomatic solutions. This doctoral thesis is based on two main research aims: A first section aims at investigating on whether the use of strategic vagueness in Security Council resolutions relating to Iraq has contributed to the breakout of the second Gulf war instead of a diplomatic solution of the controversy. Using the qualitative Discourse-Historical approach (Wodak 2000) and quantitative analysis tools (Antconc and Sketch Engine), special attention is given to the historical/political consequences of vagueness used in that framework, and to the study of vague ‘weasel words’ (Mellinkoff 1963), modals, and adjectives contained in the corpus. The hypothesis of intentional vagueness is further reinforced through an analysis of the American legislation related to the outbreak of the war, to reveal how the U.S. has interpreted UN legislation and to understand the purposes and consequences of vague language contained in it. A second section of the study was originated by the desire to understand whether the same patterns would be used in resolutions relating to the Iranian 2010 nuclear crises revealing a relationship between the choice of vague linguistic features and intent to use intentional vagueness as a political strategy. The findings indicate that: - Vagueness in resolutions has triggered the Iraqi conflict instead of diplomatic solutions. - Similar patterns can also be found in resolutions relating to the Iranian 2010 nuclear crises: although being less vague than the resolutions relating to Iraq in order to avoid the same historical consequences, the legislation related to the Iranian nuclear controversy still suggests the UN intentional use of some vague linguistic patterns as a political strategy