    When designing DSP circuits, it is important to predict their power consumption early in the design flow in order to reduce the repetition of time consuming design phases. High-level modelling is required for fast power estimation when a design is modified at the algorithm level. This paper presents a novel high-level analytical approach to estimate logic power consumption of arithmetic components implemented in FPGAs. In particular, models of adders and multipliers are presented in detail. The proposed methodology considers input signal correlation and glitching produced inside the component. It is based on an analytical computation of the switching activity in the component which takes into account the component architecture. The complete model can estimate the power consumption for any given clock frequency, signal statistics and operands’ word-lengths. Compared to other proposed power estimation methods, the number of circuit simulations needed for characterizing the power model of the component is highly reduced. The accuracy of the model is within 10% of low-level power estimates given by the tool XPower, and it achieves better overall performance

    Accuracy-Guaranteed Fixed-Point Optimization in Hardware Synthesis and Processor Customization

    RÉSUMÉ De nos jours, le calcul avec des nombres fractionnaires est essentiel dans une vaste gamme d’applications de traitement de signal et d’image. Pour le calcul numĂ©rique, un nombre fractionnaire peut ĂȘtre reprĂ©sentĂ© Ă  l’aide de l’arithmĂ©tique en virgule fixe ou en virgule flottante. L’arithmĂ©tique en virgule fixe est largement considĂ©rĂ©e prĂ©fĂ©rable Ă  celle en virgule flottante pour les architectures matĂ©rielles dĂ©diĂ©es en raison de sa plus faible complexitĂ© d’implĂ©mentation. Dans la mise en Ɠuvre du matĂ©riel, la largeur de mot attribuĂ©e Ă  diffĂ©rents signaux a un impact significatif sur des mĂ©triques telles que les ressources (transistors), la vitesse et la consommation d'Ă©nergie. L'optimisation de longueur de mot (WLO) en virgule fixe est un domaine de recherche bien connu qui vise Ă  optimiser les chemins de donnĂ©es par l'ajustement des longueurs de mots attribuĂ©es aux signaux. Un nombre en virgule fixe est composĂ© d’une partie entiĂšre et d’une partie fractionnaire. Il y a une limite infĂ©rieure au nombre de bits allouĂ©s Ă  la partie entiĂšre, de façon Ă  prĂ©venir les dĂ©bordements pour chaque signal. Cette limite dĂ©pend de la gamme de valeurs que peut prendre le signal. Le nombre de bits de la partie fractionnaire, quant Ă  lui, dĂ©termine la taille de l'erreur de prĂ©cision finie qui est introduite dans les calculs. Il existe un compromis entre la prĂ©cision et l'efficacitĂ© du matĂ©riel dans la sĂ©lection du nombre de bits de la partie fractionnaire. Le processus d'attribution du nombre de bits de la partie fractionnaire comporte deux procĂ©dures importantes: la modĂ©lisation de l'erreur de quantification et la sĂ©lection de la taille de la partie fractionnaire. Les travaux existants sur la WLO ont portĂ© sur des circuits spĂ©cialisĂ©s comme plate-forme cible. Dans cette thĂšse, nous introduisons de nouvelles mĂ©thodologies, techniques et algorithmes pour amĂ©liorer l’implĂ©mentation de calculs en virgule fixe dans des circuits et processeurs spĂ©cialisĂ©s. La thĂšse propose une approche amĂ©liorĂ©e de modĂ©lisation d’erreur, basĂ©e sur l'arithmĂ©tique affine, qui aborde certains problĂšmes des mĂ©thodes existantes et amĂ©liore leur prĂ©cision. La thĂšse introduit Ă©galement une technique d'accĂ©lĂ©ration et deux algorithmes semi-analytiques pour la sĂ©lection de la largeur de la partie fractionnaire pour la conception de circuits spĂ©cialisĂ©s. Alors que le premier algorithme suit une stratĂ©gie de recherche progressive, le second utilise une mĂ©thode de recherche en forme d'arbre pour l'optimisation de la largeur fractionnaire. Les algorithmes offrent deux options de compromis entre la complexitĂ© de calcul et le coĂ»t rĂ©sultant. Le premier algorithme a une complexitĂ© polynomiale et obtient des rĂ©sultats comparables avec des approches heuristiques existantes. Le second algorithme a une complexitĂ© exponentielle, mais il donne des rĂ©sultats quasi-optimaux par rapport Ă  une recherche exhaustive. Cette thĂšse propose Ă©galement une mĂ©thode pour combiner l'optimisation de la longueur des mots dans un contexte de conception de processeurs configurables. La largeur et la profondeur des blocs de registres et l'architecture des unitĂ©s fonctionnelles sont les principaux objectifs ciblĂ©s par cette optimisation. Un nouvel algorithme d'optimisation a Ă©tĂ© dĂ©veloppĂ© pour trouver la meilleure combinaison de longueurs de mots et d'autres paramĂštres configurables dans la mĂ©thode proposĂ©e. Les exigences de prĂ©cision, dĂ©finies comme l'erreur pire cas, doivent ĂȘtre respectĂ©es par toute solution. Pour faciliter l'Ă©valuation et la mise en Ɠuvre des solutions retenues, un nouvel environnement de conception de processeur a Ă©galement Ă©tĂ© dĂ©veloppĂ©. Cet environnement, qui est appelĂ© PolyCuSP, supporte une large gamme de paramĂštres, y compris ceux qui sont nĂ©cessaires pour Ă©valuer les solutions proposĂ©es par l'algorithme d'optimisation. L’environnement PolyCuSP soutient l’exploration rapide de l'espace de solution et la capacitĂ© de modĂ©liser diffĂ©rents jeux d'instructions pour permettre des comparaisons efficaces.----------ABSTRACT Fixed-point arithmetic is broadly preferred to floating-point in hardware development due to the reduced hardware complexity of fixed-point circuits. In hardware implementation, the bitwidth allocated to the data elements has significant impact on efficiency metrics for the circuits including area usage, speed and power consumption. Fixed-point word-length optimization (WLO) is a well-known research area. It aims to optimize fixed-point computational circuits through the adjustment of the allocated bitwidths of their internal and output signals. A fixed-point number is composed of an integer part and a fractional part. There is a minimum number of bits for the integer part that guarantees overflow and underflow avoidance in each signal. This value depends on the range of values that the signal may take. The fractional word-length determines the amount of finite-precision error that is introduced in the computations. There is a trade-off between accuracy and hardware cost in fractional word-length selection. The process of allocating the fractional word-length requires two important procedures: finite-precision error modeling and fractional word-length selection. Existing works on WLO have focused on hardwired circuits as the target implementation platform. In this thesis, we introduce new methodologies, techniques and algorithms to improve the hardware realization of fixed-point computations in hardwired circuits and customizable processors. The thesis proposes an enhanced error modeling approach based on affine arithmetic that addresses some shortcomings of the existing methods and improves their accuracy. The thesis also introduces an acceleration technique and two semi-analytical fractional bitwidth selection algorithms for WLO in hardwired circuit design. While the first algorithm follows a progressive search strategy, the second one uses a tree-shaped search method for fractional width optimization. The algorithms offer two different time-complexity/cost efficiency trade-off options. The first algorithm has polynomial complexity and achieves comparable results with existing heuristic approaches. The second algorithm has exponential complexity but achieves near-optimal results compared to an exhaustive search. The thesis further proposes a method to combine word-length optimization with application-specific processor customization. The supported datatype word-length, the size of register-files and the architecture of the functional units are the main target objectives to be optimized. A new optimization algorithm is developed to find the best combination of word-length and other customizable parameters in the proposed method. Accuracy requirements, defined as the worst-case error bound, are the key consideration that must be met by any solution. To facilitate evaluation and implementation of the selected solutions, a new processor design environment was developed. This environment, which is called PolyCuSP, supports necessary customization flexibility to realize and evaluate the solutions given by the optimization algorithm. PolyCuSP supports rapid design space exploration and capability to model different instruction-set architectures to enable effective compari