
















The  abstracts   in   this  book  were  not   reviewed  as  we  did  not  want   to   exclude  anybody   from 
participating in the poster session, and from making new contacts. The sole purpose of the book 
is to prepare your visit to the poster session. You can in advance select the posters you want to 
discuss and then visit them (the order of posters on the posters panels is the same as in the 
book). If you present a poster yourself, make sure that you spend about 50% of your time at your 
poster, and the other 50% visiting other posters.
I wish you a very productive poster session
Koen De Bosschere
Summer School Organizer

CONTENTS
A Highly Efficient, Thread­Safe Software Cache Implementation for Tightly­Coupled Multicore 
Clusters 1
Christian Pinto and Luca Benini
Memory affinity in multi­threading: the Bowtie2 case study 5
Claudia Misale, Marco Aldinucci and Massimo Torquati
Assessing the effect on inter­task interferences in real multicores 9
Gabriel Fernandez, Mikel Fernandez, Jaume Abella, Eduardo Quinones, Luca 
Fossati,Marco Zulianello and Francisco J.Cazorla
Design of a legacy­free operating system for multicore platforms 13
Laust Brock­Nannestad and Sven Karlsson
Optimizing the Overhead for Network­on­Chip Routing Reconfiguration in
Parallel Multi­Core Platforms 17
Marco Balboni, Francisco Triviño, José Flich and Davide Bertozzi
Performance and Power Efficiency Optimization and Evaluation of a Data
Cleansing Algorithm on Multicore Processors 21
Abdullah Al Hasib and Lasse Natvig
Integration of HW IPs into tightly coupled multicore clusters: a synthesis­friendly approach 25
Francesco Conti, Andrea Marongiu and Luca Benini
Architecture for Transparent Binary Acceleration with External Memory Accesses 29
Nuno Miguel Cardanha Paulino, João Canas Ferreira and João Manuel Paiva 
Cardoso
A Communication­efficient Mapping of AUTOSAR Runnables on Multicores 33
H. R. Faragardi, T. Nolte and B. Lisper
An overview of queuing schemes for HPC­systems interconnection networks with direct and 
hybrid topologies 37
Pedro Yebenes, Jesus Escudero­Sahuquillo, Crispin Gomez, Pedro J. Garcia 
and Francisco Quiles
Methodological Study of Shared Cache Optimizations 41
K. Kavi, M. Islam and M. Scrbak
Memory Array Protection:Check on Reads or Check on Writes? 45
Panagiota Nikolaou, Yiannakis Sazeides, Lorena Ndreou, Emre Ozer and 
Sachin Idgunji
Energy Efficient Memory Systems 49
Nico Reissmann and Magnus Jahre
Automatic Estimation of DVFS Potential 53
Nicolas Triquenaux
Performance Analysis of Caches in Faulty Real­Time Systems 57
Mladen Slijepcevic, Leonidas Kosmidis, Jaume Abella, Eduardo Quinones and 
Francisco J. Cazorla
Dynamic Command Scheduling for Real­Time Memory Controller 61
Yonghui Li, Benny Akesson and Kees Goossens
Hard Real­Time Task Migration on Embedded Heterogeneous Many­Core Processors 63
Peter Munk and Hans­Ulrich Heiß
Dynamic Application Adaptation for Heterogeneous Platforms 67
Christos Margiolas and Michael F. P. O'Boyle
Heterogeneous Programming Library: A Framework for Quick Development of Heterogeneous 
Applications 69
Moisés Viñas, Zeki Bozkus and Basilio B. Fraguela
Enabling the OpenMP programming model on embedded heterogeneous manycore SoC 73
Alessandro Capotondi, Andrea Marongiu and Luca Benini
OpenMP extensions to exploit HW acceleration on shared­memory many­core clusters 77
Paolo Burgio, Andrea Marongiu and Luca Benini
Coordination Programming Approach for Linear Algebra Applications 81
Pavels Zaicenkovs
Data abstractions for portable parallel codes 85
Javier Fresno, Arturo Gonzalez­Escribano and Diego R. Llanos
Adaptive Cooperative Caching for Many­cores systems 89
Safae Dahmani, Loïc Cudennec and Guy Gogniat
SHiC approach for Agile Application Placement in Many­Core Systems 93
Mohamamd Fattah, Masoud Daneshtalab, Pasi Liljeberg and Juha Plosila
A Scalable Distributed Data­flow Scheduler for Many­Cores 97
Andrea Mondelli
Hybrid multi­core data flow architecture 101
Charles Shelor
Combining a Dataflow Substrate with Multi­level Checkpointing 105
Omer Subasi, Javier Arias, Osman Unsal, Jesus Labarta and Adrian Cristal
Profiling of Dataflow­Based Coarse­Grained Reconfigurable Platforms 109
Carlo Sau, Francesca Palumbo and Luigi Raffo
Efficient Fault Emulation using Dynamic FPGA Reconfiguration 113
Alexandra Kourfali, Karel Bruneel and Dirk Stroobandt
Fault recovery for an FPGA mapped artificial pancreas using partial reconfiguration 115
Michail Vavouras and Christos­Savvas Bouganis
Markov Chain Monte Carlo: An FPGA implementation perspective 119
Grigorios Mingas and Christos­Savvas Bouganis
Maximizing GEMM Performances via Offline Heuristic Generation and 
Run­time Specialization 123
Victor Lomuller and Henri­Pierre Charles
DART: A GPU architecture exploiting temporal SIMD for divergent workloads 127
Jan Lucas, Sohan Lal, Mauricio Alvarez­Mesa, Ahmed Elhossini and Ben 
Juurlink
Exploring GPGPUs Workload Characteristics and Power Consumption 131
Sohan Lal, Jan Lucas, Mauricio Alvarez Mesa , Ahmed Elhossini and Ben 
Juurlink
Integrated code generation for clustered VLIW architectures 135
Nikolai Kim
Design Space Exploration and Analysis Of Compiler Transformation in VLIW Processors 139
Amir Hossein Ashouri, Gianluca Palermo, Cristina Silvano, Vittorio Zaccaria 
and Sotiris Xydis
Sniper: A Fast and Accurate Many­Core Simulator 141
Wim Heirman, Trevor Carlson, Kenzo Van Craeynest and Lieven Eeckhout
PIKE ­ Improving COTSon Interface for Easier Design Space Exploration 145
Andrea Mondelli, Kang Cai and Roberto Giorgi
Improving a Design Space Exploration Framework for Computing Systems Multi­Objective 
Optimization 149
Radu Chis and Lucian Vinta
Virtual Platforms for Fast Memory Subsystem Exploration Using gem5 and TLM2.0 153
Matthias Jung, MohammadSadegh Sadri and Norbert Wehn
Identifying Sequences of Optimizations for HW/SW Compilation 157
Ricardo Nobre and João M. P. Cardoso
pFS: A partitioned filesystem targeting Virtual Machine images 161
Anastasios Papagiannis, Yannis Sfakianakis, Stelios Mavridis, Manolis 
Marazakis and Angelos Bilas
Efficient Techniques for Detecting and Exploiting Runtime Phases 165
Andreas Sembrant
Kernel level profiling of I/O intensive applications 169
Spyridon Papageorgiou, Manolis Marazakis and Angelos Bilas
A Unified Approach to Identifying and Healing Vulnerabilities in x86 Machine Codes 173
Kirill Kononenko
Benchmarking the Hardware Error Sensitivity of Machine Instructions 177
Behrooz Sangchoolie, Fatemeh Ayatolahi, Raul Barbosa, Roger Johansson and 
Johan Karlsson
DOME: Delaying and Overcoming Microprocessor Errors 181
Negar Miralaei, Jyothish Soman, Timothy M Jones and Alan Mycroft
Fault tolerance techniques in the router's micro­architecture inside NoC 185
Alirad Malek, Ioannis Sourdis and Stavros Tzilis
Time­Based Sampled Simulation of Synchronizing Multi­Threaded Applications 189
Trevor E. Carlson, Wim Heirman and Lieven Eeckhout
Transient Error Detection 193
Konstantina Mitropoulou, Vasileios Porpodas and Marcelo Cintra
Design of Energy­Efficient Adder Units for Vector Processors 197
Ivan Ratkovic, Oscar Palomar, Milan Stanic, Osman Unsal, Adrian Cristal and 
Mateo Valero
Rapid Characterization and Vectorization Using Vector Library 201
Milan Stanic, Oscar Palomar, Ivan Ratkovic, Osman Unsal, Adrian Cristal and 
Mateo Valero
Automatic Vector Custom Instruction Set Extensions 205
Anadi Mishra and Laura Pozzi
An Automated Negotiation Model based on Different Strategies in an Adaptive 
Multi­Agent System 209
Serban Radu
Parallel implementation of N­gram algorithm for document comparison 213
Maciej Wielgosz, Sebastian Koryciak, Marcin Janiszewski, Marcin Piertron,  
Pawel Russek, Ernest Jamro, Agnieszka Dabrowsk­Boruch and Kazimierz 
Wiatr
Parallel MPI implementation of N­gram algorithm for document comparison 217
Maciej Wielgosz, Sebastian Koryciak, Marcin Janiszewski, Marcin Pietron,  
Agnieszka Dabrowska­Boruch, Pawel Russek, Ernest Jamro and Kazimierz 
Wiatr
PARTEE: PARallel Task Execution Engine 221
Nikolaos Papakonstantinou and Polyvios Pratikakis
Philosophy of Thought and Action in a programming model 225
T.A. Atabong
A Novel Framework for the Design of Low­complexity QC­LDPC Encoders 227
Georgios Tzimpragos, Christofors Kachris, Dimitrios Soudris and Ioannis 
Tomkos
ELB­trees: Efficient Lock­free B+trees 231
Lars Bonnichsen, Sven Karlsson and Christian Probst
Strengthening Consistency in the Cassandra Distributed Key­value Store 235
Panagiotis Garefalakis, Panagiotis Papadopoulos, Ioannis Manousakis and 
Kostas Magoutis
Shattering the Telecom Infrastructure 239
Mohamed El­Refaey
Revisiting Value Prediction 241
Arthur Perais
Simultaneous Optical Path Setup for Reconfigurable Photonic Networks in Tiled CMPs 245
Paolo Grani and Sandro Bartolini
A Variability­Aware Voltage Island Formation Framework for Multi/Many­Core
Architectures at Near­Threshold Computing 249
Ioannis Stamelakos
