DHTJoin: Processing Continuous Join Queries Using DHT Networks

Akbarinia, Reza; Pacitti, Esther; Palma, Wenceslao; Valduriez, Patrick

DHTJoin: Processing Continuous Join Queries Using DHT Networks

Authors: Reza Akbarinia
Esther Pacitti
Wenceslao Palma
Patrick Valduriez
Publication date: 1 January 2009
Publisher: 'Springer Science and Business Media LLC'
Doi

Abstract

International audienceContinuous query processing in data stream management systems (DSMS) has received considerable attention recently. Many applications share the same need for processing data streams in a continuous fashion. For most distributed streaming applications, the centralized processing of continuous queries over distributed data is simply not viable. This paper addresses the problem of computing approximate answers to continuous join queries over distributed data streams. We present a new method, called DHTJoin, which combines hash-based placement of tuples in a Distributed Hash Table (DHT) and dissemination of queries by exploiting the embedded trees in the underlying DHT, thereby incuring little overhead. DHTJoin also deals with join attribute value skew which may hurt load balancing and result completeness. We provide a performance evaluation of DHTJoin which shows that it can achieve significant performance gains in terms of network traffic