8 research outputs found

    Adaptive Disorder Control in Data Stream Processing

    Get PDF
    Out-of-order tuples in continuous data streams may cause inaccurate query results since conventional window operators generally discard those tuples. Existing approaches use a buffer to fix disorder in stream tuples and estimate its size based on the maximum network delay seen in the streams. However, they do not provide a method to control the amount of tuples that are not saved and discarded from the buffer, although users may want to keep it within a predefined error bound according to application requirements. In this paper, we propose a method to estimate the buffer size while keeping the percentage of tuple drops within a user-specified bound. The proposed method utilizes tuples' interarrival times and their network delays for estimation, whose parameters reflect real-time stream characteristics properly. Based on two parameters, our method controls the amount of tuple drops adaptively in accordance with fluctuated stream characteristics and keeps their percentage within a given bound, which we observed through our experiments

    Integrando enfoques de medición y evaluación con minería de datos y procesamiento de flujos

    Get PDF
    Este línea de trabajo aborda la problemática de los modelos de clasificación aplicados a flujos continuos de datos, variantes en el tiempo y semi-estructurados (según se define en [1]), usando el marco conceptual de medición y evaluación C-INCAMI (Context - Information Need, Concept model, Attribute, Metric and Indicator [2,3]). Esta investigación integra ambos enfoques, con el fin de generar y soportar un modelo de decisión adaptable al vuelo, que a su vez contribuya al proceso de toma de decisiones en diferentes contextos.Eje: Ingeniería de Software y Bases de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Integrando enfoques de medición y evaluación con minería de datos y procesamiento de flujos

    Get PDF
    Este línea de trabajo aborda la problemática de los modelos de clasificación aplicados a flujos continuos de datos, variantes en el tiempo y semi-estructurados (según se define en [1]), usando el marco conceptual de medición y evaluación C-INCAMI (Context - Information Need, Concept model, Attribute, Metric and Indicator [2,3]). Esta investigación integra ambos enfoques, con el fin de generar y soportar un modelo de decisión adaptable al vuelo, que a su vez contribuya al proceso de toma de decisiones en diferentes contextos.Eje: Ingeniería de Software y Bases de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Memory-Efficient Query Processing over XML Fragment Stream with Fragment Labeling

    Get PDF
    The portable/hand-held devices deployed in mobile computing environment are mostly limited in memory. To make it possible for them to locally process queries over a large volume of XML data, the data needs to be streamed in fragments of manageable size and the queries need to be processed over the stream with as little memory as possible. In this paper, we report a considerable improvement of the state-of-the-art techniques of query processing over XML fragment stream in memory efficiency. We use XML fragment labeling (XFL) as a method of representing XML fragmentation, and show that XFL is much more effective than the popular hole-filler (HF) model employed in the state-of-the-art in reducing the amount of memory required for query processing. The state-of-the-art with the HF model requires more memory as the stream size increases. With XFL, we overcome this fundamental limitation, proposing the techniques to make query processing scalable in the sense that memory requirement is not affected by the size of the stream as long as the stream is bounded. The improvement is verified through implementation and a detailed set of experiments

    A Method of XML Document Fragmentation for Reducing Time of XML Fragment Stream Query Processing

    Get PDF
    As XML has been established as the standard for data exchange not just on the Web but among heterogeneous devices, systems, and applications, effective processing of XML queries is one of core components of ubiquitous computing. Most of the mobile/hand-held devices deployed in ubiquitous computing environment are still limited in memory and processing power. An effective query processing is required when the source XML document is of large volume. The framework of fragmenting an XML document and streaming the XML fragments for query processing at the mobile devices has received much attention. However, the main focus was on the memory efficiency to cope with the memory constraint in the mobile devices. Query processing time might be compromised in those techniques. Since the processing power is also limited in the mobile devices, the time optimization deserves attention. We have found out that the query processing time is significantly affected by how the source XML document is fragmented. In this paper, we propose a method of XML document fragmentation whereby query processing gets efficient in time while the size constraint for each resulting fragment is satisfied. Through implementation and a set of detailed experiments, we show that our proposed method considerably outperforms other methods

    Hacia un modelo integrado de procesamiento de flujos de datos

    Get PDF
    El presente paper presenta un modelo integrado de procesamiento de flujos de datos con el fin de mejorar la toma de decisiones basada en contextos mediante la incorporación de metadatos basados en una ontología de medición. En particular se discute la recolección-adaptación de datos dentro del modelo integrado de procesamiento, y se aborda la problemática de la definición de un esquema para el intercambio continuo de mediciones basadas en un marco conceptual de medición y evaluación, como así también el protocolo asociado a la transmisión de las mismas. Dicho esquema y protocolo, permiten el intercambio de metadatos vinculados a mediciones y sus contextos asociados, con el objeto de permitir un análisis consistente de los mismos que contribuya a una mejora en la toma de decisión susceptible al contexto.Workshop de Ingeniería de Software y Bases de Datos (WISBD)Red de Universidades con Carreras en Informática (RedUNCI

    Hacia un modelo integrado de procesamiento de flujos de datos

    Get PDF
    El presente paper presenta un modelo integrado de procesamiento de flujos de datos con el fin de mejorar la toma de decisiones basada en contextos mediante la incorporación de metadatos basados en una ontología de medición. En particular se discute la recolección-adaptación de datos dentro del modelo integrado de procesamiento, y se aborda la problemática de la definición de un esquema para el intercambio continuo de mediciones basadas en un marco conceptual de medición y evaluación, como así también el protocolo asociado a la transmisión de las mismas. Dicho esquema y protocolo, permiten el intercambio de metadatos vinculados a mediciones y sus contextos asociados, con el objeto de permitir un análisis consistente de los mismos que contribuya a una mejora en la toma de decisión susceptible al contexto.Workshop de Ingeniería de Software y Bases de Datos (WISBD)Red de Universidades con Carreras en Informática (RedUNCI

    Content based dissemination of XML data

    Get PDF