2 research outputs found

    Modifying Hamming Spaces for Efficient Search

    Get PDF
    We focus on the efficient search for the most similar bit strings to a given query in the Hamming space. The distance of this space can be lower-bounded by a function based on a difference of the number of ones in the compared strings, i.e. their weights. Recently, such property has been successfully used by the Hamming Weight Tree (HWT) indexing structure. We propose modifications of the bit strings that preserve pairwise Hamming distances but improve the tightness of these lower bounds, so the query evaluation with the HWT is several times faster. We also show that the unbalanced bit strings, recently reported to provide similar quality of search as the traditionally used balanced bit strings, are more easy to index with the HWT. Combined with the distance preserving modifications, the HWT query evaluation can be more than one order of magnitude faster than the HWT baseline. Finally, we show that such modifications are useful even for a very complex data where the search with the HWT is slower than a sequential search

    ANALYZA – Výpočetní a orchestrační subsystém

    No full text
    Softwarová komponenta Výpočetní a orchestrační subsystém slouží pro vlastní zpracování a analýzu vybraných dat v rámci systému ANALYZA. Komponenta zajišťuje dostupnost infrastruktury umožňující běh analytických modulů a možnosti jejich sestavování do analytických workflow (tzv. analytických operací). Mezi její hlavní úkoly pak patří správa a řízení infrastruktury, a integrované propojení jednotlivých analytických částí vyvinutého systému. Komponenta si udržuje přehled o všech běžících analytických projektech a analýzách v rámci nich realizovaných, včetně informací k nim přiřazeným, a připravuje tak prostředí pro import či výměnu dat a řídících informací mezi analytickými moduly. Kromě samotné komponenty obsahuje archiv doplňující software příkladů analytických operací a demonstrační software ilustrující jednoduchost zadávání a správy integrovaných funkcí.The Computation and Orchestration subsystem software component is used to process and analyze selected data within the ANALYZA system. The component ensures the availability of infrastructure, enabling the running of analytical modules and their connection into analytical workflow (analytical operations). Its main tasks include the administration and management of infrastructure and integrated interconnection of individual analytical parts of the developed system. The component maintains an overview of all running analytical projects and analyzes performed within them, including information assigned to them, and thus prepares the environment for import or exchange of data and control information between analytical modules. In addition to the component itself, the archive contains additional software with use-cases of analytical operations and demonstrator of insertion of integrated functions