3 research outputs found

    Двофазовий меметичний алгоритм забезпечення групової анонімності даних

    No full text
    У статті розглянуто задачу забезпечення групової анонімності, запропоновано модифікацію меметичного алгоритму її розв’язання, яка передбачає його виконання у дві фази, що дозволяє поліпшити якість розв’язків. Застосування алгоритму продемонстровано за допомогою прикладу на основі реальних даних.In the article, a task of providing group anonymity is discussed. A modification of the memetic algorithm for solving it is presented. The modification implies carrying the algorithm out in two phases, which enables us to obtain higher quality solutions. Application of the algorithm is illustrated with a real data based example.В статье рассматривается задача обеспечения групповой анонимности, предлагается модификация меметического алгоритма ее решения, предусматривающая его исполнение в две фазы, что позволяет улучшить качество решений. Применение алгоритма демонстрируется с помощью примера на основе реальных данных

    Забезпечення групової анонімності як складова CSID-процесу обробки даних

    No full text
    У статті задачу забезпечення групової анонімності розглянуто в контексті CSID-процесу обробки даних, виконано порівняльний аналіз описаних у літературі методів її забезпечення. На основі аналізу сформульовано умови, за яких доцільніше використовувати відповідні методи.In the article, the task of providing group anonymity is discussed in the context of the CSID data process. A comparative study of appropriate methods given in the literature is performed. Based on this study, conditions are formulated for choosing methods that fit each particular case

    Моделі, методи та інформаційна технологія забезпечення групової анонімності даних

    Get PDF
    Дисертацію присвячено розв’язанню науково-прикладної задачі створення інформаційної технології забезпечення анонімності даних про групи, щодо яких є загроза її порушення у випадку вилучення з мікрофайлу сутнісних атрибутів. Запропоновано нечіткі моделі груп, розроблено методи їх побудови. Розроблено метод на основі міметичних обислень розв’язання задачі пошуку в мережі максимального потоку мінімальної вартості, що враховує нечіткі обмеження на її архітектуру. Удосконалено інформаційну технологію, що реалізує ці моделі та методи. Основні результати роботи використано в Держстаті України під час підготовки 10% мікроданих Всеукраїнського перепису населення 2001 р. і створення системи підготовки мікрофайлів за підтримки Фонду ООН з питань народонаселення.The thesis is devoted to solving a topical scientific and applied task of creating an information technology for providing data anonymity for groups when there is a threat of its violation in case of removing vital attributes from the microfile. For the first time fuzzy models of groups are proposed. These models help determine the degree of membership of microfile respondents in given groups by analyzing combinations of basic microfile attributes’ values. Fuzzy nature of the models enables us to handle uncertainty pertaining to the natural inaccuracy of statistical data. Adequacy criteria for such models are selected. A method for building a fuzzy model of a group when there is access to third-party data is developed. This method is an enhanced method for subgroup discovery, which differs from existing ones in the new quality measure of fuzzy rules for describing subgroups. The new measure takes into account disproportional relative dominance of subgroup elements over elements outside it in certain areas of the feature space. A method for building a fuzzy model of a group when there is no access to third-party data is developed. The method is based on utilizing expert knowledge and suggests its application to building a fuzzy rule base for a fuzzy inference system to determine degree of membership of a respondent in the group. The task of providing group anonymity is formalized as a minimum cost flow problem for a network, on whose architecture are imposed fuzzy restrictions. Criteria for evaluating solution quality are formalized, which enables us to evaluate solution quality without resorting to expert knowledge. For the first time, a memetic computing based method is proposed for solving this task. The developed method enables us to solve the task in one stage, which differs from the existing two-stage method in that it implies simultaneous masking of sensitive feature of data about a group and modifying the microfile in a way that ensures preserving sufficient level of data utility in terms of the introduced distortion. Applying this approach enables us to obtain task solutions of greater quality, due to the increased number of sufficient solutions. Information technology for providing data anonymity for groups when there is a threat of its violation by analyzing basic microfile attributes is enhanced. Functional requirements for the technology are proposed. A three-tier client-server architecture is selected for developing the technology. Information technology structure is described at hardware and software levels. The conceptual data model is described. It is verified that the technology satisfies all the requirements, i.e., it requires data to be stored in a database, takes into account basic microfile attributes, enables simultaneous modification of the model of a group and the microfile, automates the process of evaluating solution quality by automatic selection of solutions, is portable, exhibits high reliability and security, utilizes only open source software. Experiments conducted to test the technology by solving real data based tasks of providing group anonymity shows that the distortion introduced does not exceed 0.05% of microfile attribute values (on average), and time needed for modifying the microfile is reduced by the factor of 2.4 (on average). Main theoretical and practical results presented in the thesis were used in the State Statistics Service of Ukraine during preparation of 10% microdata of the 2001 All-Ukrainian census and development of a software system for microfile preparation within the UKR2U706 project supported by the UN Population Fund called “Increasing availability of disaggregated population data for national and sectoral development policymaking, programming and public use.” Theoretical results were deployed in the educational process at the Applied Mathematics Department of the National Technical University of Ukraine “Kyiv Polytechnic Institute” when preparing lectures and laboratory works for the “Soft Computing” course (for Specialists and Masters majoring in 7(8).04030101 “Applied Mathematics”).Диссертация посвящена решению актуальной научно-прикладной задачи разработки информационной технологии обеспечения анонимности данных о группах, относительно которых существует угроза ее нарушения в случае удаления из микрофайла сущностных атрибутов. Предложены нечеткие модели групп, разработаны методы их построения. Разработан метод на основе меметических вычислений для решения задачи поиска в сети максимального потока минимальной стоимости, учитывающий нечеткие ограничения на ее архитектуру. Усовершенствована информационная технология, реализующая эти модели и методы. Основные результаты работы использованы в Госстате Украины при подготовке 10% микроданных Всеукраинской переписи населения 2001 г. и при создании системы подготовки микрофайлов при поддержке Фонда ООН в области народонаселения