Causal Adversarial Perturbations for Individual Fairness and Robustness
  in Heterogeneous Data Spaces

Ehyaei, Ahmad-Reza; Farnadi, Golnoosh; Karimi, Amir-Hossein; Mohammadi, Kiarash; Samadi, Samira

Causal Adversarial Perturbations for Individual Fairness and Robustness in Heterogeneous Data Spaces

Authors: Ahmad-Reza Ehyaei
Golnoosh Farnadi
Amir-Hossein Karimi
Kiarash Mohammadi
Samira Samadi
Publication date: 17 August 2023
Publisher

Abstract

As responsible AI gains importance in machine learning algorithms, properties such as fairness, adversarial robustness, and causality have received considerable attention in recent years. However, despite their individual significance, there remains a critical gap in simultaneously exploring and integrating these properties. In this paper, we propose a novel approach that examines the relationship between individual fairness, adversarial robustness, and structural causal models in heterogeneous data spaces, particularly when dealing with discrete sensitive attributes. We use causal structural models and sensitive attributes to create a fair metric and apply it to measure semantic similarity among individuals. By introducing a novel causal adversarial perturbation and applying adversarial training, we create a new regularizer that combines individual fairness, causality, and robustness in the classifier. Our method is evaluated on both real-world and synthetic datasets, demonstrating its effectiveness in achieving an accurate classifier that simultaneously exhibits fairness, adversarial robustness, and causal awareness

Similar works

Full text

Available Versions

arXiv.org e-Print Archive

oai:arXiv.org:2308.08938

Last time updated on 24/08/2023