9 research outputs found

    Occupational Fraud Detection Through Visualization

    Full text link
    Occupational fraud affects many companies worldwide causing them economic loss and liability issues towards their customers and other involved entities. Detecting internal fraud in a company requires significant effort and, unfortunately cannot be entirely prevented. The internal auditors have to process a huge amount of data produced by diverse systems, which are in most cases in textual form, with little automated support. In this paper, we exploit the advantages of information visualization and present a system that aims to detect occupational fraud in systems which involve a pair of entities (e.g., an employee and a client) and periodic activity. The main visualization is based on a spiral system on which the events are drawn appropriately according to their time-stamp. Suspicious events are considered those which appear along the same radius or on close radii of the spiral. Before producing the visualization, the system ranks both involved entities according to the specifications of the internal auditor and generates a video file of the activity such that events with strong evidence of fraud appear first in the video. The system is also equipped with several different visualizations and mechanisms in order to meet the requirements of an internal fraud detection system

    A New Prototype for Intelligent Visual Fraud Detection in Agent-Based Auditing Framework

    Get PDF
    While US. Sarbanes Oxley act has been viewed by most as an onerous and expensive requirement; it is having a positive impact on driving appropriate levels of investment in IT security, controls, and transactional systems. This paper introduces a new secure solution for auditing and accounting based on artificial intelligence technology. These days, security is a big issue among regulatory firms. Big companies are concerned about their data to be disseminated to their competitors; this high risk prevents them to provide full information to the regulatory firms. This solution not only significantly reduces the risk of unauthorized access to the company’s information but also facilitate a framework for controlling the flow of disseminating information in a risk free method. Managing security is performed by a network of mobile agents in a pyramid structure among regulatory organization like securities and exchanges commissions, stock exchanges in top of this pyramid to the companies in the button. Because of security considerations, our strategy is to delegate all fraud detection algorithms to Intelligent Mobile Auditing Agent and web service undertake all inter communicational activity. Web services can follow auditing actives in predefined framework and they can act based on permitted security allowance to auditors. The current solution is designed based on Java-based mobile agents. Such design reaps strong mobility and security benefits. This new prototyped solution could be a framework for strengthening security for future development in this area. An insider trading case study is used to demonstrate and evaluate the approach

    Sabrina: Modeling and Visualization of Economy Data with Incremental Domain Knowledge

    Full text link
    Investment planning requires knowledge of the financial landscape on a large scale, both in terms of geo-spatial and industry sector distribution. There is plenty of data available, but it is scattered across heterogeneous sources (newspapers, open data, etc.), which makes it difficult for financial analysts to understand the big picture. In this paper, we present Sabrina, a financial data analysis and visualization approach that incorporates a pipeline for the generation of firm-to-firm financial transaction networks. The pipeline is capable of fusing the ground truth on individual firms in a region with (incremental) domain knowledge on general macroscopic aspects of the economy. Sabrina unites these heterogeneous data sources within a uniform visual interface that enables the visual analysis process. In a user study with three domain experts, we illustrate the usefulness of Sabrina, which eases their analysis process

    Combining Network Visualization and Data Mining for Tax Risk Assessment

    Get PDF
    This paper presents a novel approach, called MALDIVE, to support tax administrations in the tax risk assessment for discovering tax evasion and tax avoidance. MALDIVE relies on a network model describing several kinds of relationships among taxpayers. Our approach suitably combines various data mining and visual analytics methods to support public officers in identifying risky taxpayers. MALDIVE consists of a 4-step pipeline: ( i{i} ) A social network is built from the taxpayers data and several features of this network are extracted by computing both classical social network indexes and domain-specific indexes; ( ii ) an initial set of risky taxpayers is identified by applying machine learning algorithms; ( iii ) the set of risky taxpayers is possibly enlarged by means of an information diffusion strategy and the output is shown to the analyst through a network visualization system; ( iv ) a visual inspection of the network is performed by the analyst in order to validate and refine the set of risky taxpayers. We discuss the effectiveness of the MALDIVE approach through both quantitative analyses and case studies performed on real data in collaboration with the Italian Revenue Agency

    Financial Fraud Detection and Data Mining of Imbalanced Databases using State Space Machine Learning

    Get PDF
    Risky decisions made by humans exhibit characteristics common to each decision. The related systems experience repeated abuse by risky humans and their actions collude to form a systemic behavioural set. Financial fraud is an example of such risky behaviour. Fraud detection models have drawn attention since the financial crisis of 2008 because of their frequency, size and technological advances leading to financial market manipulation. Statistical methods dominate industrial fraud detection systems at banks, insurance companies and financial marketplaces. Most efforts thus far have focused on anomaly detection problems and simple rules in the academic literature and industrial setting. There are unsolved issues in modeling the behaviour of risky agents in real-world financial markets using machine learning. This research studies the challenges posed by fraud detection, including the problem of imbalanced class distributions, and investigates the use of Reinforcement Learning (RL) to model risky human behaviour. Models have been developed to transform the relevant financial data into a state-space system. Reinforcement Learning agents uncover the decision-making processes by risky humans and derive an optimal path of behaviour at the end of the learning process. States are weighted by risk and then classified as positive (risky) or negative (not-risky). The positive samples are composed of features that represent the hidden information underlying the risky behaviour. Reinforcement Learning is implemented as unsupervised and supervised models. The unsupervised learning agent searches for risky behaviour without any previous knowledge of the data; it is not “trained” on data with true class labels. Instead, the RL learner relates samples through experience. The supervised learner is trained on a proportion (e.g. 90%) of the data with class labels. It derives a policy of optimal actions to be taken at each state during the training stage. One policy is selected from several learning agents and then the model is exposed to the other proportion (e.g. 10%) of data for classification. RL is hybridized with a Hidden Markov Model (HMM) in the supervised learning model to impose a probabilistic framework around the risky agent’s behaviour. We first study an insider trading example to demonstrate how learning algorithms can mimic risky agents. The classification power of the model is further demonstrated by applying it to a real-world based database for debit card transaction fraud. We then apply the models to two problems found in Statistics Canada databases: heart disease detection and female labour force participation. All models are evaluated using appropriate measures for imbalanced class problems: “sensitivity” and “false positive”. Sensitivity measures the number of correctly classified positive samples (e.g. fraud) as a proportion of all positive samples in the data. False positive counts the number of negative samples classified positive as a proportion of all negative samples in the data. The intent is to maximize sensitivity and minimize the false positive rate. All models show high sensitivity rates while exhibiting low false positive rates. These two metrics are ideal for industrial implementation because of high levels of identification at a low cost. Fraud detection rate is the focus with detection rates of 75-85% proving that RL is a superior method for data mining of imbalanced databases. By solving the problem of hidden information, this research can facilitate the detection of risky human behaviour and prevent it from happening

    Visualisation de l'information appliquée à l'analyse et à l'attribution de performances financières

    Get PDF
    Croesus Finansoft développe depuis 28 ans un logiciel intégré de gestion de portefeuille pour les firmes de courtages et les conseillers indépendants. Leur application est présentement utilisée par la plupart des grandes firmes au pays, incluant les financières CIBC, Banque Nationale, Valeurs Mobilières Desjardins et TD. L’application développée par l’entreprise doit donc gérer des tables de données contenant souvent plus d’un milliard de transactions. Pour l’entreprise, le défi est de taille. L’application doit offrir une vue cohérente des portefeuilles des investisseurs, en plus de guider les gestionnaires quant aux nouvelles possibilités d’investissement, au suivi des objectifs de placement, des calculs de rendement, de performance, etc. Malgré les différentes avancées technologiques, certaines de ces tâches sont encore très difficiles à effectuer, principalement à cause de la quantité de données impliquées. L’analyse des performances des portefeuilles d’investissements est particulièrement problématique dans ces circonstances. L’analyse de performances ne se limite pas simplement à comparer des rendements obtenus à différents moments dans le temps. Il s’agit d’un processus complexe qui demande la corrélation d’une multitude d’informations afin d’obtenir une vue complète de la situation. Les performances des investissements sont toujours évaluées par rapport à une référence, par exemple un indice de marché. L’attribution de performances tente d’expliquer d’où proviennent les écarts de rendement par rapport à cette référence. Est-ce explicable par le fait que les investisseurs ont choisi des titres ayant offert des rendements supérieurs à ceux de l’indice ? Ou encore parce qu’ils ont investi davantage dans les obligations à long terme, limitant ainsi leur exposition au risque ? L’outil développé par Croesus permet facilement de mesurer les performances d’un seul portefeuille ou d’un petit groupe de portefeuilles. Effectuer cette analyse pour tous les clients d’une succursale simultanément devient beaucoup plus complexe. Croesus ne supporte pas non plus l’attribution de performances. Pour les gestionnaires de l’entreprise, offrir ces fonctionnalités s’avère un enjeu de taille, surtout à cause de la quantité de données impliquées. Comment présenter ces informations à l’expert sans créer une surcharge d’information ? Comment permettre d’identifier facilement les problèmes dans les données, les tendances générales, les écarts par rapport aux références, de façon à ce que des actions concrètes puissent être mises en place afin de corriger la situation ? La visualisation permet de tirer profit de la capacité humaine à interpréter des images beaucoup plus rapidement et efficacement que des données numériques ou textuelles. Elle vise à augmenter les capacités de traitement de l’humain, de façon à ce qu’il soit conservé dans le processus d’analyse, contrairement aux processus de décisions automatisés. Bien que la visualisation soit un domaine actif de recherche depuis de nombreuses années, très peu de solutions adaptées à la réalité de la finance, et encore moins à l’analyse des performances, ont été présentées jusqu’à présent. Cette thèse explore différentes techniques de visualisation permettant de simplifier le processus d’analyse de performances financières dans le contexte de gestion de portefeuilles de l’application développée par Croesus. Elle présente les résultats de trois projets distincts réalisés au cours des dernières années, tous liés à l’analyse des performances financières. Le premier projet présente une technique d’interaction novatrice permettant de simplifier l’analyse des performances sur un graphique linéaire simple (line graph). Que ce soit pour comparer les rendements de plusieurs centaines de portefeuilles simultanément ou pour plusieurs centaines de titres d’un secteur d’activité, les graphiques linéaires sont rapidement surchargés d’information, rendant l’analyse plutôt complexe. L’outil proposé, VectorLens, permet d’explorer les données en offrant des techniques de sélection avancées. La principale contribution concerne la sélection angulaire. Dans la mesure où le graphique présente des rendements, la pente des droites encode l’essentiel de l’information. VectorLens tire profit de cette caractéristique et permet, en un seul mouvement, de sélectionner rapidement et efficacement les éléments en fonction de leur pente, moyennant une marge établie de façon dynamique. L’outil intègre également d’autres outils de sélection, incluant la sélection par zone (pinceau), la sélection par catégories, etc. Il est également possible de combiner plusieurs lentilles VectorLens pour effectuer des requêtes plus complexes. La technique a été comparée aux principales techniques de sélection de courbes dans le cadre d’une expérience contrôlée en laboratoire. Les résultats ont démontré que VectorLens offrait des performances supérieures ou égales dans la plupart des cas, en plus d’être préférée par la plupart des utilisateurs. Le deuxième projet propose une nouvelle technique de visualisation permettant de séparer efficacement les couches d’informations sur un graphique linéaire simple. Cette technique s’avère intéressante pour comparer les rendements de titres de différents secteurs, ou même les rendements de portefeuilles de différents clients, gestionnaires ou même succursales, par exemple. Plutôt que d’utiliser uniquement la couleur pour séparer les différents groupes d’éléments, cette technique consiste à exploiter l’espace inutilisé entre deux valeurs sur l’abscisse en compressant les courbes des différentes couches, de façon à éviter l’occlusion causée par le chevauchement des courbes. Plusieurs variantes tirant profit de ce concept ont été proposées et comparées à l’état de l’art dans le cadre d’une évaluation en laboratoire. Les résultats ont démontré que les techniques de compression, et plus particulièrement la technique superposée, permettaient d’effectuer les tâches de façon plus précise et avec un taux de succès globalement supérieur par rapport à l’état de l’art. Enfin, le troisième projet tente d’adresser le problème d’attribution de performances à grande échelle. Deux nouvelles techniques de visualisation, basées sur un graphique ternaire (ternary plot), ont été proposées afin de représenter sur un seul graphique la relation entre le rendement différentiel avec la référence et les effets expliquant cette différence. Un système complet, sous la forme d’un tableau de bord intégrant les visualisations proposées, a été développé et évalué avec quatre experts du domaine dans un contexte réel d’analyse. Les résultats ont démontré que les outils proposés permettent d’analyser un grand ensemble de portefeuilles, à différents niveaux, de façon simple et efficace. Les outils proposés révèlent clairement les écarts de performance, permettent d’identifier facilement la source du problème, et même la stratégie globale utilisée par les gestionnaires de comptes auprès de leurs clients et les comptes qui dévient de ces stratégies
    corecore