10 research outputs found

    Анализ возможностей автоматизации выявления недобросовестных микрофинансовых организаций на основе методов машинного обучения

    Get PDF
    Microfinance is a way to fight poverty, and therefore is of high social significance. The microfinance sector in Russia is progressing. However, the engagement of microfinance organizations in illegal financial transactions associated with fraud, illegal creditors, money laundering, significantly limits their potential and has negative impact on their development. The aim of the paper is to study the possibilities to automate detection of unscrupulous microfinance organizations based on machine learning methods in order to promptly identify and suppress illegal activities by regulatory authorities. The author cites common fraudulent schemes involving microfinance organizations, including a scheme for cashing out maternity capital, a fraudulent lending scheme against real estate. The author carried out a comparative analysis of the results obtained by classification methods — the logistic regression method, decision trees (algorithms of two-class decision forest, Adaboost), support vector machine (algorithm of two-class support vector machine), neural network methods (algorithm of two-class neural network), Bayesian networks (algorithm of two-class Bayes network). The two-class support vector machine provided the most accurate results. The author analysed the data on microfinance institutions published by the Bank of Russia, the MFOs themselves, and banki.ru. The author concludes that the research results can be of further use by the Bank of Russia and Rosfinmonitoring to automate detection of unscrupulous microfinance organizations.Микрофинансирование является одним из способов борьбы с бедностью, в связи с чем имеет высокую социальную значимость. Сфера микрофинансирования в России активно развивается. Но вовлеченность ми-крофинансовых организаций (МФО) в незаконные финансовые операции, связанные с мошенничеством, деятельностью нелегальных кредиторов, легализацией доходов, полученных преступным путем, существенно ограничивают их потенциал и негативно влияют на динамику развития. Цель исследования состоит в изучении возможностей автоматизации процесса выявления недобросовестных участников рынка микрофинансирования на основе методов и алгоритмов машинного обучения для оперативного выявления и пресечения противоправной деятельности контролирующими органами. Автор приводит распространенные мошеннические схемы с участием микрофинансовых организаций, в том числе схему обналичивания материнского капитала, мошенническую схему кредитования под залог недвижимости. Проведен сравнительный анализ результатов, полученных методами классификации — методом логистической регрессии, деревьев решений (алгоритмы двухклассовый лес решений, Adaboost), методом опорных векторов (алгоритм двухклассовая машина опорных векторов), нейросетевыми методами (алгоритм двухклассовой нейронной сети), Байесовскими сетями (алгоритм двухклассовой сети Байеса). Наиболее точные результаты показала двухклассовая машина опорных векторов. Анализ проведен на основе данных о микрофинансовых организациях, публикуемых Банком России, самими МФО, порталом banki.ru. Автор делает вывод о том, что приведенные результаты исследования могут быть использованы Банком России и Росфинмониторингом для автоматизации выявления недобросовестных микрофинансовых организаций

    Research on Pre-loan Risk Management Problems of Personal Consumption Credit in Commercial Banks ---- Study of the Application of Multi-level Fuzzy Comprehensive Evaluation Model in X Bank Xiamen Branch

    Get PDF
    改革开放以来,中国经济持续飞速增长,GDP多年持续稳定保持增长率在6%以上。对GDP起到推动作用的主要来源于消费、投资及进出口,但由于投资与进出口的发展较为成熟,消费逐渐成为经济发展的重要动力。与此同时,个人消费贷款增长迅猛,已经成为银行利润突破的关键点。对个人消费贷款业务的风险管理不但有利于银行经济的发展,而且有助于银行控制信贷业务中存在的风险,制定一套有效的个人消费信贷的贷前风险管理流程,研究如何提高银行风险管理水平,具有较强的现实意义。 为了对个人消费信贷贷前风险管理进行研究,本文首先对国内外文献进行综述,并对相关概念进行梳理;其次,对X银行厦门分行个人消费信贷风险管理现状和存在的问题...Since the reform and opening up, China's economy has continued to grow at a rapid rate, and its GDP has maintained steady growth of over 6% for many years. Consumption, investment, import and export are the main drivers of GDP. However, due to the mature development of investment, import and export, consumption has gradually become an important driving force for economic development. At the same t...学位:金融硕士院系专业:经济学院_金融硕士学号:1562015115288

    Сравнительный анализ методов машинного обучения при идентификации признаков вовлеченности кредитных организаций и их клиентов в сомнительные операции

    Get PDF
    In the field of financial monitoring, it is necessary to promptly obtain objective assessments of economic entities (in particular, credit institutions) for effective decision-making. Automation of the process of identifying unscrupulous credit institutions based on machine learning methods will allow regulatory authorities to quickly identify and suppress illegal activities. The aim of the research is to substantiate the possibilities of using machine learning methods and algorithms for the automatic identification of unscrupulous credit institutions. It is required to select a mathematical toolkit for analyzing data on credit institutions, which allows tracking the involvement of a bank in money laundering processes. The paper provides a comparative analysis of the results of processing data on the activities of credit institutions using classification methods — logistic regression, decision trees. The author applies support vector machine and neural network methods, Bayesian networks (Two-Class Bayes Point Machine), and anomaly search — an algorithm of a One-Class Support Vector Machine and a PCA-Based Anomaly Detection algorithm. The study presents the results of solving the problem of classifying credit institutions in terms of possible involvement in money laundering processes, the results of analyzing data on the activities of credit institutions by methods of detecting anomalies. A comparative analysis of the results obtained using various modern algorithms for the classification and search for anomalies is carried out. The author concluded that the PCA-Based Anomaly Detection algorithm showed more accurate results compared to the One-Class Support Vector Machine algorithm. Of the considered classification algorithms, the most accurate results were shown by the Two-Class Boosted Decision Tree (AdaBoost) algorithm. The research results can be used by the Bank of Russia and Rosfinmonitoring to automate the identification of unscrupulous credit institutionsВ сфере финансового мониторинга для принятия эффективных управленческих решений необходимо оперативно получать объективные оценки хозяйствующих субъектов (в частности, кредитных организаций). Автоматизация процесса выявления недобросовестных кредитных организаций на основе методов машинного обучения позволит контролирующим органам оперативно выявлять и пресекать противоправную деятельность. Цель исследования состоит в обосновании возможностей применения методов и алгоритмов машинного обучения для автоматической идентификации недобросовестных кредитных организаций. Для этого необходимо подобрать математический инструментарий анализа данных о кредитных организациях, позволяющий проводить диагностику вовлеченности банка в процессы отмывания преступных доходов. Проведен сравнительный анализ результатов обработки данных о деятельности кредитных организаций методами классификации — логистической регрессии, деревьев решений. Использован метод опорных векторов, нейросетевые методы, Байесовские сети (двухклассовая сеть Байеса) и поиска аномалий — алгоритм одноклассовой машины опорных векторов и алгоритм обнаружения аномалий на основе метода главных компонент. Приведены результаты решения задачи классификации кредитных организаций с точки зрения возможной вовлеченности в процессы отмывания денежных средств, результаты анализа данных о деятельности кредитных организаций методами выявления аномалий. Проведен сравнительный анализ результатов, полученных при применении различных современных алгоритмов классификации и поиска аномалий. Сделан вывод о том, что алгоритм поиска аномалий на основе метода главных компонент показал более точные результаты по сравнению с алгоритмом одноклассовой машины опорных векторов. Из рассмотренных алгоритмов классификации наиболее точные результаты показал алгоритм двухклассового усиленного дерева решений (Adaboost). Приведенные результаты исследования могут быть использованы Банком России и Росфинмониторингом для автоматизации выявления недобросовестных кредитных организаций

    Credit Risk Evaluation as a Service (CREaaS) based on ANN and Machine Learning

    Get PDF
    Credit risk evaluation is the major concern of the banks and financial institutions since there is a huge competition between them to find the minimum risk and maximum amount of credits supplied. Comparing with the other services of the banks like credit cards, value added financial services, account management and money transfers, the majority of their capitals has been used for various types of credits. Even there is a competition among them for finding and serving the low risk customers, these institution shares limited information about the risk and risk related information for the common usage. The purpose of this paper is to explain the service oriented architecture and the decision model for those banks which shares the information about their customers and makes potential customer analysis. Credit Risk Evaluation as a Service system, provides a novel service based information retrieval system submitted by the banks and institutions. The system itself has a sustainable, supervised learning with continuous improvement with the new data submitted. As a main concern of conflict of interest between the institutions trade and privacy information secured for internal usage and full encrypted data gathering and as well as storing architecture with encryption. Proposed system architecture and model is designed mainly for the commercial credits for SME’s due to the complexity and variety of other credits

    An insight into the experimental design for credit risk and corporate bankruptcy prediction systems

    Get PDF
    Over the last years, it has been observed an increasing interest of the finance and business communities in any application tool related to the prediction of credit and bankruptcy risk, probably due to the need of more robust decision-making systems capable of managing and analyzing complex data. As a result, plentiful techniques have been developed with the aim of producing accurate prediction models that are able to tackle these issues. However, the design of experiments to assess and compare these models has attracted little attention so far, even though it plays an important role in validating and supporting the theoretical evidence of performance. The experimental design should be done carefully for the results to hold significance; otherwise, it might be a potential source of misleading and contradictory conclusions about the benefits of using a particular prediction system. In this work, we review more than 140 papers published in refereed journals within the period 2000–2013, putting the emphasis on the bases of the experimental design in credit scoring and bankruptcy prediction applications. We provide some caveats and guidelines for the usage of databases, data splitting methods, performance evaluation metrics and hypothesis testing procedures in order to converge on a systematic, consistent validation standard.This work has partially been supported by the Mexican Science and Technology Council (CONACYT-Mexico) through a Postdoctoral Fellowship [223351], the Spanish Ministry of Economy under grant TIN2013-46522-P and the Generalitat Valenciana under grant PROMETEOII/2014/062

    Genetic typology of credit as an economic phenomenon

    Get PDF
    Предмет исследования – кредит как экономическое явление. Цель – разработка генетической типологии кредита. Гипотеза исследования. Предполагается, что виды кредита можно систематизировать в зависимости от их возникновения в процессе эволюции кредита от простых к более сложным. Методы: анализ научной литературы, систематизация, обобщение информации и категориальный метод «Ряд информационных критериев». Результаты: 1) выявлены элементарные виды кредита (фондированный, нормированный, диверсифицированный, реструктурированный, рефинансированный, секьюритизированный и диджитализированный); 2) разработана эволюционная последовательность их возникновения и развития; 3) разработана генетическая типология кредита, отражающая его видовое разнообразие и эволюционную последовательность развития этого видового разнообразия. Выводы: 1) в разных обстоятельствах и в разной среде в кредите выявляются элементарные виды, такие как фондированные, нормированные, диверсифицированные, реструктурированные, рефинансированные, секьюритизированные и диджитализированные; 2) появление новых видов кредита закономерно приводит к усложнению его организации; 3) развитие кредита происходит за счет появления новых видов, возникающих в ответ на изменение среды. Ценность. Полученные знания расширяют научные представления о кредите и его эволюционно обусловленном видовом разнообразии, дают возможность прогнозировать появление новых видов кредита. Область применимости результатов. Полученные результаты позволяют перейти к исследованию механизма функционирования кредита. В практической деятельности они могут быть использованы как банками для разработки собственной кредитной политики, так и государством в денежно-кредитной политике, реализуемой Центральным банком

    Redes neuronales para clasificación : una aplicación al caso de riesgos laborales en Colombia

    Get PDF
    El presente artículo describe el diseño, la formalización matemática, programación y la aplicación de una red neuronal “percepton multicapa” en un problema economía de la información. El modelo permitió clasificar correctamente el 85% de las empresas de una muestra aleatoria de asegurados a riesgos laborales en Colombia, identificándolas como fraudulentas o no fraudulentas a partir de sus variables explicativas. Este estudio cuenta con dos factores diferenciales frente a los realizados en el pasado. En primer lugar, se aplicó una red neuronal típicamente usada para modelar pronósticos de series de temporales a un problema de clasificación de individuos, siguiendo el método propuesto por Hongjun Lu, Rudy Setiono y Huan Liu en “Neuro Rule: A Connectionist Approach to Data Mining” artículo que introduce un algoritmo para generar reglas de fácil interpretación para la clasificación de individuos. En segundo lugar, la aplicación de esta técnica de minería de datos es novedosa en la detección de empresas fraudulentas afiliadas al seguro de riesgos laborales y en general en el campo de investigación económica en Colombia.The present article describes the design, mathematic formalization, programing and the application of a neural network “multilayer perceptron” in a problem of economy of the information. The model permitted classify correctly 85% of the companies from a random sample of insured to occupational hazards in Colombia, identifying them as fraudulent or non-fraudulent based on its explanatory variables. Additionally, this study has two differentiating factors towards those made in the past. First, a neural network typically used for modelling forecasts of series of temporals was applied to a problem of classification of individuals, following the method proposed by Hongjun Lu, Rudy Setiono and Huan Liu in their article “Neuro Rule: A Connectionist Approach to Data Mining” that introduces an algorithm for generate rules of easy interpretation for the classification of individuals. Second, the application of this data mining technique is novel in the detection of fraudulent companies affiliated to the insurance of occupational hazards and in the economic research field in Colombia.Magíster en EconomíaMaestrí

    Credit Scoring Using Machine Learning

    Get PDF
    For financial institutions and the economy at large, the role of credit scoring in lending decisions cannot be overemphasised. An accurate and well-performing credit scorecard allows lenders to control their risk exposure through the selective allocation of credit based on the statistical analysis of historical customer data. This thesis identifies and investigates a number of specific challenges that occur during the development of credit scorecards. Four main contributions are made in this thesis. First, we examine the performance of a number supervised classification techniques on a collection of imbalanced credit scoring datasets. Class imbalance occurs when there are significantly fewer examples in one or more classes in a dataset compared to the remaining classes. We demonstrate that oversampling the minority class leads to no overall improvement to the best performing classifiers. We find that, in contrast, adjusting the threshold on classifier output yields, in many cases, an improvement in classification performance. Our second contribution investigates a particularly severe form of class imbalance, which, in credit scoring, is referred to as the low-default portfolio problem. To address this issue, we compare the performance of a number of semi-supervised classification algorithms with that of logistic regression. Based on the detailed comparison of classifier performance, we conclude that both approaches merit consideration when dealing with low-default portfolios. Third, we quantify the differences in classifier performance arising from various implementations of a real-world behavioural scoring dataset. Due to commercial sensitivities surrounding the use of behavioural scoring data, very few empirical studies which directly address this topic are published. This thesis describes the quantitative comparison of a range of dataset parameters impacting classification performance, including: (i) varying durations of historical customer behaviour for model training; (ii) different lengths of time from which a borrower’s class label is defined; and (iii) using alternative approaches to define a customer’s default status in behavioural scoring. Finally, this thesis demonstrates how artificial data may be used to overcome the difficulties associated with obtaining and using real-world data. The limitations of artificial data, in terms of its usefulness in evaluating classification performance, are also highlighted. In this work, we are interested in generating artificial data, for credit scoring, in the absence of any available real-world data

    Adaptive consumer credit classification

    No full text
    Credit scoring methods for predicting creditworthiness have proven very effective in consumer finance. In light of the present financial crisis, such methods will become even more important. One of the outstanding issues in credit risk classification is population drift. This term refers to changes occurring in the population due to unexpected changes in economic conditions and other factors. In this paper, we propose a novel methodology for the classification of credit applications that has the potential to adapt to population drift as it occurs. This provides the opportunity to update the credit risk classifier as new labelled data arrives. Assorted experimental results suggest that the proposed method has the potential to yield significant performance improvement over standard approaches, without sacrificing the classifier's descriptive capabilities
    corecore