7 research outputs found

    Improved hospital-level risk adjustment for surveillance of healthcare-associated bloodstream infections: a retrospective cohort study

    Get PDF
    Background: To allow direct comparison of bloodstream infection (BSI) rates between hospitals for performance measurement, observed rates need to be risk adjusted according to the types of patients cared for by the hospital. However, attribute data on all individual patients are often unavailable and hospital-level risk adjustment needs to be done using indirect indicator variables of patient case mix, such as hospital level. We aimed to identify medical services associated with high or low BSI rates, and to evaluate the services provided by the hospital as indicators that can be used for more objective hospital-level risk adjustment

    Modelování ztráty při defaultu v P2P úvěrování pomocí náhodných stromů

    No full text
    Modelling credit risk in peer-to-peer (P2P) lending is increasingly important due to the rapid growth of P2P platforms’ user bases. To support decision making on granting P2P loans, diverse machine learning methods have been used in P2P credit risk models. However, such models have been limited to loan default prediction, without considering the financial impact of the loans. Loss given default (LGD) is used in modelling consumer credit risk to address this issue. Earlier approaches to modelling LGD in P2P lending tended to use multivariate linear regression methods in order to identify the determinants of P2P loans’ credit risk. Here, we show that these methods are not effective enough to process complex features present in P2P lending data. We propose a novel decision support system to LGD modeling in P2P lending. To reduce the problem of overfitting, the system uses random forest (RF) learning in two stages. First, extremely risky loans with LGD = 1 are identified using classification RF. Second, the LGD of the remaining P2P loans is predicted using regression RF. Thus, the non-normal distribution of the LGD values can be effectively modelled. We demonstrate that the proposed system is effective for the benchmark of P2P Lending Club platform as other methods currently used in LGD modelling are outperformed.Modelování úvěrového rizika v půjčování typu peer-to-peer (P2P) je stále důležitější díky rychlému růstu uživatelských základen platforem P2P. Pro podporu rozhodování o poskytování půjček P2P byly v modelech úvěrového rizika P2P použity různé metody strojového učení. Takové modely však byly omezeny na predikci úvěrového selhání, aniž by se bral v úvahu finanční dopad úvěrů. Ztráta při selhání (LGD) se používá k modelování spotřebitelského úvěrového rizika k řešení tohoto problému. Dřívější přístupy k modelování půjček na LGDin P2P inklinovaly k použití více lineárních regresních metod s cílem identifikovat determinanty úvěrového rizika půjček P2P. Zde ukazujeme, že tyto metody nejsou dostatečně účinné pro zpracování komplexních funkcí přítomných v datech půjčování P2P. Navrhujeme nový systém podpory rozhodování pro modelování LGD v půjčování P2P. Aby se snížil problém nadměrného vybavení, systém používá učení ve dvou náhodných lesích (RF). Nejprve jsou pomocí klasifikace RF identifikovány extrémně rizikové půjčky s LGD = 1. Za druhé, LGD zbývajících P2P půjček se předpovídá pomocí regresní RF. Lze tedy efektivně modelovat neobvyklé rozdělení hodnot LGD. Prokazujeme, že navrhovaný systém je účinný pro měřítko platformy P2P Lending Club, protože jiné metody, které se v současné době používají při modelování LGD, jsou překonány
    corecore