thesis

Robust discriminant analysis.

Abstract

Robuuste discriminant analyse Discriminant analyse, en de bijhorende classificatieregels, wordt vaak g ebruikt in de praktijk. Denk bijvoorbeeld aan de marketing afdeling van een bank die tracht beleggingsfondsen te verkopen aan nieuwe klanten. Ve rmits men uiteraard niet onnodig nieuwe klanten wenst lastig te vallen, wil men ervoor zorgen dat de reclame alleen aan mogelijk geïnteresseerde n gegeven wordt. Discriminant analyse kan hier helpen, maar er moet reke ning mee gehouden worden dat de gegevensbank waarover de bank beschikt e rg groot kan zijn, en dat deze vele atypische observaties kan bevatten, ook wel uitschieters genaamd. In discrimin antanalyse tracht men een regel op te stellen die toelaat o m multivariate observaties aan verschillende groepen toe te wijzen. Deze regel wordt geconstrueerd op basis van een oefensteekproef, wat een ver zameling observaties is waarvan men reeds weet tot welke groep ze behore n. Als voorbeeld kan als oefensteekproef een verzameling cliënten bescho uwd worden. Een deel hiervan zijn mensen die reeds beleggingsfondsen heb ben en een ander deel niet. Voor al deze cliënten worden enkele relevant e karakteristieken gemeten, zoals het spaargeld, het gezinsinkomen, info rmatie over lopende leningen, het aantal kinderen, enz. Gebruikmakende v an deze informatie kan men dan een discriminant regel opstellen, die toe gepast kan worden op nieuwe cliënten waarvan men enkel de karakteristiek en kent, doch die niet in de oefensteekproef zaten. Deze cliënten kunnen dan toegekend worden aan één van de groepen. Enkel de nieuwe cliën ten die toegekend worden aan de groep van mensen geïnteresseerd in beleg gingsfondsen, zullen de reclame ontvangen. Vele andere toepassingen van discriminant analyse kunnen uiteraard gevonden worden in economie, biolo gie, geneeskunde, enz. De klassieke discriminant regels kunnen echter erg sterk beïnvloed worde n door aanwezigheid van enkele uitschieters in de oefensteekproef, waard oor de resultaten onbetrouwbaar kunnen worden. Daarom is er nood aan rob uuste alternatieven die zich stabieler gedragen in aanwezigheid van uits chieters in de data. In de literatuur werden reeds resultaten voor robuu ste discriminant analyse gegeven, doch dit was meestal beperkt tot linea ire discriminant analyse en in het geval van slechts twee groepen. In di t proefschrift worden ook robuuste niet-lineaire discriminant regels bes tudeerd, zoals kwadratische en logistische regels. Tevens wordt in dit p roefschrift een uitbreiding naar discriminant analyse voor meerdere groe pen voorzien. Het kan bijvoorbeeld zeer interessant zijn om groepen van beleggers te onderscheiden, afhankelijk van de karakteristieken van de p ersonen in die verschillende groepen. In dit proefschrift werden nieuwe discriminant procedures ontwikkeld, di e zich robuust gedragen in aanwezigheid van uitschieters en een zo klein mogelijke kans op foutieve classificatie geven. Statistische eigenschap pen werden afgeleid voor de verscheidene methodes en voorgesteld in de v erschillende artikels die reeds gepubliceerd werden of reeds ingestuurd werden voor publicatie. Ze situeren zich allemaal in het domein van robu uste statistiek. Naast robuuste discriminant analyse, werd o ok aandacht geschonken aan robuuste tijdreeksenanalyse.

    Similar works