Risikomodellering er en anden vigtig anvendelsesformål, der er udnyttet af Hadoop. Du vil opdage, at det er tæt på brugen af bedrageri påvisning, fordi det er en modelbaseret disciplin. Jo flere data du har, og jo flere du kan "forbinde prikkerne", desto oftere vil dine resultater give bedre risikovurderingsmodeller.
Det altomfattende ord risiko kan påtage sig mange betydninger. For eksempel er kundefordeling forudsigelse risikoen for, at en klient flytter til en konkurrent; Risikoen for en lånebog vedrører risikoen for misligholdelse; risiko i sundhedsvæsenet spænder spredningen fra udbrudssammenhæng til fødevaresikkerhed til sandsynligheden for reinfektion og mere.
Finanssektoren (FSS) investerer nu stærkt i Hadoop-baseret risikomodellering. Denne sektor søger at øge automatiseringen og nøjagtigheden af dets risikovurdering og eksponeringsmodellering.
Hadoop tilbyder deltagerne mulighed for at udvide de datasæt, der anvendes i deres risikomodeller, til at omfatte underudnyttede kilder (eller kilder, der aldrig udnyttes), såsom e-mail, chat, sociale medier og interaktioner med kundeservice repræsentanter, blandt andet datakilder.
Risikomodeller i FSS dukker op overalt. De er brugt til forebyggelse af kundekorn, handelsmoduleringsmodellering, corporate risk og eksponeringsanalyse og meget mere.
Når en virksomhed udsteder en forsikring mod naturkatastrofer derhjemme, viser en udfordring tydeligt, hvor mange penge der potentielt er i fare. Hvis forsikringsselskabet undlader at reservere penge til mulige udbetalinger, vil regulatorer gribe ind (forsikringsselskabet ønsker ikke det); hvis forsikringsselskabet lægger for meget penge i sine reserver for at udbetale fremtidige forsikringskrav, kan de ikke så investere dine præmiepenge og opnå fortjeneste (forsikringsselskabet ønsker heller ikke det).
Nogle virksomheder er "blinde" for den risiko de står over for, fordi de ikke har været i stand til at køre en tilstrækkelig mængde katastrofale simuleringer vedrørende variation i vindhastighed eller nedbørshastigheder (blandt andre variabler) som de vedrører til deres eksponering.
Disse virksomheder har ganske enkelt svært ved at stress-test deres risikomodeller. Evnen til at folde i flere data - for eksempel vejrmønstre eller den stadigt skiftende socioøkonomiske fordeling af deres kundebase - giver dem meget mere indsigt og evne til at opbygge bedre risikomodeller.
Bygnings- og stress-test risikomodeller som den netop beskrevne er en ideel opgave for Hadoop. Disse operationer er ofte computationally expensive, og når du bygger en risikomodel, der sandsynligvis er upraktisk at løbe imod et datalager, af følgende grunde:
-
Lageret er sandsynligvis ikke optimeret til de typer af forespørgsler udstedt af risikomodellen.(Hadoop er ikke bundet af de datamodeller, der anvendes i datalagre.)
-
Et stort ad hoc-batchjob, som en udviklende risikomodel, vil tilføje belastning til lageret og påvirke eksisterende analytiske applikationer. (Hadoop kan påtage sig denne arbejdsbyrde og frigøre lageret til regelmæssig virksomhedsrapportering.)
-
Flere avancerede risikomodeller kan muligvis være faktorer i ustrukturerede data, såsom rå tekst. (Hadoop kan håndtere denne opgave effektivt.)