Video: What is Process Mining? | Sifters 2025
Del af Data Mining for Dummies Cheat Sheet
The Standardindustrien for data mining ( CRISP-DM ) er den dominerende data-mining proces ramme. Det er en åben standard; enhver kan bruge den. Den følgende liste beskriver de forskellige faser af processen.
-
Forretningsforståelse: Få en klar forståelse af problemet, du er ude af at løse, hvordan det påvirker din organisation og dine mål for at løse det. Opgaver i denne fase omfatter:
-
Identificering af dine forretningsmål
-
Vurdering af din situation
-
Definere dine data mining mål
-
Produktion af din projektplan
-
-
Dataforståelse: Gennemgå de data, du har, dokumentere det, identificere datahåndtering og datakvalitetsproblemer. Opgaver til denne fase omfatter:
-
Gathering data
-
Beskriv
-
Udforskning
-
Verificering af kvalitet
-
-
Databehandling: Få dine data klar til brug til modellering. Opgaver til denne fase omfatter:
-
Valg af data
-
Rengøringsdata
-
Konstruktion
-
Integration
-
Formatering
-
-
Modellering: Brug matematiske teknikker til at identificere mønstre i dine data. Opgaver til denne fase omfatter:
Valg af teknikker-
Udformning af test
-
Byggemodeller
-
Vurdering af modeller
-
Evaluering:
-
-
Gennemgå de mønstre, du har opdaget, og vurder deres potentiale til erhvervsmæssig brug. Opgaver til denne fase omfatter: Evaluering af resultater
-
Gennemgang af processen
-
Bestemmelse af de næste trin
-
Implementering:
-
-
Sæt dine opdagelser til arbejde i hverdagen. Opgaver til denne fase omfatter: Planlægningsudvikling (dine metoder til integration af dataudvindingsopdagelser i brug)
-
Rapportering af endelige resultater
-
Gennemgang af endelige resultater
-