Indholdsfortegnelse:
- Opgave: Identificere dine forretningsmål
- Opgave: Vurdering af din situation
- Opgave: Definere dine data-mining mål
- Opgave: Produktion af din projektplan
Video: Il RIASSUNTONE della FASE 1 MARVEL (6 film in 13 MINUTI) #ILRidoppiatore 2025
Standardindustrien for data mining ( CRISP-DM ) er den dominerende procesramme til data mining. I den første fase af et data mining projekt, inden du nærmer dig data eller værktøjer, definerer du, hvad du vil udføre og definerer årsagerne til, at du vil nå dette mål.
Fagforeningsfasen omfatter fire opgaver (primære aktiviteter, der hver især kan indebære flere mindre dele).
Opgave: Identificere dine forretningsmål
Det første du skal gøre i ethvert projekt for at finde ud af, hvad du forsøger at opnå! Det er mindre indlysende end det lyder. Mange data minearbejdere har investeret tid på dataanalyse, kun for at finde ud af, at deres ledelse ikke var særlig interesseret i det problem, de var Du skal starte med en klar forståelse af
-
Et problem, som din ledelse ønsker at adressere
-
The Forretningsmæssige mål
-
Begrænsninger (begrænsninger på hvad du kan gøre, hvilke løsninger der kan bruges, når arbejdet skal gennemføres osv.)
-
Påvirkninger (hvordan problemet og mulige løsninger passer ind i virksomheden)
Leverancer til denne opgave omfatter tre elementer (normalt korte rapporter med fokus på de vigtigste punkter):
-
Baggrund: Forklar forretningssituationen, der driver projektet. Denne vare, som mange der følger, beløber sig kun til et par stykker.
-
Forretningsmål: Definer, hvad din organisation har til hensigt at opnå med projektet. Dette er normalt et bredere mål end dig, som en data minearbejder, kan udføre uafhængigt. For eksempel kan forretningsmålet være at øge salget fra en ferieannoncekampagne med 10 procent år over år.
-
Forretningssucces kriterier: Definer, hvordan resultaterne skal måles. Forsøg at få klart definerede kvantitative succeskriterier. Hvis du skal bruge subjektive kriterier (hint: vilkår som få indsigt eller få et håndtag på indføre subjektive kriterier), får i det mindste enighed om præcis, hvem der vil bedømme, om disse kriterier har eller ej blevet opfyldt.
Opgave: Vurdering af din situation
Her kommer du ind i flere detaljer om de problemer, der er forbundet med dine forretningsmål. Nu vil du gå dybere ind i fejlsøgning og udbygge en meget flængere forklaring af de problemer, der er skitseret i forretnings målopgaven.
Leverancer til denne opgave omfatter fem dybtgående rapporter:
-
Resumé af ressourcer: En liste over alle tilgængelige ressourcer til projektet.Disse kan omfatte mennesker (ikke kun data minearbejdere, men også dem med ekspertviden om forretningsproblemet, dataadministratorer, teknisk support og andre), data, hardware og software.
-
Krav, forudsætninger og begrænsninger: Kravene vil indeholde en tidsplan for afslutning, lovmæssige og sikkerhedsmæssige forpligtelser og krav til acceptabelt færdigt arbejde. Dette er meningen, at du har adgang til passende data!
-
Risici og uforudsete forhold: Identificere årsager, der kunne forsinke gennemførelsen af projektet, og udarbejde en beredskabsplan for hver af dem. For eksempel, hvis en internetforstyrrelse på dit kontor kan udgøre et problem, kan din uforudsete situation være at arbejde på et andet kontor, indtil udbruddet er afsluttet.
-
Terminologi: Lav en liste over forretningsvilkår og data-minedriftsbetingelser, der er relevante for dit projekt og skriv dem ned i en ordliste med definitioner (og måske eksempler), så alle involverede i projektet kan have en fælles forståelse af disse vilkår.
-
Omkostninger og fordele: Forbered en cost-benefit-analyse for projektet. Prøv at angive alle omkostninger og fordele i dollar (euro, pund, yen og så videre) vilkår. Hvis fordelene ikke overstiger omkostningerne væsentligt, skal du stoppe og genoverveje denne analyse og dit projekt.
Beslutningstagere føler sig ofte mere komfortable tildeling af ressourcer til projekter, der reducerer omkostningerne, end dem, der sigter mod at øge indtægterne. Se derfor altid om besparelsespotentiale, og giv først besparelsesmulighederne først i dine omkostninger og fordele.
Opgave: Definere dine data-mining mål
At nå forretningsmålene kræver ofte handling fra mange mennesker, ikke kun data minearbejderen. Så nu skal du definere din lille del inden for det større billede. Hvis forretningsmålet er at reducere kundeafgang, kan dine data-miningmål f.eks. Være at identificere udslagsrater for flere kundesegmenter og udvikle modeller for at forudsige, hvilke kunder der har størst risiko.
Leverancer til denne opgave omfatter to rapporter:
-
Data mining mål: Definer data-mining leverancer, såsom modeller, rapporter, præsentationer og behandlede datasæt.
-
Succes kriterier for data mining: Definer de tekniske minedriftstekniske kriterier, der er nødvendige for at understøtte business succeskriterierne. Prøv at definere disse kvantitativt (f.eks. Modelnøjagtighed eller prædiktiv forbedring i forhold til en eksisterende metode). Hvis kriterierne skal være kvalitative, skal du identificere den person, der foretager vurderingen.
Opgave: Produktion af din projektplan
Nu angiver du hvert trin, som du, datagruderen, har til hensigt at tage, indtil projektet er gennemført, og resultaterne præsenteres og gennemgås.
Leverancer til denne opgave omfatter to rapporter:
-
Projektplan: Oversigt over din trinvise handlingsplan for projektet. Udvid oversigten med en tidsplan for færdiggørelse af hvert trin, nødvendige ressourcer, input (f.eks. Data eller et møde med en ekspert) og output (som renset data, en model eller en rapport) for hvert trin, og afhængigheder (trin, der ikke kan begynde, før dette trin er afsluttet).Angiv eksplicit, at visse trin skal gentages (for eksempel kræver modellering og evaluering normalt flere frem og tilbage gentagelser).
-
Indledende vurdering af værktøjer og teknikker: Identificer de nødvendige evner til at opfylde dine data-mining mål og vurdere de værktøjer og ressourcer, du har. Hvis noget mangler, er du nødt til at løse problemet meget tidligt i processen.