Indholdsfortegnelse:
Video: SCP-1173 The Islamic Republic of Eastern Samothrace | Euclid scp 2025
En data minearbejder har intet uden data. Og hvis du arbejder i en stor organisation, har du hundredvis, måske tusindvis af eksisterende datafiler, der potentielt er tilgængelige til data mining. Hver aktivitet genererer optegnelser, og disse optegnelser kan blive dit råmateriale. Tabellen viser de mange almindeligt indsamlede data i en række forretningsaktiviteter.
Forretningsaktivitet | Data indsamlet |
---|---|
Forskning | Konkurrent produktinformation; eksperimentelle og testdata |
Fremstilling | Procesdata; indkøbsregistre produktion records;
inspektions- og testregistre |
Marketing | Konkurrent marketing information og salgsdata; kampagnedata
marketingkostningsdata |
Salg | Salgsaktivitet; salgsdata; kundeoplysninger |
Opfyldelse | Emballageoptegnelser; skibsfart fragtklager |
Kundeservice | Kundeinteraktionsposter; klager over produkt og service
serviceproblemer |
Teknisk support | Supportanmodninger; produkt problemrapporter; design og andre
produktforslag |
Træning | Personale træningsoptegnelser; kunde træning records;
certificering og andre legitimationsdokumenter |
Regnskaber | Regninger; betalinger; revisionsposter skatter indsamlet og betalt |
Det er en temmelig lang liste, men det er virkelig kun en lille stikprøve af de aktiviteter og relaterede data, der allerede venter et sted inden for din virksomhed.
Men at vide, at data eksisterer, er ikke det samme som at kunne få adgang til og bruge det til data mining. For en ting skal du have meget mere specifikke oplysninger om, præcis hvilke interne data der er relevante for det specifikke forretningsproblem, du undersøger. Hvem samler det? Hvem kontrollerer adgang? Hvilke variabler (felter) registreres, og for hvilket tidsrum eller aktivitet? Hvor kan du finde dokumentation?
Værdsætter dine egne data
Du og din leder kan vælge mellem en række valgmuligheder, når du vælger hvilket projekt der skal håndteres med data mining. Du har altid et valg af værktøjer. Men når det kommer til data, har du muligvis intet valg: Du bruger de data, der er tilgængelige for dig eller din virksomhed lige nu.
Du kan have tvivl om disse data. Du er sikker på at vide noget om sine fejl. Og du har måske hørt om andre organisationer, der har større mængder data eller forskellige typer data end din egen.
Ikke desto mindre er din organisations interne data, de oplysninger, der indsamles i dagligdagen, din mest værdifulde ressource.Det er de allerbedste data, du kan få til data mining. Det er bedre end alle eksterne kilder på en række måder:
-
Enestående relevans: Oplysningerne vedrører din egen virksomhed med alle dets karakteristiske egenskaber. Det handler om dine egne kunder, dine egne produkter, din egen forretningspraksis. Uanset hvad du måske opdager i disse data, vil det også være relevant for virksomheden. Ingen vil kunne afvise dine resultater med , men vores virksomhed er anderledes undskyldning.
-
Gennemsigtighed: Du kender (eller du kan finde ud af) kilderne til dine egne data. Der bør ikke eksistere mysterier om definitionerne af variabler, dataindsamlingsmetoderne, tidspunktet, stedet eller de involverede personer.
-
Detalje: Du har rå data, samlet i det bedst mulige detaljeringsniveau.
-
Område: Dine datafiler dækker hele aktivitetsområdet i din virksomhed.
-
Konkurrencefordel: Kun du har dine egne interne data. Det er ikke tilgængeligt for dine nuværende eller kommende konkurrenter.
-
Udviklingspotentiale: Du kan bygge på dine egne data på måder, som ikke ville være mulige med data fra en hvilken som helst ekstern kilde. Hvis du vil integrere oplysninger fra flere kilder, indeholder dine data de identifikatorer, du har brug for for at gøre det.
Hvis du vil vide mere om kunder, har du deres navne og kontaktoplysninger, og du kan henvise til andre poster, undersøge dem eller endda ringe og få en personlig samtale. Hvis du har brug for mere detaljerede eller yderligere data, kan du muligvis ændre en dataopsamlingspraksis.
En anden god ting om dine egne data: Du ejer det. Eventuelle dataindsamlingsomkostninger blev dækket af den forretningsenhed, der genererede dataene i første omgang. Du betaler ingen gebyrer og har ingen licensproblemer at overveje, når du bruger og genbruger dataene. (Du kan blive udsat for datalagring og andre problemer med dataadministration, men det er sandt for enhver datakilde.)
Dine egne dataressourcer vil ikke være perfekte på alle måder. Du kan opdage, at nogle data, du gerne vil bruge, ikke er blevet indsamlet eller blevet kasseret. Du er forpligtet til at støde på problemer med datakvaliteten. Og selvfølgelig har interne data grænser - det fortæller dig om din egen organisation, men ikke dine konkurrenter. Alligevel vil interne data altid være din primære og mest værdifulde datafilde.
Håndtering af data med respekt
Dataudvinding, som enhver form for dataanalyse eller rapportering, bruger mange data, langt mere end de fleste daglige forretningsaktiviteter. Når du har adgang til data og udfører analyse, skal du være forsigtig med at gøre det på måder, der holder sig inden for virksomhedens retningslinjer, og som ikke forstyrrer rutinemæssige forretningsprocesser.
Dataressourcer kan være lige så dyrebare og lige så private som kontanter. Gå ud til den rigtige start i data mining ved at behandle data med respekt og opdage de rette metoder til databehandling og styring, der påvirker dit arbejde.
Manglende overholdelse af lovlige og gode forretningspraksis for datastyring kan føre til alvorlige problemer.Det er vigtigt, at data ikke er tilgængelige for personer, der ikke bør bruge det, at optegnelserne ikke ændres eller ødelægges ukorrekt, og at nye data, du opretter, skal arkiveres korrekt. Dokumentation er en nødvendighed. Mange juridiske og gode forretningspraksis krav vil være relevante for dit arbejde inden for data mining.
Dette kan ikke være enkelt. Du bliver nødt til at opdage ting om, hvilke data der er tilgængelige, hvordan man får adgang, og hvordan man håndterer dataene korrekt, så du ikke kommer i vejen for andre. Kort sagt, du bliver nødt til at blive involveret i nye ting og nye mennesker. Og det vil være det værd, fordi du bliver mere færdig og udvider dine egne horisonter som følge heraf.
Du bliver nødt til at finde ud af nye ting, men du behøver ikke at blive en data governance ekspert. Du kan stole på de andre i din organisation, som er eksperter inden for datastyring og datastyring. Arbejd med dem konstruktivt, og de vil hjælpe dig med at forblive inden for loven og følge gode databehandlingspraksis.