Video: Forebyggelse af rotter: Gemmesteder på ejendommen 2025
Datasikkerhed er et stort problem for data minearbejdere. Nyhedsrapporter, der beskriver niveauet for personoplysninger i hænderne på den amerikanske regering, National Security Agency og brud på kommercielle datakilder har øget offentlighedens bevidsthed og bekymring.
Et centralt koncept i personoplysninger er personligt identificerbare oplysninger (PII), eller data, som kan spores til den enkelte person, den beskriver. PII indeholder indlysende identifikatorer som navne, kreditkortnumre og sociale sikringsnumre, og de fleste data minearbejdere er meget opmærksomme på, at denne type data er privat og skal håndteres med omhu. Men PII refererer til mere end blot disse oplagte identifikatorer.
Eventuelle data, der kan bruges til at identificere en person, selvom det kræver at bruge flere felter i kombination eller manipulere dataene på en eller anden måde, er også PII. Det er nemt for data minearbejdere at overse denne slags data, den slags, der ikke vises på overfladen for at være privat, og alligevel kunne være tilstrækkelig til personlig identifikation, hvis den blev manipuleret til det formål. Hvis der er nogen måde, at data kunne manipuleres for at identificere personer, skal det håndteres med de samme forholdsregler, som du ville give en liste over kreditkortnumre.
Det er her data minearbejdere nemt kan komme sig i problemer. Der er mange måder at identificere personer på, hvis du gør en lille indsats for at gøre det. I et bemærkelsesværdigt eksempel frigav AOL Research brugersøgningsrekorder til forskningsbrug. Dataene var beregnet til at være anonyme, der var ingen navne i den, men The New York Times rapporterede, at det havde været i stand til at identificere en person fra søgedata ved krydshenvisning med telefonlister. Senere lavede Netflix filmdata til rådighed til brug i en konkurrence, og det blev hurtigt afsløret, at disse data også kunne bruges til at identificere personer.
I dit arbejde som data minearbejder har du muligvis erfaringer med potentielle kunder, som delte data, de hævdede var anonyme (eller endda falske, for at illustrere et diskussionspunkt), men fandt at dataene var intet af den slags. Bevidst eller ej overtræder disse mennesker lovgivningen om databeskyttelse og viser manglende respekt for deres egne kunder.
Så hvordan kan du forhindre katastrofer som disse? Forsøg ikke at gøre det alene. Det er udfordrende at sikre overholdelse af alle relevante lovgivninger om privatlivets fred, for ikke at nævne andre gode forretningspraksis. Jenny Juliany, Vice President for Solutions Architecture og Co-Founders of Intreis, en løsningsintegrator med speciale i service management og compliance automation, beskriver livscyklus for data med en analogi til de fire årstider:
-
Forår: Start, dataene er oprettet
-
Sommer: Primetime, dataene er i aktiv brug.
-
Efterår: Pensionering, dataene er ikke længere relevante eller brugt, men der kan være juridiske eller andre grunde til at bevare det.
-
Vinter: Fjernelse, dataene er ødelagt.
Hver sæson har sine egne karakteristika, med forskellige krav til beskyttelse af personlige oplysninger. Nogle er grundlagt i loven, andre i sund fornuft, og stadig andre i individuelle aftaler med kunder og din egen arbejdsgivers forretningspraksis. Det er ikke realistisk at tro på, at du kan overtage alle disse overholdelsesoplysninger ud over din primære rolle, så du skal være partner med din organisations databehandlingspersonale.
Du ønsker ikke at være centrum for den næste store datasikkerhedsskandale. Respekt for dataintegritet og korrekt databehandling er nøglen til at minimere risikoen. Vent ikke til noget går galt, kontakt personoplysningerne i din egen organisation i dag, og begynd at opbygge et samarbejde om at håndtere følsomme data korrekt.
Flere detaljer om data livscyklus fra Jenny Juliany på Four Seasons of Data Management findes her:
-
'Spring' Begyndelse
-
'Summer' Primetime
-
'Fall' Pensionering
-
'Vinter 'Fjernelse