Video: Analytics for Anything 2025
Data i prædiktiv analyse kan identificeres som streamet, statisk eller en blanding af de to. Strømdata ændres kontinuerligt; Eksempler er den konstante strøm af Facebook-opdateringer, tweets på Twitter og de konstant ændrede aktiekurser, mens markedet stadig er åbent.
Strømdata ændres løbende; statiske data er selvstændig og vedlagt. De problemer, der er forbundet med statiske data, omfatter huller, outliers eller ukorrekte data, som alle kan kræve noget rensning, forberedelse og forbehandling, før du kan bruge statiske data til analyse.
Som med streamede data kan der opstå andre problemer. Lydstyrke kan være et problem; den rene mængde af non-stop data, der konstant ankommer, kan være overvældende. Og jo hurtigere dataene strømmer ind, desto sværere er det for analysen at indhente.
De to hovedmodeller til analyse af streamede data er som følger:
-
Undersøg kun de nyeste datapunkter og tag en beslutning om tilstanden af modellen og dens næste træk. Denne tilgang er inkrementel - i det væsentlige opbygger et billede af dataene, som det ankommer.
-
Evaluer hele datasættet, eller en delmængde af det, for at træffe en beslutning hver gang nye datapunkter ankommer. Denne tilgang er inklusive flere datapunkter i analysen - hvad udgør "hele" datasættet, hver gang nye data tilføjes.
Afhængigt af arten af din virksomhed og den forventede virkning af afgørelsen foretrækkes en model over den anden.
Nogle forretningsområder, såsom analyse af miljø-, markeds- eller efterretningsdata, pris nye data, der kommer i realtid. Alle disse data skal analyseres, da den bliver streamet - og fortolkes ikke kun korrekt, men med det samme.
På baggrund af den nyligt tilgængelige information genopbygger modellen hele den interne repræsentation af omverdenen. Dette giver dig den mest up-to-date basis for en beslutning, du måske skal gøre og handle hurtigt.
For eksempel kan en prædiktiv analysemodel behandle en aktiekurs som et datafeed, selvom dataene ændrer sig hurtigt, analyserer dataene i forbindelse med øjeblikkelige markedsforhold, der eksisterer i realtid, og beslutter derefter, om der skal handles en særlig bestand.
Det er klart, at analysering af streamede data adskiller sig fra at analysere statiske data. Analyse af en blanding af begge datatyper kan være endnu mere udfordrende.