Indholdsfortegnelse:
Video: Complet Software 2025
Din organisation har overvældende gunstige odds for at have mindst et sortiment af datalager - et rapporteringssystem, der giver informationskompetencer og undertiden analytiske evner til en eller flere grupper af brugere.
Hvad er en uddragsfil?
Dine brugere anvender sandsynligvis udtrykket uddragsfil for at beskrive denne type miljø, fordi det er befolket af uddrag af data fra produktionssystemer, i stedet for at brugerne bliver tvunget til at udføre deres forespørgsler eller modtage deres rapporter fra operationelle produktionsdatabaser eller -filer. Stadig interesseret i at spille oddsene? Her er et par eksempler på typer af datamiljøer, der muligvis kan beskrives som sortering af datalager:
-
Selv om de udvindte data næsten altid er indbygget i en enkelt fil eller database, kombinerer en fusionsproces sandsynligvis kombinerede data fra mere end én applikationskilde.
-
Kun udvalgte elementer, ikke alle elementer fra alle tabeller eller filer, fra hver datakilde, ekstraheres og kopieres normalt til uddragsfilen.
-
En form for datakvalitetssikringsproces foregår normalt hvert trin på vejen, fra det oprindelige ekstrakt til at indlæse dataene i uddragsfilen.
-
Nogle strømbrugere kan formentlig udføre forespørgsler eller oprette statistiske programmer (f.eks. I SAS eller SPSS) mod dataene, men mange brugere kan ikke røre dataene direkte. I stedet modtager de sandsynligvis regelmæssigt rapporter, der genereres enten automatisk eller som svar på deres anmodninger.
Visst lyder som et datalager, ikke? Virkeligheden er, at disse slags datavarehuse typisk betjener en meget lille befolkning og ikke udføres på en standard måde for at understøtte virksomhedens bredere behov. Du kan også kalde dem wanna be data warehouses.
Her er de fleste organisationer adgang til data:
-
Dataanalyse "have-nots": Organisationer og enkeltpersoner, der har få (og mere sandsynlige nej) evner til at gøre typen analyser, der kan medføre informationsdreven beslutningstagning
-
Dataanalyse "haves": Organisationer og enkeltpersoner, som måske ikke har et datalager op og kører, men gør noget med data, de får fra et eller andet sted. I mange tilfælde passer det til deres forretningsmæssige behov bare fint.
Hvorfor betragtes ikke uddragsfiler som datalagre?
De er slags. Uddragsfiler, uanset om de var i 1970'erne, 1980'erne, 1990'erne eller stadigvæk i brug i dag, eksisterer af de samme grundlæggende grunde, at et fuldt udbygget datalager eller en datamard gør: at levere information til trods for forskellige barrierer, såsom hårde -for-forstå datastrukturer, "rør ikke produktionssystemets" regler og manglen på multifil eller multi-database krydshenvisning.
Nogle data warehousing fortalere hævder, at kombinere og omkonfigurere data simpelthen med det formål at generere rapporter eller at udføre statistisk analyse er næppe et datalager i den moderne betydning af udtrykket. Uddragsfiler er ikke udstyret med multidimensionale eller forretningsmæssige analysemuligheder, som f.eks. Boring og data drejning.
Hvis du adskiller data warehouse-siden (hvad der kræves for at indsamle, flytte og omkonfigurere data fra en eller flere kilder) fra virksomhedsinformationssiden (hvad du gør med dataene, når du har den tilgængelig), billedet bliver meget klarere.
Uddrag filer, eller hvad du vil kalde dem, er meget en del af barriererende filosofi for et datalager. Mange af, hvad brugere henviser til som "uddragsfiler", er filbaserede systemer (i stedet for bygget på databaser), og de er sandsynligvis ikke fleksible nok til at understøtte ad hoc-forespørgsel og dimensionanalyse. Men i virkeligheden tjener disse miljøer formålet med lagring af data til senere brug.
For mange brugere har forretningsanalysemuligheder, som f.eks. Nedlasting og datasvingning, ringe eller ingen brug - i det mindste ikke i sammenhæng med deres nuværende jobdefinitioner. Brugernes job opfordrer til funktionalitet, som disse uddragsfiler kan levere, såvel som de statiske rapporter og statistiske analyser udført med disse data.
Historiens moral: Gå ikke ind i en organisation, der effektivt bruger data gennem uddragsfiler og redegør for data warehousingens vidundere. Vær i stedet forsigtig med at foreslå enhver datalagringsløsning, der kan ses som et skridt baglæns. Hvis du laver denne slags forslag, har du en lang, ujævn tur.