Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2025
Data indsamlet af store organisationer i dagligdags forretninger gemmes normalt i databaser. Men databaseadministratorer kan ikke være villige til at give data minearbejdere direkte adgang til disse Datakilder og direkte adgang er måske ikke den bedste løsning fra din synsvinkel. Direkte adgang til operationelle databaser (bruges til rutinemæssige forretningsaktiviteter) kan være en dårlig ide, fordi
-
Data minearbejdere bruger mange data. >
Du kan utilsigtet overtræde en lov om privatlivets fred eller anden datahåndtering krav om din dataadgang ikke er korrekt styret. -
Operationsdatabaser er ikke tilrettelagt til data mining. Du kan bruge meget tid på at kæmpe for at få de data, du har brug for, og stadig ikke sikker på at få det rigtige.
-
Når du har brug for data fra en operationel database (og du har den rette godkendelse til at bruge dataene), bør du diskutere dine behov hos den administrator, der er ansvarlig for disse data. Du skal forklare præcis, hvilke data du har brug for, det format, du har brug for til data mining, og om du kun har brug for dataene én gang eller løbende.
Den bedste tilgang til engangsforespørgsler er ofte for administratoren at udvinde dataene for dig og levere den i en tekstfil eller et andet acceptabelt format.
Løbende datatilgang er et andet spørgsmål. Administratoren ønsker måske ikke at give datauddrag igen og igen, og det giver risikabelt at give dig direkte adgang til forretningssystemer. En fælles løsning er at oprette enanalytisk database.
Dette er en almindelig relationsdatabase, der er adskilt fra konventionelle forretningssystemer. Data overføres rutinemæssigt (og automatisk) fra forretningssystemer til den analytiske database, og data minearbejdere har adgang til det til enhver tid.
visning
(en gemt forespørgsel, der kan forespørges som om det var en konventionel datatabel) med den organisation, du har brug for. Mange data-minedriftprodukter kan læse data fra databaser. De nødvendige skridt varierer baseret på Design af data mining applikationen
Struktur af kildedatabasen
-
Middleware, som normalt kaldes en
-
driver
-
( ODBC driver, JDBC driver