Implementer en Data Mart - Quickly-dummies
Uanset hvordan du beslutter dig for at opdele universet af mulige indhold i nogle delmængde for din data mart, husk at for at opnå maksimal forretningsværdi fra din data mart, skal du implementere det hurtigt. Her er de tre nøgler til hurtig implementering: Følg en iterativ, faset metode. Du bruger mesteparten af ...
Sådan sættes arkitektonfonden til store data - dummier
Er det vigtigt at lægge en stærk arkitektonisk fundament hvis du vil lykkes med store data. Ud over at understøtte de funktionelle krav er det vigtigt at understøtte den krævede præstation. Dine behov afhænger af arten af den analyse, du støtter. Du skal bruge den rigtige mængde beregningsevne ...
Hvordan man optimerer MapReduce-opgaver - dummies
Bortset fra at optimere den aktuelle applikationskode med MapReduce til store dataprojekter, kan du Brug nogle optimeringsteknikker til at forbedre pålideligheden og ydeevnen. De falder i tre kategorier: hardware / netværkstopologi, synkronisering og filsystem. Stor datahjælp / netværkstopologi Uafhængig af applikation vil den hurtigste hardware og netværk sandsynligvis give de hurtigste runtider ...
Identificer de data, du har brug for til dine store data - dummies
Beskæftiger sig med i dit store dataprojekt. Mange organisationer erkender, at mange internt genererede data ikke har været brugt til sit fulde potentiale tidligere. Ved at udnytte nye værktøjer opnår organisationer ny indsigt fra tidligere uudnyttede kilder til ustruktureret data i ...
Hvordan man bruger MapReduce til store data - dummier
MapReduce er en software ramme, der er ideel til store data, fordi det giver udviklere mulighed for at skrive programmer, der kan behandle massive mængder ustrukturerede data parallelt på tværs af en distribueret gruppe processorer. Kortfunktionen til store data Kortfunktionen har i mange år været en del af mange funktionelle programmeringssprog. Kort ...
Lag 0 af Big Data Stack: Redundant Fysisk Infrastruktur - Dummies
På det laveste niveau af den store datastabel er den fysiske infrastruktur. Din virksomhed har måske allerede et datacenter eller investeret i fysisk infrastruktur, så du vil gerne finde en måde at bruge de eksisterende aktiver på. Store data implementeringer har meget specifikke krav til alle elementer i referencearkitekturen, ...
Lag 2 af Big Data Stack: Operations Databases - dummies
I kernen af enhver stor datamiljø og lag 2 i den store datastabel er databasemotorerne, der indeholder samlinger af dataelementer, der er relevante for din virksomhed. Disse motorer skal være hurtige, skalerbare og klare faste. De er ikke alle skabte lige, og visse store datamiljøer vil blive bedre med ...
Lag 3 af Big Data Stack: Organiseringsdatatjenester og -værktøjer - dummier
Organisere datatjenester og værktøjer, lag 3 i den store datastabel, indsamle, validere og samle forskellige store dataelementer i kontekstuelt relevante samlinger. Fordi store data er massive, har teknikker udviklet sig til at behandle dataene effektivt og problemfrit. MapReduce er en stærkt anvendt teknik. Det er tilstrækkeligt at sige her, at mange af disse organiserer ...
Nøgleværdiparametre i et stort datamiljø - dummier
Langt den enkleste af Databaserne NoSQL (ikke-kun-SQL) i et stort datamiljø er dem, der anvender KVP-modellen (Key Value Par). KVP-databaser kræver ikke et skema (som RDBMS'er) og giver stor fleksibilitet og skalerbarhed. KVP-databaser tilbyder ikke ACID (Atomicity, Consistency, Isolation, Durability) og kræver, at implementere tænker på data ...
Mødes med datalagringsrepræsentanter - dummies
Shopping til datalagringsprodukter kan omfatte møder med firmaets reps. Før en salgsrepræsentant sætter mund på dit kontor eller påbegynder en webkonference med dig, gør du helt klart, hvad du forventer at dække under det første eller to timers første møde. Du skal gøre mindst følgende: Hør en præsentation af ...
Lag 1 i Big Data Stack: Sikkerhedsinfrastruktur - dummies
Sikkerheds- og privatlivskrav 1 af den store datastabel, svarer til kravene til konventionelle datamiljøer. Sikkerhedskravene skal nøje tilpasses til specifikke forretningsbehov. Nogle unikke udfordringer opstår, når store data bliver en del af strategien: Datatilgang: Brugeradgang til rå eller beregne store data har ...
Lag 4 i Big Data Stack: Analytiske Data Warehouses - dummies
Data Warehouse, lag 4 af den store datastabel, og dens ledsager data mart, har længe været de primære teknikker, som organisationer bruger til at optimere data for at hjælpe beslutningstagere. Data lagre og marts indeholder typisk normaliserede data indsamlet fra en række forskellige kilder og samlet for at lette analysen af virksomheden. Data ...
Administrere virtualisering til store data - dummier
Virtualisering adskiller ressourcer og tjenester fra det underliggende fysiske leveringsmiljø, så du kan oprette mange virtuelle systemer inden for et enkelt fysisk system. En af de primære årsager til, at virksomheder har implementeret virtualisering, er at forbedre effektiviteten af behandlingen af en forskellig blanding af arbejdsbyrder. Den store data hypervisor I et ideelt ...
Middleware til datalagring - dummies
Middleware er computersoftware, der forbinder softwarekomponenter. I et datalagringsmiljø er middleware-tjenesterne det sæt af programmer og rutiner, der gør følgende: Træk data fra kilden (eller kilderne). Sørg for, at dataene er korrekte. Flyt dataene rundt om i miljøet fra platform til platform, efter behov. Håndter ethvert nødvendigt ...
Masterdata management (MDM) - dummies
I de seneste år er ODS-stil feedbacksystemer defineret til et bestemt formål - referencedata - er opstået. Alle systemer er pakket med referencedata. Disse data kan omfatte det sæt data, du bruger til at beskrive scenen for en salgsmulighed (for eksempel en ledelse, en kvalificeret leder, en mulighed, en forventet mulighed og ...
Middleware Services: Data Mapping and Transformation - dummies
Dette billede viser et miljø, hvor data udvindes fra tre forskellige datakilder til optagelse i et datalager, og hver af de tre kilder er på en anden platform. På et tidspunkt i middleware-processen skal disse QA'd-ekstrakter bringes sammen for en kombineret kortlægnings- og transformationsproces. Den ...
Middleware Services: Databevægelse og dataindlæsning - dummier
I de fleste situationer, de to middleware-tjenester - udvælgelse og udvinning og kvalitetssikring - finder sted på samme platform (system), som datakilden befinder sig i. Hvis dit datalager vil blive hostet på en anden platform end datakilden, skal du dog bruge en data-bevægelsestjeneste til at gennemføre system-til-systemet ...
Middleware Tjenester: Dataudvælgelse og udtræk - dummies
Det primære formål med dataudvælgelsen og -ekstraktionstjenesten er at vælge fra (finde i) en datakilde de data, som du vil flytte ind i datalageret, og derefter uddrage (trække ud) disse data i en formular, der kan læses for kvalitetssikringstjenester. Du kan bruge en af to forskellige typer ...
Multidimensionale databaser - dummies
Dette er ikke første gang i nyere historie, at nye typer af databaseprodukter er opstået og overvinde RDBMS ineffektivitet . Tilbage i 1980'erne blev en klasse applikationer identificeret, hvor RDBMS-produkter dårligt håndterede datahåndteringsbehovene (især genereringen af RDBMS'er tilgængelige på det tidspunkt). Disse applikationer har alle brug for brugerspecificerede datatyper, der ...
Middleware Services: Data Quality Assurance - dummies
Du bør oprette to forskellige kvalitetssikringssystemer af middleware-tjenester. Du skal udføre de første QA-opgaver mod uddraget fra datakilden, før du udfører flere middleware-tjenester. Datakvalitetssikring: del I Prøv at fange (og rette) fejl og problemer så tidligt i processen ...
Ikke-relationelle databaser i et stort datamiljø - dummier
Ikke-relationelle databaser er ikke afhængige af bordet / nøglemodellen endemisk til RDBMSs (relationsdatabasestyringssystemer). Kort sagt kræver specialdata i den store dataværld specialitetskrævende og data manipulationsteknikker. Selv om disse nye databasetyper giver nogle svar på dine store dataudfordringer, er de ikke en eksplicit billet til slutningen ...
Sæt Big Data to Use - dummies
Tekstanalyse kan bruges til at få indblik i data. Så hvad om dataene er store data? Det ville betyde, at de ustrukturerede data, der analyseres, er højt volumen, høj hastighed eller begge dele. Store data og kundens stemme Optimalisering af kundeoplevelsen og forbedring af kundeopbevaring er dominerende drivere til ...
Ni tegn på et vellykket datalagringsprojekt - dummier
Bare fordi alle samles i firmaets cafeteria for kage og plaster væggene med lykønskningsbannere betyder ikke, at dit datalagringsprojekt var en succes. Dette kapitel giver dig nogle måder at fortælle, at du var rigtig succesfuld. Den executive sponsor siger, "Denne ting virker - det virker virkelig! "Antag, at en højtstående ...
Modificere Business Intelligence Products til at håndtere Big Data - dummies
Traditionelle business intelligence produkter blev ikke rigtig designet til at håndtere store data, så de kan kræve nogle ændringer. De var designet til at arbejde med stærkt strukturerede, velbegrundede data, der ofte lagres i et relationelt datalager og vises på dit skrivebord eller en bærbar computer. Denne traditionelle business intelligence-analyse anvendes typisk til øjebliksbilleder af data snarere ...
Andre typer Business Intelligence - dummies
Ak, den pæne, organiserede model, der har fire forskellige typer business intelligence kategorier (forespørgsel og rapportering, business analyse [OLAP], data mining og dashboards og scorecards) kan udvides til mere komplekse applikationer. Et OLAP- eller instrumentbrætværktøj kan f.eks. Have geografiske informationssystemer (GIS) - eller måske ikke. Som vist i ...
Forberede sig til semantik i datalagring - dummies
Hvis du vurderer, hvordan teknologierne i forbindelse med datalagring fungerer meget af metadata styres på en proprietær måde inden for værktøjet. Nogle har tidligere forsøgt at løse integrationsproblemet ved at oprette endnu en teknologi, kendt som tekniske metadata repositories, for at integrere alle disse metadata fra de forskellige værktøjer. Sådanne ...
Skal du bruge værktøjer eller brugerdefineret kode? - dummies
I de tidlige dage med datalagring handlede de fleste organisationer mellemware-tjenester ved hjælp af brugerdefineret kodning i stedet for de få tilgængelige værktøjer på det tidspunkt som vist i dette eksempel: En organisation skriver et program i en programmering sprog som COBOL, eller måske i et miljø som SAS, til at håndtere dataekstrakterne ...
Forespørgsels- og rapporteringsværktøjer til datalagring - dummier
Et forespørgsels- og rapporteringsværktøj hjælper dig med at udføre regelmæssige rapporter, oprette organiserede lister, og udfør tværbordsrapportering og forespørgsel. Her er nogle forespørgsels- og rapporteringsværktøjer, der gør dig bekendt med. SQL SQL-rollens rolle er det officielle database forespørgselssprog, der bruges til at få adgang til og opdatere dataene i et relationsdatabasestyringssystem, ...
Replikering Tjenester til datalagring - dummier
Replikering middleware-tjenester kombinerer udvælgelse og ekstraktion, bevægelse og indlæsning fra en database til en eller flere andre, som normalt forvaltes af et enkelt DBMS-produkt. (Kildedatabasen og alle målene er f.eks. Alle Oracle, alle Sybase eller alle Microsoft SQL Server.) Selv om replikeringstjenestefunktioner varierer blandt DBMS-produkter, har de traditionelt været ...
RDBMS'er i et Big Data Environment - dummies
Store data bliver et vigtigt element i, hvordan organisationerne udnytter høj -volumendata i den rigtige hastighed for at løse specifikke dataproblemer. Relationelle Database Management Systems er vigtige for dette høje volumen. Store data lever ikke isoleret. For at være effektive skal virksomheder ofte kombinere resultaterne af ...
Seks leverandører med mellemvareprodukter til datalagring - dummies
Der findes flere leverandører, der tilbyder datalagring mellemwareprodukter du vil måske se på. Her er syv, der er værd at overveje. Composite Software Composite Software leverer produkter og teknologi til Enterprise Information Integration (EII). Ved at bruge Composite kan du få adgang til og kombinere data fra forskellige datakilder, herunder pakkede applikationer som ...
Struktureret data i et stort datamiljø - dummier
Udtrykket struktureret data refererer generelt til data, der har en defineret længde og format for store data. Eksempler på strukturerede data inkluderer tal, datoer og grupper af ord og tal kaldet strenge. De fleste eksperter er enige om, at denne slags data tegner sig for omkring 20 procent af de data, der er derude. Strukturerede data ...
Rumlige databaser i et stort datamiljø - dummier
Rumlige databaser kan være et vigtigt redskab i dit store dataprojekt . Rumlige data i sig selv er standardiseret gennem Open Geospatial Consortium (OGC), som etablerer OpenGIS (Geographic Information System) og en række andre standarder for rumlige data. Uanset om du ved det eller ej, kan du interagere med rumlige data hver dag. ...
Cloud i konteksten af Big Data - dummies
Cloud computing er en metode til at tilvejebringe et sæt af delte computerressourcer og bliver stadig vigtigere for dit store datainitiativ. Skyen omfatter applikationer, computing, storage, networking, udvikling og implementeringsplatforme samt forretningsprocesser. Cloud computing gør traditionelle siled computing-aktiver til delte puljer af ressourcer baseret på en underliggende ...
Ti Obligatoriske færdigheder til en datalagringskonsulent - dummier
En god datalagringskonsulent har visse evner til at håndtere med folk og viden om forskellige aspekter af datalagring. Denne liste lader dig ind på et par krævede færdigheder, som alle datalagringskonsulenter skal have. Bred vision Selv en datalagringskonsulent, som er ekspert inden for et bestemt område (stjerneskema design ...
Ti Kilder til opdateret information om datalagring - dummier
Du sandsynligvis vil ikke blive overrasket over at høre, at begrebet opdateret information om datalagring betyder "gå se på internettet. "Det er værd at bruge tid til at tjekke websiderne i dette kapitel. Data Warehousing Institute På Data Warehousing Instituttets omfattende websted kan du finde disse emner: Uddannelsesoplysninger Kommende arrangementer Hvide ...
Oprettelsen af administrerbare store datastrukturer - dummies
Som computeren flyttes ind på det kommercielle marked, data blev gemt i flade filer, der ikke pålægges nogen struktur. I dag kræver store data håndterbare datastrukturer. Da virksomhederne var nødt til at nå op på detaljeret forståelse for kunderne, måtte de anvende brute-force metoder, herunder meget detaljerede programmeringsmodeller for at skabe værdi. Senere i ...
Tekst Analytics for ustrukturerede store data - dummies
Der findes adskillige metoder til analyse af ustrukturerede data til dit store datainitiativ. Historisk set kom disse teknikker ud af tekniske områder som NLP (Natural Language Processing), vidensopdagelse, dataudvinding, informationsindsamling og statistik. Tekstanalyse er processen med at analysere ustruktureret tekst, udvinde relevant information og omdanne den til strukturerede oplysninger, som så kan ...
Ti spørgsmål, der skal overvejes, når du vælger brugerværktøjer - dummier
Få ting er mere frustrerende end at opbygge et data warehouse og derefter få det gjort ubrugeligt af mindre end tilfredsstillende brugerværktøjer. Denne liste indeholder nogle spørgsmål at overveje, når du vurderer værktøjer, som du måske vil købe. Ønsker jeg et smorgasbord eller en sit-down restaurant? Sats på, at du ikke forventede et spørgsmål som dette ...