Hjem Personlig finansiering Identificer de data, du har brug for til dine store data - dummies

Identificer de data, du har brug for til dine store data - dummies

Indholdsfortegnelse:

Video: Kenneth Cukier: Big data is better data 2024

Video: Kenneth Cukier: Big data is better data 2024
Anonim

Angiv hvilken type data du har at gøre med i dit store dataprojekt. Mange organisationer erkender, at mange internt genererede data ikke har været brugt til sit fulde potentiale tidligere.

Ved at udnytte nye værktøjer får organisationer ny viden fra tidligere uudnyttede kilder til ustrukturerede data i e-mails, kundeserviceoptegnelser, sensordata og sikkerhedslogfiler. Derudover er der stor interesse i at søge ny indsigt baseret på analyse af data, der primært er eksternt til organisationen, som f.eks. Sociale medier, mobilplacering, trafik og vejr.

Undersøgelsesfasen for store data

I de tidlige stadier af din analyse vil du søge efter mønstre i dataene. Det er kun ved at undersøge meget store datamængder, at nye og uventede relationer og sammenhænge mellem elementer kan blive tydelige. Disse mønstre kan f.eks. Give indsigt i kundepræferencer for et nyt produkt. Du skal bruge en platform til at organisere dine store data for at se efter disse mønstre.

Hadoop er meget udbredt som en underliggende byggesten til indfangning og behandling af store data. Hadoop er designet med evner, der fremskynder behandlingen af ​​store data og gør det muligt at identificere mønstre i store mængder data på relativt kort tid. De to primære komponenter i Hadoop - Hadoop Distributed File System (HDFS) og MapReduce - bruges til at administrere og behandle dine store data.

FlumeNG til stor dataintegration

Det er ofte nødvendigt at indsamle, aggregere og flytte ekstremt store mængder streamingdata for at søge efter skjulte mønstre i store data. Traditionelle integrationsværktøjer som ETL ville ikke være hurtige nok til at flytte de store strømme af data i tide for at levere resultater til analyse som real-time bedrageri afsløring. FlumeNG indlæser data i realtid ved at streame dine data til Hadoop.

Flume bruges typisk til at samle store mængder logdata fra distribuerede servere. Det holder styr på alle de fysiske og logiske noder i en Flume installation. Agentnoder installeres på serverne og er ansvarlige for at styre måden, som en enkelt strøm af data overføres og behandles fra startpunktet til destinationsstedet.

Derudover bruges samlere til at gruppere strømmen af ​​data til større strømme, der kan skrives til et Hadoop-filsystem eller en anden stor datalagringsbeholder. Flume er designet til skalerbarhed og kan løbende tilføje flere ressourcer til et system til at håndtere ekstremt store mængder data på en effektiv måde.Flume's output kan integreres med Hadoop og Hive til analyse af dataene.

Flume har også transformationselementer til brug på dataene og kan gøre din Hadoop-infrastruktur til en streaming kilde til ustrukturerede data.

Mønstre i store data

Du finder mange eksempler på virksomheder, der begynder at realisere konkurrencemæssige fordele ved stor dataanalyse. For mange virksomheder bliver sociale medier datastrømme i stigende grad en integreret del af en digital marketingstrategi. I undersøgelsesfasen kan denne teknologi bruges til hurtigt at søge gennem store mængder streamingdata og trække ud de trendmønstre, der relaterer til specifikke produkter eller kunder.

Kodificeringsfasen for store data

Med hundredvis af butikker og tusinder af kunder har du brug for en gentagelig proces for at gøre springet fra mønsteridentifikation til implementering af nyt produktvalg og mere målrettet markedsføring. Når du har fundet noget interessant i din store dataanalyse, kodificere den og gøre den til en del af din forretningsproces.

For at kodificere forholdet mellem din store dataanalyse og dine operationelle data, skal du integrere dataene.

Stor dataintegration og integreringstrin

Store data har stor indvirkning på mange aspekter af datahåndtering, herunder dataintegration. Traditionelt har dataintegration fokuseret på bevæbelse af data via middleware, herunder specifikationer for meddelelsesdirigering og krav til applikationsprogrammeringsgrænseflader (API'er). Disse begreber for dataintegration er mere hensigtsmæssige til styring af data i ro i stedet for data i bevægelse.

Flytningen ind i den nye verden af ​​ustrukturerede data og streamingdata ændrer det konventionelle begreb om dataintegration. Hvis du vil integrere din analyse af streamingdata i din forretningsproces, har du brug for avanceret teknologi, der er hurtig nok til at gøre det muligt for dig at træffe beslutninger i realtid.

Når din store dataanalyse er gennemført, har du brug for en tilgang, der giver dig mulighed for at integrere eller inkorporere resultaterne af din store dataanalyse i din forretningsproces og i realtidsforretninger.

Virksomhederne har høje forventninger til at opnå reel forretningsmæssig værdi fra stor dataanalyse. Faktisk vil mange virksomheder gerne begynde en dybere analyse af internt genererede store data, såsom sikkerhedslogdata, der ikke tidligere var muligt på grund af teknologibegrænsninger.

Teknologier til højhastighedstransport af meget store og hurtige data er et krav for integration på tværs af distribuerede store datakilder og mellem store data og operationelle data. Ustrukturerede datakilder skal ofte flyttes hurtigt over store geografiske afstande for deling og samarbejde.

Sammenkædning af traditionelle kilder med store data er en multistartet proces, efter at du har set på alle dataene fra streaming store datakilder og identificeret de relevante mønstre. Efter at indsnævre mængden af ​​data, du skal administrere og analysere, skal du nu tænke på integration.

Identificer de data, du har brug for til dine store data - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...