Hjem Personlig finansiering Modificere Business Intelligence Products til at håndtere Big Data - dummies

Modificere Business Intelligence Products til at håndtere Big Data - dummies

Indholdsfortegnelse:

Video: Genetic Engineering Will Change Everything Forever – CRISPR 2024

Video: Genetic Engineering Will Change Everything Forever – CRISPR 2024
Anonim

Traditionelle business intelligence-produkter blev ikke rigtig designet til at håndtere store data, så de kan kræve en vis modifikation. De var designet til at arbejde med stærkt strukturerede, velbegrundede data, der ofte lagres i et relationelt datalager og vises på dit skrivebord eller en bærbar computer. Denne traditionelle business intelligence analyse anvendes typisk på snapshots af data i stedet for hele mængden af ​​tilgængelige data. Hvad er forskelligt med stor data analyse?

Stor datadata

Store data består af strukturerede, semistrukturerede og ustrukturerede data. Du har ofte meget af det, og det kan være ret komplekst. Når du tænker på at analysere det, skal du være opmærksom på de potentielle egenskaber ved dine data:

  • Det kan komme fra usikre kilder. Stor dataanalyse involverer ofte aggregering af data fra forskellige kilder. Disse kan omfatte både interne og eksterne datakilder. Hvor troværdige er disse eksterne kilder til information? For eksempel, hvor troværdigt er sociale medier data som en tweet? Oplysningerne kan komme fra en ubekræftet kilde. Integriteten af ​​disse data skal overvejes i analysen.

  • Det kan være snavset. Beskidte data refererer til unøjagtige, ufuldstændige eller fejlagtige data. Dette kan omfatte stavning af ord; en sensor, der er brudt, ikke korrekt kalibreret eller ødelagt på en eller anden måde; eller endda duplikeret data. Datavidenskabsmænd diskuterer hvor de skal rense dataene - enten tæt på kilden eller i realtid.

    Selvfølgelig siger en tankegang, at de beskidte data ikke bør rengøres overhovedet, fordi det kan indeholde interessante outliers. Rensestrategien vil sandsynligvis afhænge af kilden og typen af ​​data og målet med din analyse. Hvis du for eksempel udvikler et spamfilter, er målet at registrere de dårlige elementer i dataene, så du vil ikke rense det.

  • Signal / støjforholdet kan være lavt. Med andre ord kan signalet (brugbar information) kun være en lille procentdel af dataene; støj er resten. At kunne udtrække et lille signal fra støjende data er en del af fordelene ved stor dataanalyse, men du skal være opmærksom på, at signalet måske er lille.

  • Det kan være i realtid. I mange tilfælde forsøger du at analysere datastrømmer i realtid.

Stor datastyring skal være en vigtig del af analysekvationen. Under forretningsanalyser skal der gøres forbedringer til styringsløsninger for at sikre rigtigheden fra de nye datakilder, især da den kombineres med eksisterende betroede data, der er gemt i et lager.Datasikkerhed og privatlivsløsninger skal også forbedres for at understøtte styring / styring af store data, der er lagret inden for ny teknologi.

Analytiske store datalgoritmer

Når du overvejer stor dataanalyse, skal du være opmærksom på, at når du udvider ud over skrivebordet, skal de algoritmer, du bruger, ofte ændres, ændre intern kode uden at påvirke dens eksterne funktion. Skønheden i en stor datainfrastruktur er, at du kan køre en model, der plejede at tage timer eller dage i minutter. Dette giver dig mulighed for at gentage på modellen hundredvis af gange. Men hvis du kører en regression på en milliard rækker af data på tværs af et distribueret miljø, skal du overveje ressourcekravene vedrørende datamængden og dens placering i klyngen. Dine algoritmer skal være databevidste.

Derudover begynder sælgerne at tilbyde nye analyser designet til at blive placeret tæt på de store datakilder for at analysere data på plads. Denne tilgang til at køre analytics tættere på datakilderne minimerer mængden af ​​lagrede data ved kun at beholde dataene med høj værdi. Det giver dig også mulighed for at analysere dataene før, hvilket er afgørende for beslutningstagning i realtid.

Selvfølgelig vil analyserne fortsætte med at udvikle sig. Du kan f.eks. Have brug for real-time visualiseringskapacitet til at vise data i realtid, der ændres løbende. Hvordan praktiserer du praktisk talt en milliard point på en grafplade? Eller hvordan arbejder du med de prædiktive algoritmer, så de udfører hurtigt nok og dybt nok analyse til at udnytte et stadigt voksende, komplekst datasæt? Dette er et område med aktiv forskning.

Støtte til stor datainfrastruktur

Det er tilstrækkeligt at sige, at hvis du leder efter en platform, skal den opnå følgende:

Integrere teknologier:

  • Infrastrukturen skal integrere nye store datateknologier med traditionelle teknologier til at kunne behandle alle former for store data og gøre det forbrug af traditionelle analyser. Opbevar store mængder af forskellige data:

  • Der kan være behov for et enterprise-hærdet Hadoop-system, der kan behandle / lagre / styre store mængder data i ro, uanset om det er struktureret, halvstruktureret eller ustruktureret. Procesdata i bevægelse:

  • Der kan være behov for strøm-computerkapacitet til at behandle data, som kontinuerligt genereres af sensorer, smarte enheder, video, lyd og logfiler til støtte for beslutningstagning i realtid. Lagerdata:

  • Du skal måske have en løsning optimeret til operationelle eller dybe analytiske arbejdsbyrder for at gemme og administrere de voksende mængder af betroede data. Og selvfølgelig har du brug for evnen til at integrere de data, du allerede har på plads sammen med resultaterne af den store dataanalyse.

Modificere Business Intelligence Products til at håndtere Big Data - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...