Lokalisering af den algoritme du behøver - dummier
Følgende tabel beskriver algoritmer og algoritme typer, som du måske finder nyttige til forskellige typer af dataanalyse. (Du kan finde diskussioner af alle disse algoritmer i Algoritmer til Dummies.) Algoritmen Beskrivelse Nyttige Link A * Søg Algoritmen sporer omkostningerne ved noder, da den udforsker dem ved hjælp af ligningen: f (n) = g (n) ...
Fusionering og tilføjelse af data - dummier
Når dine data er på mere end ét sted, har du brug for måder at sætte det sammen . Når du deltager i to datasæt med forskellige variabler, slår du sammen data. Sammensmeltning er en fælles operation. Sammensmeltning bruges ofte i data mining, kombinering af sammenkædede data som kundedata og marketingkampagnedata Før og efter testen ...
Administrerer tilgængelighed i NoSQL - dummies
Som med andre NoSQL-databasetyper, med nøgleværdisbutikker kan du handle om ensartethed for nogle tilgængelighed. Nøgletalbutikker leverer typisk en bred vifte af konsistens- og holdbarhedsmodeller - det vil sige mellem tilgængelighed og partitionstolerance og mellem konsistent og partitionstolerance. Nogle nøgletalbutikker går meget længere på konsistensarmen og overgiver BASE ...
Nye dimensioner for Big Data Planning Cycle - dummies
Med fremkomsten af store data, nogle ændringer kan påvirke måden du nærmer dig forretningsplanlægning på. Da flere virksomheder begynder at bruge skyen som en måde at distribuere nye og innovative tjenester til kunder, vil dataanalysens rolle eksplodere. Du vil måske tænke på en anden del af din planlægningsproces. Efter ...
Styring af forskellige datatyper med NoSQL-dummies
NoSQL-databaser er ikke begrænset til en række-og-kolonne tilgang . De er designet til at håndtere en lang række data, herunder data, hvis struktur ændrer sig over tid, og hvis sammenhænge endnu ikke er kendt. NoSQL databaser findes i fire kernetyper - en for hver type data, databasen forventes at klare: Columnar: Udvidelse til traditionelle ...
Matching data til algoritmer fra forskellige kilder - dummier
Interaktion med data fra en enkelt kilde er et problem; At interagere med data fra flere kilder er helt andet. Datasæt i dag kommer imidlertid generelt fra mere end en kilde, så du skal forstå komplikationerne, som brugen af flere datakilder kan forårsage. Når du arbejder med flere datakilder, skal du gøre følgende: Bestem ...
Styring af nøgler i NoSQL - dummies
Nøgleværdisbutikkernes hurtige læsefunktioner stammer fra deres brug af veldefinerede nøgler. Disse nøgler er typisk hashed, hvilket giver en nøgleværdi butik en meget forudsigelig måde at bestemme, hvilke partition (og dermed server) data ligger på. En bestemt server administrerer en eller flere partitioner. En god nøgle gør det muligt at identificere enkeltarkivet unikt ...
Styring af data i NoSQL - dummies
Når du har styret nøglerne korrekt, er du klar til at designe, hvordan du gemmer data med NoSQL og sørg for, at det er sikkert og altid tilgængeligt for det arbejde, du skal gøre. Datatyper i nøgletalbutikker Nøgletalbutikker fungerer typisk som & ldquo; spande & rdquo; for binære data. Nogle databaser giver stærk intern datatype og endda ...
Apache Zookeeper og NoSQL Databaser - dummies
En stor gruppe af NoSQL-databaser er en uhåndterlig ting at administrere. Apache Zookeeper til undsætning! At holde styr på hvilke knuder der findes i klyngen, hvilke data hver styrer og sikre, at nye mestre vælges, når en mester fejler, er ikke letopgaver. Koordinering af store distribuerede systemer er derfor meget vanskeligt. Både Hadoop ...
Administration af brugerinformation med NoSQL - dummies
Der er missionskritiske data, og der er understøttende data. Det er okay, hvis dine missionskritiske data vises lidt langsomt, fordi du vil være sikker på, at det er sikkert og korrekt forvaltet. Men du vil ikke have de understøttende data i din ansøgning for at forhindre overordnede transaktioner og brugeroplevelser. Selvom de understøttende data kan være lavere i værdi, er dens ...
Dokument NoSQL Versus ECM-dummies
Enterprise Content Management (ECM) systemer har eksisteret i mere end ti år. Dokument NoSQL kan tilbyde en vis konkurrence. Eksempler på ECM er IBM FileNet, DB2 Content Manager og EMC Documentum. Mange mindre virksomheder, som Stellent (nu Oracle), er blevet indarbejdet i større tilbud. Et forenklet ECM-system, kaldet Basic Content Services, dukkede også op ...
Triple og Graph Stores - dummies
Tredobbelt butikker synes at bryde med konventionerne forbundet med NoSQL. For det første er de alle ACID-kompatible. I modsætning til de fleste nuværende NoSQL databaser er mange tredobbelt butikker kun proprietære. Der findes også åbne standarder for semantiske applikationer på en måde, der ikke er tilfældet for nøgletalbutikker, Bigtable / wide-kolonneforretninger og dokument NoSQL-databaser. Helt afhængig af ...
Andre Hybrid NoSQL Databaser - dummies
Der er nogle få NoSQL databaser, som du sandsynligvis vil høre om ofte - OrientDB og MarkLogic og måske, ArangoDB. Der er dog andre hybride NoSQL-databaser af interesse. FoundationDB FoundationDB er en open-source, ACID-kompatibel nøgleværdi butik. Hvad der er unikt med FoundationDB, er, at det er designet til at give udviklere mulighed for at tilslutte deres egne data effektivt.
NoSQL Search Features to Consider - dummies
Mange NoSQL databaser understøtter forespørgselsfunktioner og visse søgemuligheder. At vælge den rigtige kommer ofte til at forstå de funktioner, du har brug for til at understøtte. Selvom de er relaterede, er forespørgsel og søgning helt anderledes. En forespørgsel returnerer kun de resultater, der matcher alle vilkårene i den. Søgning kan derimod omfatte valgfri ...
Mikrotargeting til Win Elections - dummies
De fleste politiske kampagner er afhængige af konsulenter til at give vælgerforskning eller ellers komme forbi med meget uformelle vurderinger af vælgernes holdninger og interesse for at stemme for en bestemt kandidat (eller slet ikke stemme). Men i de senere år er visse politiske kampagner, herunder både kandidat- og udfordringskampagner, begyndt at bruge mikrotargeting, organiserede undersøgelsesundersøgelser ...
NoSQL og søgemaskiner - dummies
Det kan måske være underligt at nævne søgemaskiner og NoSQL sammen, men mange af dagens søgemaskiner brug en arkitektur, der ligner meget på NoSQL databaser. Deres indeks og forespørgselsbehandling er meget fordelt. Mange søgemaskiner er endda i stand til at fungere som en nøgleværdi eller dokumentbutik i deres egen ret. NoSQL databaser er ofte ...
Data mining - dummies
Data mining har meget strenge krav til dataanalyse. De er ikke eksotiske, komplekse eller vanskelige krav til at mødes, men de er strenge. Figuren viser en stikprøve af data, der ses som en tabel i data-mining software. Hver række repræsenterer en pakke af fast ejendom. Oplysninger om pakker af fast ejendom er organiseret i ...
10 Killer NoSQL Applications - dummies
Ofte køber folk en bestemt platform på grund af de dræberapps, der kører på den. Mange NoSQL-baserede applikationer falder ind i kategorien Killer app. Disse applikationer kunne ikke være blevet en realitet ved hjælp af eksisterende relationsdatabase teknologier. Facebook messaging platform Apache Cassandra blev oprettet af Facebook for at drive deres Indbakke. Det gjorde dette til en ...
Ikke-så almindelige funktioner i NoSQL-dummies
Selv om nogle funktioner er ret almindelige for NoSQL-databaser ( for eksempel skema agnosticisme og ikke-relationel struktur), er det ikke ualmindeligt, at en database mangler et eller flere af følgende funktioner og stadig kvalificerer som en moderne NoSQL-database. OpenSource NoSQL-software er unik, fordi open source-bevægelsen har drevet udvikling i stedet for at følge en ...
Ydeevne og Big Data - dummies
Bare at have en hurtigere computer er ikke nok til at sikre det rigtige niveau af ydeevne at håndtere store data. Du skal kunne distribuere komponenter i din store datatjeneste på tværs af en række noder. I distribueret computing er en knude et element indeholdt i en klynge af systemer eller i et rack. A ...
Overvinde de store data færdigheder manglende dummier
Store data færdigheder er mangelfulde. Da mængden af digital information genereret af virksomheder er vokset eksponentielt, er der opstået en udfordring (nogle mennesker kalder det en krise): Der er bare ikke nok mennesker med de nødvendige færdigheder til at analysere og fortolke alle disse store data. I en nylig undersøgelse er mere end halvdelen af ...
Fase 5 i CRISP-DM-procesmodellen: Evaluering - dummier
I de første fire faser af procesmodellen Cross Process Industry Standard Process for Data Mining (CRISP-DM), har du udforsket data, og du har fundet mønstre, og nu skal du spørge: Er resultaterne noget gode? Du vil ikke blot evaluere de modeller, du opretter, men også den proces, du plejede at oprette dem, og deres potentiale.
NoSQL Vilkår og definitioner - dummies
At få hovedet rundt NoSQL kan være lidt svært. Hvis du studerede databaser i skolen, har du måske været indoktrineret i en relationel tænkemåde. Sig database til de fleste mennesker, og de tænker relationelt database management system. Dette er naturligt, fordi RDBMS i de sidste 30 år har været så dominerende. Til ...
NoSQL For Dummies Cheat Sheet - dummies
Som en NoSQL-udvikler, vælger du den rigtige produktkategori og det rigtige produkt er første skridt. Disse vejledninger sammenligner de vigtigste funktioner i nogle af de mest populære NoSQL-databaser.
Praksis for at sikre stor datastyring - dummies
Med de store udfordringer, der er fremlagt af store data, det er klogt og absolut nødvendigt at have praksis på plads for at sikre, at du beskytter dine oplysninger. Mens graden, som du gør disse, varierer afhængigt af din virksomhed, skal du sørge for at tage de nødvendige forholdsregler. Overvåg din store dataproces På ...
Sætter byggemoduleringsgrundlag i stedet - dummies
Du vil få din virksomhed til at kæmpe og BIM klar, men at få grundlæggende forudsætninger er helt i forberedelsen. BIM giver dig mulighed for at oprette nye processer og arbejdsgange og arbejde sammen på dine projekter. BIM er nyttigt i hele projektets tidslinje fra konceptstadiet, konstruktionen og derefter over ...
Sæt dine store data sammen - dummies
Hvordan vil du vide, hvordan du sætter alle dine data sammen? Med et stort dataprojekt angiver, hvad du vil gøre med dine strukturerede og ustrukturerede data, hvorfor du måske vælger et stykke teknologi over en anden. Det bestemmer også behovet for at forstå indgående datastrukturer for at sætte disse data i ...
Fase 6 i CRISP-DM-procesmodellen: Implementering - dummier
Implementering er hvor data minedrift betaler sig. I denne sidste fase af processen CRISP-DM (Cross-Industry Standard Process for Data Mining) er det ligegyldigt, hvor strålende dine opdagelser kan være, eller hvor perfekte dine modeller passer til dataene, hvis du ikke rent faktisk bruger dem ting for at forbedre den måde, du gør forretninger på. Implementeringen ...
Fase 3 i CRISP-DM-procesmodellen: Dataforberedelse - dummier
Data minearbejdere tilbringer det meste af deres tid på den tredje fase af procesmodellen Cross-Industry Standard Process for Data Mining (CRISP-DM): databehandling. De fleste data, der blev brugt til data mining, blev oprindeligt indsamlet og bevaret til andre formål og har brug for en del forfining, før den er klar til brug til modellering. Databehandlingsfasen omfatter ...
Fase 4 i CRISP-DM Process Model: Modeling - dummies
Modellering er den del af procesmodellen Cross-Industry Standard Process for Data Mining (CRISP-DM), som de fleste data minearbejdere bedst kan lide. Dine data er allerede i god form, og nu kan du søge efter nyttige mønstre i dine data. Modelleringsfasen omfatter fire opgaver. Disse er at vælge modelleringsteknikker. Udformning af test (er) Byggemodeller Bedømmer ...
Fase 1 i CRISP-DM procesmodellen: forretningsforståelse - dummies
Korset -industriens standardproces til dataminning (CRISP-DM) er den dominerende procesramme for data mining. I den første fase af et data mining projekt, inden du nærmer dig data eller værktøjer, definerer du, hvad du vil udføre, og definerer årsagerne til, at du vil nå dette mål. Forretningsforståelsesfasen omfatter fire opgaver (primære ...
Sætter de rigtige store data organisatoriske strukturer på plads - dummies
Typisk starter deres rejse til store data ved at starte med et organisatorisk eksperiment for at se, om store data kan spille en vigtig rolle i at definere og påvirke forretningsstrategi. Men når det bliver klart, at store data vil have en strategisk rolle som led i informationsstyringsmiljøet, skal du sørge for at ...
Fase 2 i CRISP-DM-procesmodellen: Dataforståelse - dummier
I anden fase af procesmodellen for krydsindustriens standardproces til data mining (CRISP-DM), får du data og verificerer, at det passer til dine behov. Du kan identificere problemer, der får dig til at vende tilbage til forretningsforståelse og revidere din plan. Du kan endda opdage fejl i din forretningsforståelse, en anden grund til at ...
Reducerer tid til værdi i NoSQL-dummies
Tid til værdi er den tid, der kræves for at starte et it-projekt at være i stand til at realisere forretningsmæssige fordele. Dette kan være konkrete fordele ved omkostningsreduktion eller evnen til at drive nye forretninger eller immaterielle fordele som at yde bedre kundeservice eller produkter. Nøgleværdisbutikker er de enkleste NoSQL-databaser med hensyn til ...
Efterforskning til dine egne data - dummier
Nu hvor du er data minearbejder, er du også en primærforsker. Lyder mere videnskabeligt, ikke? Din forskning er primær, fordi du vil begynde fra rå (grundlæggende, uforarbejdede) data og analysere den for at tilføje noget nyt til verdens viden. Du vil nok også integrere en sekundær forskning i dit arbejde. Med andre ord vil du ...
Rollebaseret adgangskontrol i NoSQL-dummies
En af de mest almindelige metoder til sikring af data i NoSQL er at tildele hver post (eller dokument eller graf, afhængigt af din database type) med et sæt tilladelser knyttet til roller. Dette er rollebaseret adgangskontrol eller RBAC for kort. Overvej en pressemeddelelse for en hjemmeside, der gemmes i en ...
Skalering NoSQL - dummies
Et fælles træk ved NoSQL-systemer er deres evne til at skalere på tværs af mange råvareservere. Disse relativt billige platforme betyder, at du kan skalere databaser ved at tilføje en ny server i stedet for at erstatte gammel hardware med ny, mere kraftfuld hardware i et enkelt skud. Der er tilfælde af høj volumenbrug, der hurtigt vil tvinge dig ...
Regneark, XML og specialdataformater - dummies
Du skal muligvis bruge data, der findes i et regneark , XML (extensible markup language) eller nogen af snesevis af mindre almindelige formater. Nøglespørgsmålet vil altid være: Gør din data-mining ansøgning import data i det format? Så længe din data-mining-applikation har et værktøj til at læse det dataformat, du har brug for, skal processen ...
Indstil Right Foundation for Big Data - dummies
Så hvordan kommer du i gang i din rejse til at skabe det rigtige miljø, så du er klar til at eksperimentere med store data og være parat til at udvide din brug af store data, når du er klar? Skal du investere i nye teknologier til dit datacenter? Kan du udnytte cloud ...