Wireframe Planlægning: Skriv introduktionen til dine infografiske dummier
De fleste infographics har nogle indledende tekst, der sætter scenen og leverer de vigtigste oplysninger. Mange principper for nyhedsskrivning kommer i spil her. Ved at tage en side fra journalister, giver denne tabel nogle do's og don'ts for effektive infografiske introduktioner. Skrive effektive infografiske introduktioner Må ikke være koncise og til det punkt. Giv også ...
Dit infografiske filnavn kan generere trafik - dummies
Hvad er der i et navn? Når det kommer til dit infographic, kan valg af det rigtige navn også hjælpe med med at drive trafik til dit arbejde. Du vil have, at nogen ser posten at vide inden for et til to sekunder, hvad posten handler om. At lære at navngive din grafik godt kræver en grundlæggende forståelse af søgemaskineoptimering ...
Bigtable / Wide Column Store Funktioner i NoSQL Databaser - dummies
Bigtables kloner er en type NoSQL database der opstod fra Googles seminal Bigtable-papir. Bigtables er en meget distribueret måde at styre tabular data på. Disse datatabeller er ikke relateret til hinanden, ligesom de ville være i et traditionelt relational database management system (RDBMS). Her er de vigtigste funktioner fra populære ...
Forretningsmæssige eller missionskritiske egenskaber af NoSQL - dummies
Alle avancerede it-systemer har funktioner, der bliver akut vigtige hvis de bliver brugt til forretnings- eller missionskritiske job. Hvis din organisations omdømme eller dets økonomiske situation vil lide, hvis dit system fejler, så er dit system pr. Definition et enterprise class system. Et godt eksempel på et sådant system i den finansielle services verden ...
Clustering i NoSQL - dummies
NoSQL databaser passer vel til meget store datasæt. Bigtable kloner som HBase er ingen undtagelse. Du vil sandsynligvis gerne bruge flere billige vare servere i en enkelt klynge snarere end en meget kraftig maskine. Dette skyldes, at du kan få den overordnede bedre ydelse pr. Dollar ved at bruge mange vare servere, snarere end et stort ...
Udfordringer ved virtualisering til store data - dummier
Virtualiserede store datamiljøer skal styres og styres på en tilstrækkelig måde besparelser og effektivitetsgevinster. Hvis du stole på store datatjenester for at løse dine analytiske udfordringer, skal du være sikker på, at det virtuelle miljø er så godt styret og sikkert som det fysiske miljø. Nogle af fordelene ved virtualisering, ...
Binære høje og binære søgetræer bruges i algoritmer - dummier
En særlig form for træstruktur er binær bunke, som placerer hver af knudeelementerne i en speciel rækkefølge. Søg træ giver dig mulighed for hurtigt at søge efter data. At hente dataposter, placere dem i rækkefølge i et træ, og derefter søge det pågældende træ er en af de hurtigere måder at finde information på. ...
Bygger på Basic Scatterplots - dummies
Data minearbejdere benytter sig ofte af særlige funktioner til at pakke flere oplysninger til enkle diagrammer. Etiketter, overlejringer og interaktivt valg er kendetegn ved data mining applikationer, særlige funktioner, der giver dig mulighed for at være mere produktive. Kilometertal falder som hestekræfter stiger, som det ses i den følgende figur. Kilometerstand øges med tiden, som du kan se, en scatterplot ...
Kommercielle datakilder - dummies
Du kan lære mere om at bruge kommercielt tilgængelige data til forretnings- og forbrugermarkedsføring ved at forbinde med marketingfolk og marked forskere, der deler dine interesser såvel som dataleverandører. Disse faglige sammenslutninger er et godt udgangspunkt for at skabe kontakter: American Marketing Association, Direct Marketing Association, Advertising Research Foundation. Selvom denne liste kun repræsenterer ...
Kontrollerende case order - dummies
Data minearbejdere sorterer ofte sager (ændrer rækkefølgen af rækker) for at få klarere organisation til visning af data eller eksport. Eller du har måske en funktionel grund til at sortere. For eksempel kræver nogle applikationer sortering af data inden sammensmeltning (sammenføjning af kolonner fra forskellige datakilder). Trinene til sortering varierer meget fra en applikation til en anden. ...
Tæller objekter i en datastrøm - dummier
At lære at telle objekter i en strøm kan hjælpe dig med at finde de hyppigste elementer eller rang sædvanlige og usædvanlige begivenheder. Denne algoritme udnytter hashfunktioner og omtrentlige skitser. Det gør det efter at have filtreret duplikerede objekter og tæller forskellige elementer, der er optaget i datastrømmen. Du bruger denne teknik til at løse problemer som ...
Data Tilgængelig ud over forbrugerdata - dummier
Ikke alle de data, du måtte have brug for, handler om mennesker. Måske er du mere interesseret i virksomheder eller nonprofit organisationer. Måske har du interesse i tordenvejr, ananas eller broer. Intet problem. Kommercielle kilder kan give data til alle disse ting, og mange flere. Hvis der foreligger data, som du værdi nok til at overveje at betale for ...
Kolonne Data i NoSQL - dummies
Kolonneforretninger i NoSQL er ens ved første udseende til traditionelle relationelle DBMS. Begreberne rækker og kolonner er stadig der. Du definerer også kolonnefamilier, før du indlæser data i databasen, hvilket betyder, at strukturen af data skal være kendt på forhånd. Kolonneforretninger organiserer imidlertid data anderledes end relationelle databaser gør. I stedet ...
Data Aggregation - dummies
Opsummering af data, finding af totaler og beregning af middelværdier og andre beskrivende foranstaltninger er sandsynligvis ikke nyt for dig. Når du har brug for dine resuméer i form af nye data, snarere end rapporter, kaldes processen aggregering. Aggregerede data kan danne grundlag for yderligere beregninger, fusioneret med andre datasæt, som på nogen måde anvendes som andre ...
Klynger sociale netværk i grupper - dummier
Folk har tendens til at danne samfund - klynger af andre mennesker, der har ideer og følelser . Ved at studere disse klynger bliver tildeling af visse adfærd til gruppen som helhed lettere (selvom tilskrivning af adfærd til en person er både farlig og upålidelig). Ideen bag studiet af klynger er, at hvis en forbindelse ...
Data Mining Testing Online - dummies
Online-miljøer præsenterer data minearbejdere med en unik blanding af udfordringer og fordele ved dataindsamling og analyse . Her er de dårlige nyheder: Webdataformater kan være vanskelige at importere og manipulere i data-mining applikationer. Systemer, der tjener websider, er ofte dårligt integreret med salgssporingssystemer, hvilket gør det svært at identificere forbindelser mellem ...
Databaser og data mining - dummier
Data, der indsamles af store organisationer i dagligdagen, gemmes normalt i databaser. Men databaseadministratorer kan ikke være villige til at give data minearbejdere direkte adgang til disse datakilder, og direkte adgang er muligvis heller ikke den bedste løsning fra dit synspunkt. Direkte adgang til operationelle (bruges til rutinemæssig ...
Forbrugerdata tilgængelig for datalagere - dummies
For at introducere dig til de former for forbrugeroplysning, der er tilgængelig via kommercielle leverandører, se på et detaljeret eksempel. Tabellen indeholder alle de data, der indsamles om en forbruger af Axciom, en vigtig leverandør af forbrugermarkedsføringsdata. Denne leverandør leverer markedsføringsdata om de enkelte forbrugere og de husholdninger, som disse forbrugere bor i, som følger: ...
Dataadministration til Big Data - dummies
Er store data virkelig nye eller er det en udvikling i data management-rejsen? Det er faktisk begge. Som med andre bølger i datahåndtering er store data bygget oven på udviklingen af datahåndteringspraksis i løbet af de sidste fem årtier. Hvad er nyt er det for første gang, at omkostningerne ...
Data Mining maksimerer Warehouse Club Profits - dummies
Måske har du handlet hos en af lagerklubberne, butikskæder der tilbyder medlemmer, der kun handler i store, uden frillsbutikker. Lagerklubber har blotte betongulve, almindelig funktionelle hylder og begrænsede valg af produkter og pakningsstørrelser. Deres check-out baner tilbyder ikke poser, endsige baggers, at pakke op dine indkøb. Lagerklubber indstillet ...
Databeskyttelsesindstillinger til Big Data - dummies
Nogle store datakyndige mener, at forskellige typer data kræver forskellige former for data beskyttelse og at i nogle tilfælde i et cloud-miljø, kan datakryptering faktisk overkilles. Du kan kryptere alt. Du kan f.eks. Kryptere data, når du skriver det til din egen harddisk, når du sender det til ...
Fælles funktioner i NoSQL - dummies
NoSQL bøger og blogs giver forskellige meninger om, hvad en NoSQL database er. Fire grundlæggende funktioner i NoSQL, der vises i den følgende liste, gælder for de fleste NoSQL-databaser. Listen sammenligner NoSQL med traditionelle relationelle DBMS: Schema agnostic: Et databaseskema er beskrivelsen af alle mulige data og datastrukturer i en relationsdatabase. ...
Er elementerne i datasættet ukorreleret? - dummies
Til et datasæt, der består af observationer taget på forskellige tidspunkter (det vil sige tidsseriedata), er det vigtigt at afgøre, om observationerne er korrelerede med hinanden. Dette skyldes, at mange teknikker til modellering af tidsseriedata er baseret på antagelsen om, at dataene er ukorrelerede med hinanden ...
3 Typer maskinlæring - dummies
Maskinindlæring kommer i mange forskellige smagsoplevelser afhængigt af algoritmen og dens mål. Du kan opdele maskininlæringsalgoritmer i tre hovedgrupper baseret på deres formål: Overvåget læring Uopfyldt læring Forstærkning læring Overvåget læring Overvåget læring sker, når en algoritme lærer fra eksempeldata og tilhørende mål svar, der kan bestå af numeriske ...
Basics of Classification Models for Analytical Predictions - dummies
Når du har alle de nødvendige værktøjer og data til at begynde at skabe en prædiktiv model begynder det sjovt. Generelt skaber en læringsmodel for klassifikationsopgaver følgende trin: Indlæs dataene. Vælg en klassifikator. Træn modellen. Visualiser modellen. Test modellen. Vurder modellen. Både logistisk regression og ...
Anvendelse af hovedkomponentanalyse til prædiktiv analyse - dummier
Hovedkomponentanalyse (PCA) er en værdifuld teknik, der er bredt anvendt i prædiktiv analyse og datalogi. Det studerer et datasæt for at lære de mest relevante variabler, der er ansvarlige for den højeste variation i datasættet. PCA bruges mest som en data reduktion teknik. Mens du bygger prædiktive modeller, kan du muligvis reducere ...
8 Bedste Practices in Data Preparation - dummies
Statistiske softwarepakker er yderst magtfulde i disse dage, men de kan ikke overvinde fattige kvalitetsdata. Følgende er en tjekliste over ting, du skal gøre, før du går ud af at bygge statistiske modeller. Kontroller dataformater Din analyse starter altid med en rå datafil. Rå datafiler findes i mange forskellige former og størrelser. Mainframe ...
Autokorrelationsplotter: Grafisk Teknik til Statistiske Data - Dummier
En autokorrelationsplot viser egenskaberne af en type data kendt som en tidsserie. En tidsserie refererer til observationer af en enkelt variabel over en bestemt tidshorisont. For eksempel er den daglige pris på Microsoft-lager i løbet af 2013 en tidsserie. Tværsnitsdata refererer til observationer om mange variabler ...
10 Gratis ressourcer til datalogi - dummier
En fremragende ting om datalogi er, at du ikke behøver at bruge mange penge på software og kilde data for at begynde at høste fordelene. Du kan simpelthen starte med dine egne data og begynde at bruge open source applikationer eller programmeringssprog for at begynde at udlede værdifulde indsigter. Selv ...
Alternative Big Data Solutions - dummies
Ser forbi Hadoop, du kan se alternative store dataløsninger i horisonten. Disse løsninger gør det muligt at arbejde med store data i realtid eller bruge alternative databaseteknologier til at håndtere og behandle det. Her er du introduceret i real-time-behandlingsrammerne, derefter platformene for massivt parallelforarbejdning (MPP) og endelig NoSQL ...
Grundlæggende om datatyper og strukturer i R-programmering til prædiktiv analyse - dummier <[SET:descriptionda]I R-programmering til forudsigende Analytics
I R-programmering til forudsigende Analytics
10 Måder at forbedre dine maskinindlæringsmodeller - dummies
Nu hvor du er maskinlæringsalgoritme er færdig lære af dataene opnået ved hjælp af python eller r, du overvejer resultaterne fra dit test sæt og spekulerer på, om du kan forbedre dem eller virkelig har nået det bedst mulige resultat. Der er en række kontroller og handlinger, der antydes på metoder, du kan bruge ...
Grundlæggende om R Programmering til Prediktiv Analytics - Dummies
R er et programmeringssprog, der oprindeligt er skrevet for statistikere til at gøre statistiske analyse, herunder prædiktiv analyse. Det er open source software, der anvendes i vid udstrækning i akademiet til at undervise i sådanne discipliner som statistik, bioinformatik og økonomi. Fra den ydmyge begyndelse er den siden blevet udvidet til at gøre datamodellering, data mining og prædiktiv analyse. R har en meget aktiv ...
Basics of Content-Based Predictive Analytics Filters - Dummies
Indholdsbaserede predictive analytics Recommender systemer (tagget søgeord) blandt lignende poster og brugerens profil til at fremsætte anbefalinger. Når en bruger køber et emne, der har tagget funktioner, anbefales det, at elementer med funktioner, som svarer til de originale genstande, anbefales. Jo flere funktioner matcher, jo højere er sandsynligheden, som brugeren vil lide ...