Sådan bruger du Big Data Analytics til at øge kundeloyalitet - dummier
Når du samler dine store data , hvad er dit næste skridt? I dag er kundeloyalitet afgørende, fordi kunden er i førersædet, når det drejer sig om at vælge hvordan man interagerer med en tjenesteudbyder. Dette gælder i mange brancher. Køberen har mange flere kanalindstillinger og er i stigende grad ...
Sådan bruges kompleks hændelsesbehandling til store data - dummier
Kompleks hændelsesbehandling (CEP) er nyttig for store data, fordi den er beregnet til at styre data i gang. Kompleks hændelsesbehandling er en teknik til sporing, analyse og behandling af data, når en hændelse sker. Disse oplysninger behandles og meddeles derefter ud fra forretningsregler og processer. Ideen bag CEP er at kunne ...
Hvordan man bruger Apache Hadoop til Predictive Analytics - dummies
Apache Hadoop er en gratis software til open source platform til at skrive og køre applikationer, der behandler en stor mængde data til prædiktiv analyse. Det muliggør en distribueret parallel behandling af store datasæt genereret fra forskellige kilder. Grundlæggende er det et effektivt værktøj til lagring og behandling af store data. Hadoop lagrer enhver type data, struktureret eller ...
Sådan bruges kurve montering i Predictive Analytics - dummies
Kurve montering er en proces, der anvendes i prædiktiv analyse i som målet er at skabe en kurve, der viser den matematiske funktion, som bedst passer til de faktiske (originale) datapunkter i en dataserie. Kurven kan enten passere gennem hvert datapunkt eller forblive inden for størstedelen af dataene, idet du ignorerer nogle data ...
Sådan bruges data streaming til store data - dummier
Nogle gange når virksomheder nærmer sig store data, står virksomheder overfor med enorme mængder data og en lille ide om hvor de skal gå næste. Indtast datastreaming. Når en betydelig mængde data skal behandles hurtigt i næsten real tid for at få indsigt, er data i bevægelse i form af streamingdata det bedste svar. ...
Sådan bruges Predictive Analysis Decision Træer til at forudsige fremtiden - dummies
Et beslutningstræ er en tilgang til prædiktiv analyse, som kan hjælpe dig med at træffe beslutninger. Antag for eksempel, at du skal beslutte, om du skal investere en vis sum penge i en af tre forretningsprojekter: en fødevareforretning, en restaurant eller en boghandel. En forretningsanalytiker har udarbejdet fejlfrekvensen ...
Hvordan man bruger varebaserede samarbejdsvilkår i prædiktiv analyse - dummier
En af Amazons anbefalede systemer til prædiktiv analyse anvender elementbaseret samarbejdsfiltrering - udslugning af en enorm fortegnelse over produkter fra virksomhedens database, når en bruger får vist et enkelt emne på hjemmesiden. Du ved, at du kigger på et produktbaseret samarbejdsfiltreringssystem (eller ofte et indholdsbaseret system), hvis det viser dine anbefalinger på ...
Sådan bruges dataudjævning i Predictive Analytics - dummies
Dataudjævning i prædiktiv analyse forsøger i det væsentlige at finde "signalet" i "støj" ved at kassere datapunkter, der betragtes som "støjende". Tanken er at skærpe mønstre i dataene og fremhæve tendenser dataene peger på. Implikationen bag dataudjævning er, at dataene består af to dele: en ...
Sådan bruger du overvåget Analytics til at træne prædiktive modeller - dummier
I overvåget analyse, både input og foretrukne output er en del af træningsdataene. Præventive analysemodeller præsenteres med de rigtige resultater som en del af dets læringsproces. Sådan overvåget læring forudsætter præ-klassificerede eksempler: Målet er at få modellen til at lære af den tidligere kendte klassifikation, så den kan mærke korrekt
Hvordan man bruger Apache Mahout til Predictive Analytics - dummies
Et open source-værktøj, der er unikt nyttigt i predictive analytics er Apache Mahout. Dette maskine-læring bibliotek indeholder omfattende versioner af clustering, klassificering, samarbejdsfiltrering og andre data-mining algoritmer, der kan understøtte en storformet predictive analytics model. En stærkt anbefalet måde at behandle de data, der er nødvendige for en sådan model, er at køre Mahout i ...
Lineær regression i prædiktiv analyse - dummier
Lineær regression er en statistisk metode, der analyserer og finder forhold mellem to variabler. I predictive analytics kan den bruges til at forudsige en fremtidig numerisk værdi af en variabel. Overvej et eksempel på data, der indeholder to variabler: Tidligere data, der består af ankomsttider for et tog og den tilsvarende forsinkelsestid. Antag ...
Sådan bruger du Predictive Analytics til tilfredsstillelse af kunder - dummies
Globale konkurrencestyringsfirmaer sænker priserne for at tiltrække nye kunder. Heldigvis kan predictive analytics hjælpe her. Virksomhederne stræber efter at tilfredsstille deres kunder og få nye; kunderne efterspørger i stigende grad produkter af høj kvalitet til billigere priser. Som reaktion på disse pres forsøger virksomhederne at levere den rette balance mellem kvalitet og pris på det rigtige tidspunkt ...
Hvordan man bruger python til at udvikle grafer til datalogi - dummier
Grafer er nyttige for datavidenskabsfolk . En graf er en gengivelse af data, der viser forbindelserne mellem datapunkter ved hjælp af linjer i Pythopn. Formålet er at vise, at nogle datapunkter vedrører andre datapunkter, men ikke alle de datapunkter, der vises på grafen. Tænk på et kort over en metrostation ...
Sådan bruger du Python til at vælge de rigtige variabler for datalogi - dummier
Vælge korrekte variabler i Python kan forbedre læringsprocessen i datalogi ved at reducere mængden af støj (ubrugelig information), som kan påvirke elevens skøn. Variabelt valg kan derfor effektivt reducere forudsigelsens varians. For at involvere bare de nyttige variabler i træning og udlade de overflødige, vil du ...
Sådan visualiserer du din models analytiske resultater: Skjulte grupperinger, dataklassifikationer og udlæsere - dummier
Visualisering af resultaterne af din forudsigelsesanalyse hjælper virkelig interessenterne med at forstå de næste trin. Her er nogle måder at bruge visualiseringsteknikker til at rapportere resultaterne af dine modeller til interessenterne. Sådan visualiseres skjulte grupperinger i dine data Dataklyngning er processen med at opdage skjulte grupper af relaterede elementer inden for ...
Sådan visualiseres Predictive Analysis Raw data - dummies
Et billede er tusind ord ordentligt - især når du forsøger at få et godt håndtag på dine prædiktive analysedata. Ved forbehandlingstrinnet er det almindeligt at visualisere, hvad du har i hånden, mens du forbereder dine data, inden du fortsætter til næste trin. Du starter med at bruge et regneark som ...
Identifikation af manglende data til maskinundervisning - dummier
Selvom du har tilstrækkelige eksempler til rådighed til træning af både enkle og komplekse Maskininlæringsalgoritmer, de skal præsentere komplette værdier i funktionerne uden manglende data. At have et ufuldstændigt eksempel gør det muligt at forbinde alle signalerne inden for og mellem funktioner. Manglende værdier gør det også vanskeligt for algoritmen at lære under ...
Kigger på grundlaget for statistik, maskinlæring og matematiske metoder i datalogi - dummies
Hvis statistikker er blevet beskrevet som videnskaben om at udlede indsigter fra data, hvad er forskellen mellem en statistiker og en datavidenskabsmand? Godt spørgsmål! Selvom mange opgaver inden for datalogi kræver en ret smule statistisk viden, er omfanget og bredden af en datavidenskabers viden og færdighedsbase forskellig fra ...
Gør data for e-handelsvækst - dummier
Datavidenskab i e-handel tjener samme formål som det gør i enhver anden disciplin - at udlede værdifulde indsigter fra rå data. I e-handel søger du dataindblik, som du kan bruge til at optimere et varemærkes markedsafkast (ROI) og drive vækst i hvert lag i salgstragten. Hvordan ...
Maskinindlæring: Oprettelse af egne egenskaber i data - dummier
Sommetider er de rå data, du får fra forskellige Kilder vil ikke have de funktioner, der er nødvendige for at udføre maskinindlæringsopgaver. Når dette sker, skal du oprette dine egne funktioner for at opnå det ønskede resultat. Oprettelse af en funktion betyder ikke at skabe data fra tynd luft. Du opretter nye funktioner fra eksisterende data. Forstå behovet ...
Gør positive virkninger med miljøunderretning - dummier
Elva er et skinnende eksempel på, hvordan miljøintelligens teknologier kan bruges til at gøre en positiv indvirkning. Denne gratis platform med open source letter kortlægning af årsager og datavisualisering til valgovervågning, krænkelse af menneskerettigheder, miljøforringelse og katastroferisiko i udviklingslande. I et af sine nyere projekter har Elva arbejdet med ...
Modellering Rejsebehov i kriminel aktivitet - dummies
Modellering af rejseefterspørgslen efter kriminel aktivitet giver dig mulighed for at beskrive og forudsige kriminelle rejsemønstre, så retshåndhævelsen kan bruge disse oplysninger i taktisk planlægning. Hvis du vil forudsige de mest sandsynlige ruter, som kriminelle vil tage imellem de steder, hvorfra de starter, og de steder, hvor ...
Matematisk modellering med markovkæder og stokastiske metoder - dummier
En stokastisk model er et værktøj, som du kan bruge at estimere sandsynlige resultater, når en eller flere modelvariabler ændres tilfældigt. En Markov-kæde - også kaldet en diskret tid Markov-kæde - er en stokastisk proces, der fungerer som en matematisk metode til at kæde sammen en række tilfældigt genererede variabler, der repræsenterer ...
Minedrift Dine data ved hjælp af datalogi - dummier
I æra med store data ser ud til, at organisationer af alle former og størrelser er på en ansættelsessøgning. De ønsker at ansætte datavidenskabsmænd, så de kan bruge data og datainformeret beslutningstagning til at tilføre værdi til deres organisation og forblive konkurrencedygtige. Desværre forstår de fleste organisationer og deres ledere ikke rigtigt ...
Manglende værdier i dine data - dummies
En af de hyppigste og mest beskedne dataproblemer, der skal håndteres, mangler data. Filerne kan være ufuldstændige, fordi optegnelser blev tabt eller en lagerenhed fyldt op. Eller visse datafelter kan muligvis ikke indeholde data for nogle poster. Det første af disse problemer kan diagnosticeres ved blot at verificere optegnelser for filer. ...
Nye arbejdsmuligheder med maskinundervisning - dummies
Du kan finde mere end et par artikler, der diskuterer tab af job at maskinindlæring og tilhørende teknologier vil medføre. Roboter udfører allerede en række opgaver, der plejede at ansætte mennesker, og denne brug vil stige over tid. Du skal også have overvejet, hvordan disse nye anvendelser potentielt kunne koste dig ...
Faser af Data Mining Processen - dummies faser af data mining processen
Cross Industry Industry Process for Data Mining (CRISP-DM) > faser af data mining processen
Optimering af krydsvalideringsvalg i maskinundervisning - dummier
At kunne validere en maskinundervisningshypotese muliggør effektivt yderligere optimering af din valgte algoritme. Algoritmen giver det meste af den prædiktive ydeevne på dine data, da den er i stand til at detektere signaler fra data og tilpasse den sande funktionelle form af den prædiktive funktion uden overfitting og generere stor varians af estimaterne. Ikke ...
Roman Visualisering i Prediktiv Analytics - dummier
En visualisering kan repræsentere en simulering (en billedlig fremstilling af et what-if scenario ) i prædiktiv analyse. Du kan følge op med en visualisering af en forudsigelse med en simulering, der overlapper og understøtter forudsigelsen. For eksempel, hvad sker der, hvis virksomheden stopper fremstilling af produkt D? Hvad sker der, hvis en naturkatastrofe rammer hjemmekontoret? ...
Predictive Analytics: At vide, hvornår man skal opdatere din model - dummier
Så meget som du måske ikke kan lide det , dit predictive analytics job er ikke overstået, når din model bliver levende. Succesfuld implementering af modellen i produktionen er ikke tid til at slappe af. Du skal nøje overvåge dens nøjagtighed og ydeevne over tid. En model har tendens til at nedbrydes over tid (nogle hurtigere end andre); og ...
Prediktive rumlige modeller for kriminalitetsanalyse - dummier
Du kan indarbejde prædiktive statistiske modeller i kriminalanalysemetoder til at producere analyser beskrive og forudsige, hvor og hvilken slags kriminel aktivitet der sandsynligvis vil forekomme. Prediktive rumlige modeller kan hjælpe dig med at forudsige adfærd, placering eller kriminelle aktiviteter for gentagne lovovertrædere. Du kan også anvende statistiske metoder til spatio-temporale data for at fastslå ...
Sandsynlighed Fordeling i statistisk analyse af Big Data - dummies
Sandsynlighedsfordelinger er en af mange statistiske teknikker, der kan bruges til at analysere data for at finde nyttige mønstre. Du bruger en sandsynlighedsfordeling til at beregne sandsynlighederne forbundet med elementerne i et datasæt: Binomialfordeling: Du vil bruge binomialfordelingen til at analysere variabler, som kun kan antage en af to værdier. For ...
Quandl Open Data - dummies
Quandl er et Toronto-baseret websted, der har til formål at være en søgemaskine til numeriske data. I modsætning til de fleste søgemaskiner genereres dets database ikke automatisk af edderkopper, der kryber på nettet. Det fokuserer snarere på linkede data, der opdateres via crowdsourcing - opdateres manuelt via menneskelige kuratorer, med andre ord. Fordi de fleste økonomiske data er ...
Forebyggelse af datasikkerhedskatastrofer - dummier
Dataregistrering er et stort problem for data minearbejdere. Nyhedsrapporter, der beskriver niveauet for personoplysninger i hænderne på den amerikanske regering, National Security Agency og brud på kommercielle datakilder har øget offentlighedens bevidsthed og bekymring. Et centralt koncept i personoplysninger er personligt identificerbare oplysninger (PII) eller data, der kan ...
ÅBning af åbne data og dens rolle i prædiktiv analyse - dummier
ÅBne data kunne blive et meget nyttigt værktøj til predictive analytics. Bob Lytle, administrerende direktør for rel8ed. til og senest kendt som den tidligere CIO for TransUnion Canada, er en førende indsats for brugen af offentlig information som en alternativ og strategisk datakilde til forudsigelig modellering inden for finansielle tjenesteydelser og forsikringssektorer. Åbn ...
Statistikkens rolle i maskinundervisning - dummies
Nogle websteder online ville have dig til at tro på, at statistik og maskinindlæring er to helt forskellige teknologier. For eksempel, når du læser Statistik vs. Machine Learning, kæmpe! , du får ideen om, at de to teknologier ikke kun er forskellige, men ligefrem fjendtlige mod hinanden. Faktum er, at statistik og maskinindlæring har en ...
Efter data med Federal Data Portal - dummies
Inden du begynder at søge data for at minde på data . gov, den føderale dataportal, du skal forstå en ting: Der er ingen data på webstedet. Data. gov er hjemsted for et datakatalog, en liste over datasætnavne med detaljer som beskrivelser, formater og webadresser for at få data og yderligere oplysninger. Dataene selv ...