Hjem Personlig finansiering Hvordan man bruger Apache Mahout til Predictive Analytics - dummies

Hvordan man bruger Apache Mahout til Predictive Analytics - dummies

Video: Unboxing af MSI Apache pro Bærbar 2025

Video: Unboxing af MSI Apache pro Bærbar 2025
Anonim

Apache Mahout er et open source-værktøj, der er unikt nyttigt i prædiktiv analyse. Dette maskine-læring bibliotek indeholder omfattende versioner af clustering, klassificering, samarbejdsfiltrering og andre data-mining algoritmer, der kan understøtte en storformet predictive analytics model.

En stærkt anbefalet måde at behandle de data, der er nødvendige for en sådan model, er at køre Mahout i et system, der allerede kører Hadoop. Hadoop betegner en mastermaskine, der orkestrerer de andre maskiner (som f.eks. Kortmaskiner og Reducer maskiner), der er ansat i sin distribuerede behandling. Mahout skal installeres på den pågældende mastermaskine.

Forestil dig, at du har stor mængde af streamede data - Google nyhedsartikler - og du vil gerne gruppere efter emne ved hjælp af en af ​​klyngningsalgoritmerne. Når du har installeret Hadoop og Mahout, kan du udføre en af ​​algoritmerne - som f.eks. K-means - på dine data.

Gennemførelsen af ​​K-midler under Mahout bruger en MapReduce tilgang, hvilket gør det anderledes end den normale implementering af K-midler. Mahout opdeler K-middelalgoritmen i disse underprocedurer:

  • KmeansMapper læser inddata datasættet og tildeler hvert indgangspunkt til dets nærmeste oprindeligt valgte middel (klyngerrepræsentanter).

  • KmeansCombiner proceduren vil tage alle de registreringer - par - produceret af KmeansMapper og producerer delbeløb for at lette beregningen af ​​de efterfølgende klyngerrepræsentanter.

  • KmeansReducer modtager værdierne produceret af alle subtaskerne (combiners) for at beregne de faktiske centroider af klyngerne, som er den endelige udgang af K-midler.

  • KmeansDriver håndterer iterationerne af processen, indtil alle klynger har konvergeret. Udgangen af ​​en given iteration, en delvis clustering output, bruges som input til den næste iteration. Processen med kortlægning og reduktion af datasættet indtil tildeling af poster og klynger viser ingen yderligere ændringer.

Apache Mahout er et nyligt udviklet projekt; dets funktionalitet har stadig meget plads til at rumme udvidelser. I mellemtiden bruger Mahout allerede MapReduce til at implementere klassificering, clustering og andre maskinlæringsteknikker - og det kan i vid udstrækning gøres.

Hvordan man bruger Apache Mahout til Predictive Analytics - dummies

Valg af editor

Middelhavsret Opskrifter: Kretiske Kyllingretter - Dummies

Middelhavsret Opskrifter: Kretiske Kyllingretter - Dummies

Grillning og braising er de mest populære måder at lave mad kød på Kreta; kombineret med friske urter og krydderier og traditionelle fødevarer som yoghurt, ost og oliven, skaber disse teknikker kyllingevarer med en masse smag. Sautéed Kyllingebryst i Rødvin Tomat Sauce Forberedelsestid: 10 minutter Kogetid: 45 minutter ...

Middelhavs kost Opskrifter: Pasta med kød - dummies

Middelhavs kost Opskrifter: Pasta med kød - dummies

En fantastisk måde at lave en one-pot Middelhavet måltid er at tilføje nogle slags kød, såsom kylling, svinekød eller oksekød, til din pasta. Tilsæt nogle grøntsager og en frisk sovs, og du har et komplet måltid. Brug af kød er en god måde at tilføje mere volumen til din pasta, så du ikke gør det.

Middelhavs Diet Opskrifter: Entree Salater - Dummies

Middelhavs Diet Opskrifter: Entree Salater - Dummies

Selvom entree salat er mere populært i USA og Canada, kan du stadig skabe et middelhavs-inspireret måltid ved at kombinere friske råvarer med proteinkilder som laks eller kylling. Entree salater er også et godt sommermåltid for at fejre de fødevarer, der er i sæson. Grillet laks med karameliserede løg over blandede grønne ...

Valg af editor

Opret en samlingsklasse i Java-dummier

Opret en samlingsklasse i Java-dummier

En samlingsklasse i Java-kode er en klasse, hvis job skal opbevares en flok objekter ad gangen - en flok stringsobjekter, en flok BagOfCheese objekter, en flok tweets eller hvad som helst. Du kan oprette en samlingsklasse med denne kode. pakke com. allmycode. samlinger; importer java. util. ArrayList; offentlig klasse SimpleCollectionsDemo {...

Lav en abstrakt klasse i Java-dummier

Lav en abstrakt klasse i Java-dummier

En abstrakt klasse i Java er en klasse, der indeholder en eller flere abstrakte metoder, der simpelthen er metoden deklarationer uden en krop - det vil sige uden eksekverbar kode, der gennemfører klassen eller metoden. En abstrakt metode er som en prototype til en metode, der erklærer metodeens returtype og parameterliste, men ikke ...

Hvordan man skaber tegnfelter i Java - dummier

Hvordan man skaber tegnfelter i Java - dummier

Her lærer du hvordan du kan bruge en char variabel snarere end et helt tal i en Java-switch statement. Når du bruger en karetype, er det almindeligt at give to på hinanden følgende case-konstanter for hver case-gruppe, for at tillade både små og store bogstaver. Antag at du skal indstille kommissionsrenten for ...

Valg af editor

Koordinering mellem IT og Cloud Provider Service Desks - dummies

Koordinering mellem IT og Cloud Provider Service Desks - dummies

I et cloud computing miljø, skal du effektivt styre koordinationen er nødvendig mellem din virksomhed IT og cloud udbyder service skrivebord. Dine interne kunder er nødt til at stole på, at it-tjenester leveres som forventet, og spørgsmål vil blive rettet hurtigt. Din organisation skal overvåge hele miljøet baseret på servicekrav til din ...

Opbygge din Hybrid Cloud Service Management Plan - dummies

Opbygge din Hybrid Cloud Service Management Plan - dummies

Et vigtigt krav til hybrid cloud service management er at lave en plan på plads, hvilket indebærer at forstå, hvilke cloud services du introducerer i din virksomhed, og hvordan de skal interagere med dine data center aktiver. Nu skal du træffe beslutsomhed om hvilke tjenester du skal kontrollere, fordi de kan påvirke ...

Fordele ved en serviceorienteret tilgang i Cloud Computing - dummies

Fordele ved en serviceorienteret tilgang i Cloud Computing - dummies

Den stigende vedtagelse af hybrid sky Miljøer kan være direkte forbundet med den succes, virksomhederne har gjort i at flytte til en serviceorienteret tilgang til it. Serviceorientering er en måde at modulere vigtige forretningstjenester på og etablere veldefinerede grænseflader designet til at sikre, at disse tjenester fungerer i mange forskellige situationer. Dette tiltag til service ...