Hjem Personlig finansiering Dimensionering Din Hadoop Cluster - dummies

Dimensionering Din Hadoop Cluster - dummies

Video: Varmehjul.dk - Dimensionering af køle- og varmeanlæg 2025

Video: Varmehjul.dk - Dimensionering af køle- og varmeanlæg 2025
Anonim

Tilpasning af ethvert databehandlingssystem er lige så meget en videnskab som den er en kunst. Med Hadoop overvejer du de samme oplysninger som du ville med en relationsdatabase. For det meste skal du vide, hvor meget data du har, estimere dens forventede vækstrater og fastlægge en retentionspolitik (hvor lang tid at holde dataene).

Svarene på disse spørgsmål tjener som dit udgangspunkt, som er uafhængigt af ethvert teknologirelateret krav.

Når du har bestemt, hvor meget data du skal opbevare, kan du starte factoring i Hadoop-specifikke overvejelser. Antag at du har et teleselskab, og du har fastslået, at du har brug for 750 terabyte (TB) lagerplads til sine logopdateringsdokumenter (CDR). < Du beholder disse registre for at overholde regeringsforskrifter, men du kan også analysere dem o se churn mønstre og overvåge netværk sundhed, for eksempel. For at bestemme, hvor meget lagerplads du har brug for, og som følge heraf, hvor mange racks og slave noder du har brug for, udfører du dine beregninger med disse faktorer i tankerne:

Replication:
  • Standard replikationsfaktoren for data i HDFS er 3. De 500 terabyte af CDR-data til teleselskabet i eksemplet bliver derefter til 1500 terabyte. Bytteplads:

  • Enhver analyse eller behandling af dataene ved MapReduce kræver yderligere 25 procent af pladsen til at gemme eventuelle foreløbige og endelige resultatgrupper. (Teleselskabet har nu brug for 1875 terabyte lagerplads.)

    Komprimering:
  • Teleselskabet gemmer CDR'erne i en komprimeret form, hvor det gennemsnitlige kompressionsforhold forventes at være 3: 1. Du har nu brug for 625 terabyte. Antal slave noder:

  • Forudsat at hver slave node har tolv 3TB-drev dedikeret til HDFS, har hver slave node 36 terabyte rå HDFS-lagerplads, så selskabet har brug for 18 slave noder. Antal racks:

  • Da hver slave node bruger 2RU, og firmaet i eksemplet har brug for tre master noder (1RU stykke) og to ToR-switche (1RU stykke), skal du have i alt 41RU. Det er 1RU mindre end den samlede kapacitet i en standard rack, så en enkelt rack er tilstrækkelig til denne implementering. Uanset at der ikke er plads tilbage til vækst i denne klynge, er det forsigtigt at købe et andet rack (og to yderligere ToR-switche) og opdele slaveknyderne mellem de to racks.

    Testing:

  • Vedligeholdelse af en testklynge, der er en mindre skala repræsentation af produktionsklyngen, er en standard praksis. Det behøver ikke at være enormt, men du vil have mindst fem dataduder, så du får en præcis repræsentation af Hadops adfærd.Som med ethvert testmiljø skal det isoleres på et andet netværk fra produktionsklyngen. Sikkerhedskopiering og katastrofeinddrivelse:

  • Som ethvert produktionssystem skal teleselskabet også overveje backup- og katastrofegendannelseskrav. Dette firma kunne gå så langt som at skabe en spejlklynge for at sikre, at de har en varm standby for hele deres system. Dette er selvfølgelig den dyreste løsning, men passer til miljøer, hvor konstant oppetid er kritisk. I det mindste dyre ende af spektret (uden at sikkerhedskopiere dataene i det hele taget) kunne teleselskabet regelmæssigt sikkerhedskopiere alle data (herunder dataene selv, applikationer, konfigurationsfiler og metadata), der lagres i deres produktionsklynge at tape. Med tape er dataene ikke umiddelbart tilgængelige, men det vil muliggøre en katastrofeinddrivningsindsats, hvis hele Hadoop-klyngen mangler.

    Som med din egen computer, når den primære harddisk fylder med plads, sænker systemet betydeligt. Hadoop er ingen undtagelse. Også en harddisk udfører bedre, når den er mindre end 85 til 90 procent fuld. Med disse oplysninger i tankerne, hvis ydeevnen er vigtig for dig, bør du opbygge swap-spacefaktoren fra 25 til 33 procent.

Dimensionering Din Hadoop Cluster - dummies

Valg af editor

Landskabsfoto - Sanibel Sentinel - Dummies

Landskabsfoto - Sanibel Sentinel - Dummies

Florida's Sanibel Island er en skattekiste for naturfotografen. Ding Darling Refuge er fuld af fugle og andet indfødt dyreliv. Et blusteri Januar dagen, solen synkende lavt; med de høje skyer så det ud som om solnedgangen ville være spektakulært. Dette billede blev fotograferet et par minutter efter solnedgangen. Kamera indstillinger ...

Landskabsfoto - Solnedgang i Paradis - Dummies

Landskabsfoto - Solnedgang i Paradis - Dummies

Dette landskabsbillede blev taget i Caspersen Beach i Venedig, Florida. Dette billede blev fotograferet om vinteren. Vinter i Florida er et hårdt arbejde, men nogen skal gøre det. Kameraindstillinger ISO-indstilling 100: Der var masser af lys, så fotografen gik med en lav ISO-indstilling. Eksponeringskompensation -1/3 EV: Underexposing solnedgange ...

Landskabsfoto - Tag den høje trail - dummies

Landskabsfoto - Tag den høje trail - dummies

Dette billede blev fotograferet i Myakka River State Park nær Sarasota, Florida. Parken er smuk med mange miles af stier. Denne sti slingrer gennem en frodig eng med prikker med dejlige træer. Solen synkende lavt og dejlige skyer var i himlen. Et polariserende filter blev føjet til linsen, mørkere bluesen ...

Valg af editor

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Excel 2013 gør det nemt at oprette en nyt pivottabel ved hjælp af en dataliste valgt i dit regneark med dets nye Quick Analysis-værktøj. For at forhåndsvise forskellige typer af pivottabeller, som Excel kan oprette til dig på stedet, bruger indtastningerne i en dataliste, som du har åbnet i en Excel ...

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Et problem, du kan løbe ind, når du importerer data til Excel, er at dine tekstetiketter måske ikke ser rigtigt ud. Du kan holde dine data rene med følgende tekstfunktioner. FIND-funktionen FIND-funktionen finder starttekstpositionen for en tekststreng i en anden tekststreng. For eksempel, hvis du ...

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Funktionerne DSTDEV og DSTDEVP i Excel beregner en standardafvigelse. DSTDEV beregner standardafvigelsen for en prøve. DSTDEVP beregner standardafvigelsen for en population. Som med andre databasestatistiske funktioner, er den unikke og virkelig nyttige funktion af DSTDEV og DSTDEVP, at du kan angive, at du kun vil have listeoptegnelser, der ...

Valg af editor

Basic Photoshop CS5-kommandoer - dummies

Basic Photoshop CS5-kommandoer - dummies

Bliver fortrolig med Photoshop CS5-programvinduet er en god måde at få din kuglelejer på. før du dyker ind i Photoshops værktøjer og kommandoer. Her er et par grundlæggende tips: Start Photoshop ved at klikke på Start-menuen eller et ikon på proceslinjen (Windows) eller klikke på Photoshop-ikonet på Dock (Mac). Du kan også ...

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop har flere filtre, som du kan bruge på stort set ethvert billede, der skal forbedres eller finesse det. De fleste billeder, for eksempel, drage fordel af mindst en smule skarphed for at forbedre detaljerne i billedet. I nogle tilfælde vil du reducere den synlige detalje i et billede på nogle områder til ...

Værktøjskasse Genveje i Photoshop 6 - dummier

Værktøjskasse Genveje i Photoshop 6 - dummier

For at hjælpe dig med at manipulere billeder, Photoshop 6 tilbyder en værktøjskasse med en hel masse nyttige værktøjer. Du klikker på Photoshop-ikonet og nogle gange en anden nøgle eller to for at få adgang til værktøjerne, der gør arbejde og afspilning med Photoshop 6 så sjovt. Nedenstående tabel viser værktøjskassebillederne og deres genvejstaster. Hvis du ...