Hjem Personlig finansiering Image Klassificering med Hadoop-dummies

Image Klassificering med Hadoop-dummies

Video: Landuse Classification from Satellite Imagery using Deep Learning 2025

Video: Landuse Classification from Satellite Imagery using Deep Learning 2025
Anonim

Billedklassificering kræver En betydelig mængde databehandlingsressourcer, der imidlertid har begrænset omfanget af implementeringer. Billedklassifikation er et varmt emne i Hadoop-verdenen, fordi ingen mainstream-teknologi var i stand til - indtil Hadoop kom sammen - at åbne døre for denne slags dyre behandling i så stor og effektiv skala.

Billedklassifikation starter med ideen om at du opbygger et træningssæt, og at computere lærer at identificere og klassificere, hvad de ser på. På samme måde som at have flere data hjælper med at opbygge bedre opdagelses- og risikomodeller, hjælper det også systemer til bedre at klassificere billeder.

I dette brugs tilfælde benævnes dataene som træningssættet samt modellerne er klassifikatorer. Klassifikatorer genkende funktioner eller mønstre inden for lyd, billede eller video og klassificere dem passende. Klassifikatorer er bygget og iterativt raffineret fra træningssæt, så deres præcisionsresultater (en måling af præcision) og tilbagekaldingsresultater (et mål for dækning) er høje. Hadoop er velegnet til billedklassificering, fordi den giver et massivt parallelbehandlingsmiljø for ikke kun at oprette klassificeringsmodeller (iteration over træningssæt), men også give næsten grænseløs skalerbarhed til at behandle og køre disse klassifikatorer på tværs af massive sæt ustrukturerede datamængder.

Overvej multimediekilder som YouTube, Facebook, Instagram og Flickr - alle er kilder til ustrukturerede binære data. Figuren viser en måde, hvorpå Hadoop kan scalere behandlingen af ​​store mængder lagrede billeder og video til multimedie semantisk klassificering.

Du kan se, hvordan alle de begreber, der vedrører Hadoop-behandlingsrammen, anvendes på disse data. Bemærk, hvordan billeder indlæses i HDFS. Klassificeringsmodellerne, der er bygget over tid, anvendes nu til de ekstra billedfunktionselementer i kortfasen af ​​denne løsning. Som du kan se i nederste højre hjørne består udgangen af ​​denne behandling af billedklassifikationer, der spænder fra tegnefilm til sport og steder.

Hadoop kan også bruges til lyd- eller stemmeanalyse. En sikkerhedsindustriklient, vi arbejder med, skaber et lydklassificeringssystem til klassificering af lyde, der høres via akustisk berigede fiberoptiske kabler, der ligger omkring omkredsen af ​​atomreaktorer.

Dette system ved f.eks. Hvordan man næsten øjeblikkeligt klassificerer vindens hvisken i forhold til hvisken af ​​en menneskelig stemme eller at skelne lyden af ​​menneskelige fodspor, der løber i perimeterparklandene fra dyrelivet.

Denne beskrivelse kan have slags

Star Trek mærke til det, men du kan nu se levende eksempler. Faktisk offentliggør IBM et af de største billedklassificeringssystemer i verden via IBM Multimedia Analysis and Retrieval System (IMARS). Her er resultatet af en IMARS søgning efter udtrykket

alpint skiløb. Øverst på figuren kan du se resultaterne af klassifikatorerne kortlagt til billedsættet, der blev behandlet af Hadoop, sammen med en tilhørende tagsky. Bemærk den mere groft definerede overordnede klassifikator, i modsætning til den mere granulære. Faktisk bemærke de mange klassificeringsklasser: ruller ind i, som ruller ind - alle genereres automatisk af klassificeringsmodellen, bygget og scoret med Hadoop.

Ingen af ​​disse billeder har nogen tilføjede metadata. Ingen har åbnet iPhoto og tagget et billede som en vintersport for at få det til at dukke op i denne klassifikation. Det er vinter sport klassifikator, der blev bygget til at genkende image attributter og karakteristika af sport, der spilles i en vinterindstilling.

Billedklassificering har mange applikationer, og at kunne udføre denne klassifikation i massiv skala ved at bruge Hadoop åbner flere muligheder for analyse, da andre applikationer kan bruge klassificeringsoplysningerne genereret til billederne.

Se på dette eksempel fra sundhedssektoren. Et stort sundhedsbureau i Asien fokuserede på at levere sundhedspleje via mobile klinikker til en landbefolkning fordelt på en stor landmasse. Et væsentligt problem, som agenturet står overfor, var den logistiske udfordring at analysere de medicinske billeddannelsesdata, der blev genereret i sine mobile klinikker.

En radiolog er en knappe ressource i denne del af verden, så det var fornuftigt at sende de medicinske billeder elektronisk til et centralt punkt og få en hær af læger at undersøge dem. Lægerne, der undersøgte billederne, blev dog hurtigt overbelastet.

Agenturet arbejder nu på et klassifikationssystem for at hjælpe med at identificere mulige forhold for effektivt at give forslag til lægerne om at verificere. Tidlig test har vist denne strategi for at reducere antallet af ubesvarede eller unøjagtige diagnoser, hvilket sparer tid, penge og - mest af alt - lever.

Image Klassificering med Hadoop-dummies

Valg af editor

Financial Freedom Tilbydes af Bitcoin - Dummies

Financial Freedom Tilbydes af Bitcoin - Dummies

Bitcoin tilbyder sine brugere mange fordele, men måske er den vigtigste en hidtil uset niveau af frihed. Og denne frihed kommer på mange forskellige måder: finansiel frihed fra at være nødt til at stole på eksisterende infrastruktur, men også den mentale frihed til at være i kontrol med egne midler og teknologi. Flyt mod ...

Indsætte lydfiler i et PowerPoint Slide-dummies

Indsætte lydfiler i et PowerPoint Slide-dummies

For at afspille lyd i en PowerPoint 2007-præsentation, indsætter du en lydfil i et dias. Hvordan og når lyden høres, er op til dig. Du kan gøre lydfilen automatisk afspilning, når diaset vises eller begynder at afspille, når du klikker. Før du indsætter din lydfil på et dias, spørg ...

Er dit Excel Dashboard eller rapport nøjagtigt? - dummies

Er dit Excel Dashboard eller rapport nøjagtigt? - dummies

Intet dræber et Excel-dashboard eller rapporterer hurtigere end den opfattelse, at dens data er unøjagtige. Inden du sender dit færdige Excel dashboard eller rapport, skal du sørge for at kontrollere din rapporteringsmekanisme. Dit omdømme er på linjen! Her er tre faktorer, der fastslår, at et dashboard er korrekt: Overensstemmelse med autoritative ...

Valg af editor

Annoncer på Facebook - dummies

Annoncer på Facebook - dummies

Facebook er gratis for dig at bruge. I stedet for at opkræve sine brugere penge betaler Facebook regningerne ved at sælge annoncer. Disse annoncer vises derefter til dig. Så på en måde ser du på annoncer, hvordan du betaler for at bruge Facebook. Facebook har en række forskellige måder, hvorpå det vælger hvilke annoncer der skal ...

Automatisk fotoalbum på Facebook - dummies

Automatisk fotoalbum på Facebook - dummies

Det meste af tiden, hvor du laver et fotoalbum i Facebook, du bestemmer hvad du skal title det og hvilke fotos går ind i det. Der er nogle få undtagelser fra denne regel. Facebook samler visse typer billeder i album på dine vegne. Vigtigste, hver gang du ændrer dit profilbillede eller omslagsfoto, ...

Hvem kan se ting på din Facebook-tidslinje? - dummies

Hvem kan se ting på din Facebook-tidslinje? - dummies

Der er forskel på at tilføje ting til dit Facebook-tidslinje, som de foregående indstillinger kontrollerer, og blot kigger på dit tidslinje, som indstillingerne i dette afsnit styrer. Tre indstillinger her vedrører, hvad folk ser, når de ser på din profil. Gennemgå, hvad andre mennesker ser på din tidslinje. Dette er ikke så meget en indstilling ...

Valg af editor

Beskyt Excel-regneark og låseceller i Office 2011 til Mac-dummies

Beskyt Excel-regneark og låseceller i Office 2011 til Mac-dummies

, Når du laver formularer I Excel 2011 til Mac skifter du ofte regnearkbeskyttelse til og fra. Du skal slukke for regnearkbeskyttelse, når du vil opbygge en formular. Slukning af arkbeskyttelse gør det muligt at bruge formularkontrolerne på fanen Udvikler i båndet og giver dig mulighed for at redigere regnearket ...

Arbejder med Excel-arktyper i Office 2011 til Mac-dummies

Arbejder med Excel-arktyper i Office 2011 til Mac-dummies

Hvis du arbejder i Office 2011 til Mac, finder du, at Excel-ark kan være generelle eller dedikeret til et bestemt formål. Du behøver ikke være ekspert i Excel 2011 til Mac til at bruge de forskellige arktyper, men du bør kende deres navne og hver arktype formål. Du kan blande forskellige ...

Udfyldning af et formular med en grafik i Office 2011 til Mac - dummies

Udfyldning af et formular med en grafik i Office 2011 til Mac - dummies

I Office 2011 for Mac-programmer, former kan fyldes med et billede fra en fil eller fyldes med en af ​​flere teksturer fra en menu ved hjælp af fanen Billede eller tekstur i dialogboksen Formatformat. Mønstre er geometriske design, der bruger to farver, og de er tilgængelige fra fanen Mønster i ...