Image Klassificering med Hadoop-dummies

Billedklassificering kræver En betydelig mængde databehandlingsressourcer, der imidlertid har begrænset omfanget af implementeringer. Billedklassifikation er et varmt emne i Hadoop-verdenen, fordi ingen mainstream-teknologi var i stand til - indtil Hadoop kom sammen - at åbne døre for denne slags dyre behandling i så stor og effektiv skala.

Billedklassifikation starter med ideen om at du opbygger et træningssæt, og at computere lærer at identificere og klassificere, hvad de ser på. På samme måde som at have flere data hjælper med at opbygge bedre opdagelses- og risikomodeller, hjælper det også systemer til bedre at klassificere billeder.

I dette brugs tilfælde benævnes dataene som træningssættet samt modellerne er klassifikatorer. Klassifikatorer genkende funktioner eller mønstre inden for lyd, billede eller video og klassificere dem passende. Klassifikatorer er bygget og iterativt raffineret fra træningssæt, så deres præcisionsresultater (en måling af præcision) og tilbagekaldingsresultater (et mål for dækning) er høje. Hadoop er velegnet til billedklassificering, fordi den giver et massivt parallelbehandlingsmiljø for ikke kun at oprette klassificeringsmodeller (iteration over træningssæt), men også give næsten grænseløs skalerbarhed til at behandle og køre disse klassifikatorer på tværs af massive sæt ustrukturerede datamængder.

Overvej multimediekilder som YouTube, Facebook, Instagram og Flickr - alle er kilder til ustrukturerede binære data. Figuren viser en måde, hvorpå Hadoop kan scalere behandlingen af store mængder lagrede billeder og video til multimedie semantisk klassificering.

Du kan se, hvordan alle de begreber, der vedrører Hadoop-behandlingsrammen, anvendes på disse data. Bemærk, hvordan billeder indlæses i HDFS. Klassificeringsmodellerne, der er bygget over tid, anvendes nu til de ekstra billedfunktionselementer i kortfasen af denne løsning. Som du kan se i nederste højre hjørne består udgangen af denne behandling af billedklassifikationer, der spænder fra tegnefilm til sport og steder.

Hadoop kan også bruges til lyd- eller stemmeanalyse. En sikkerhedsindustriklient, vi arbejder med, skaber et lydklassificeringssystem til klassificering af lyde, der høres via akustisk berigede fiberoptiske kabler, der ligger omkring omkredsen af atomreaktorer.

Dette system ved f.eks. Hvordan man næsten øjeblikkeligt klassificerer vindens hvisken i forhold til hvisken af en menneskelig stemme eller at skelne lyden af menneskelige fodspor, der løber i perimeterparklandene fra dyrelivet.

Denne beskrivelse kan have slags

Star Trek mærke til det, men du kan nu se levende eksempler. Faktisk offentliggør IBM et af de største billedklassificeringssystemer i verden via IBM Multimedia Analysis and Retrieval System (IMARS). Her er resultatet af en IMARS søgning efter udtrykket

alpint skiløb. Øverst på figuren kan du se resultaterne af klassifikatorerne kortlagt til billedsættet, der blev behandlet af Hadoop, sammen med en tilhørende tagsky. Bemærk den mere groft definerede overordnede klassifikator, i modsætning til den mere granulære. Faktisk bemærke de mange klassificeringsklasser: ruller ind i, som ruller ind - alle genereres automatisk af klassificeringsmodellen, bygget og scoret med Hadoop.

Ingen af disse billeder har nogen tilføjede metadata. Ingen har åbnet iPhoto og tagget et billede som en vintersport for at få det til at dukke op i denne klassifikation. Det er vinter sport klassifikator, der blev bygget til at genkende image attributter og karakteristika af sport, der spilles i en vinterindstilling.

Billedklassificering har mange applikationer, og at kunne udføre denne klassifikation i massiv skala ved at bruge Hadoop åbner flere muligheder for analyse, da andre applikationer kan bruge klassificeringsoplysningerne genereret til billederne.

Se på dette eksempel fra sundhedssektoren. Et stort sundhedsbureau i Asien fokuserede på at levere sundhedspleje via mobile klinikker til en landbefolkning fordelt på en stor landmasse. Et væsentligt problem, som agenturet står overfor, var den logistiske udfordring at analysere de medicinske billeddannelsesdata, der blev genereret i sine mobile klinikker.

En radiolog er en knappe ressource i denne del af verden, så det var fornuftigt at sende de medicinske billeder elektronisk til et centralt punkt og få en hær af læger at undersøge dem. Lægerne, der undersøgte billederne, blev dog hurtigt overbelastet.

Agenturet arbejder nu på et klassifikationssystem for at hjælpe med at identificere mulige forhold for effektivt at give forslag til lægerne om at verificere. Tidlig test har vist denne strategi for at reducere antallet af ubesvarede eller unøjagtige diagnoser, hvilket sparer tid, penge og - mest af alt - lever.