Hjem Personlig finansiering Betydningen af ​​clustering og klassificering i datalogi - dummies

Betydningen af ​​clustering og klassificering i datalogi - dummies

Video: Hortons hovedpine anfald ANFALDET 2025

Video: Hortons hovedpine anfald ANFALDET 2025
Anonim

Formålet med clustering og klassifikationsalgoritmer er at give mening og ekstrahere værdi fra store sæt strukturerede og ustrukturerede data. Hvis du arbejder med store mængder ustrukturerede data, er det kun fornuftigt at forsøge at opdele dataene i en slags logiske grupperinger, før du forsøger at analysere det.

Klyngning og klassificering giver dig mulighed for at se et flot blik på dine data, og dernæst danne nogle logiske strukturer ud fra det, du finder der, inden du går dybere ind i møtrikker og bolteanalyser.

I deres enkleste form er klynger sæt datapunkter, der deler lignende egenskaber, og klyngalgoritmer er de metoder, der grupperer disse datapunkter i forskellige klynger baseret på deres ligheder. Du får se klyngningsalgoritmer, der anvendes til sygdomsklassificering inden for medicinsk videnskab, men du vil også se dem bruges til kundeklassificering i markedsundersøgelser og for miljømæssig sundhedsrisikovurdering i miljøteknik.

Der er forskellige klyngemetoder afhængigt af, hvordan du vil have datasættet opdelt. De to hovedtyper af klyngningsalgoritmer er

  • Hierarkisk: Algoritmer opretter separate sæt indlejrede klynger, hver på deres eget hierarkiske niveau.

  • Partition: Algoritmer skaber kun et enkelt sæt klynger.

Du kan kun bruge hierarkiske klyngningsalgoritmer, hvis du allerede kender adskillelsesafstanden mellem datapunkterne i dit datasæt. Den nærmeste naboalgoritme, der er beskrevet i dette kapitel, tilhører den hierarkiske klasse af klyngalgoritmer.

Du har måske hørt om klassificering og troede, at klassificering er den samme som clustering. Mange mennesker gør det, men det er ikke tilfældet. I klassificering, inden du begynder, kender du allerede antallet af klasser, som dine data skal grupperes i, og du ved allerede, hvilken klasse du vil have, hver datapunkt skal tildeles. I klassificering er dataene i datasættet, der læres fra, mærket.

Når du bruger klyngningsalgoritmer, har du på den anden side ikke et foruddefineret koncept for, hvor mange klynger der passer til dine data, og du afhænger af klyngningsalgoritmerne for at sortere og klynge dataene på den mest hensigtsmæssige måde. Med clusteringsteknikker lærer du fra umærkede data.

For at bedre illustrere karakteren af ​​klassificering, skal du se på Twitter og dets hash-tagging system.Sig, du har lige fået fat på din yndlingsdrink i hele verden: en iset karamel latte fra Starbucks. Du er så glad for at få din drink, at du beslutter dig for at tweet om det med et foto og sætningen "Dette er den bedste latte NOGENSINDE! #StarbucksRocks. "Ja, selvfølgelig inkluderer du" #StarbucksRocks "i din tweet, så tweetet går ind i #StarbucksRocks-strømmen og er klassificeret sammen med alle de andre tweets, der er blevet mærket som #StarbucksRocks. Din brug af hashtag-mærket i din tweet fortalte Twitter, hvordan du klassificerer dine data i en genkendelig og tilgængelig gruppe eller klynge .

Betydningen af ​​clustering og klassificering i datalogi - dummies

Valg af editor

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvis du arbejder i Microsoft Excel 2010 og vil begynde at arbejde i en ny Excel-workbook-fil, kan du nemt oprette en ny projektmappe. For at gøre det kan du bruge en kommando på fanen Filer eller en tastaturgenvej. Klik på fanen Filer. Excel viser Backstage-visning, hvor du kan få adgang til filrelaterede kommandoer. ...

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

I Excel 2010 Opret brugerdefinerede ordbøger, der skal bruges, når du stavekontrollerer dine regneark. Du bruger knappen Tilføj til ordbog i dialogboksen Staveord til at tilføje ukendte ord til en brugerdefineret ordbog. Som standard tilføjer Excel disse ord til en brugerdefineret ordbog fil med navnet CUSTOM. DIC, men du kan oprette en ny brugerdefineret ...

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

, Når du opretter en pivottabel i Excel 2010, kan du oprette et pivotdiagram for at vise sine sammendragsværdier grafisk. Du kan også formatere et pivotdiagram for at forbedre udseendet. Du kan bruge en af ​​de diagramtyper, der er tilgængelige med Excel, når du opretter et pivotdiagram. Opret et pivotdiagram Følg disse ...

Valg af editor

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Du kan flytte funktioner rundt på hovedsiden på dit Ning-netværk via siden Tilføj funktioner til dit netværk, ændrer layoutet, indtil det bare er det, du vil have. For at komme til denne side skal du klikke på linket Administrer i din navigation og derefter klikke på Funktioner under Dit netværk. Tilføj funktioner til dit netværk ...

Sådan vælger du et sprog med Ning Language Editor - dummies

Sådan vælger du et sprog med Ning Language Editor - dummies

Ning Language Editor er et af de mest kraftfulde værktøjer til din rådighed for at tilpasse dit netværk til det maksimale. Ning Language Editor hjælper dig med at lave din netværksgrænseflade (menuer, knapper, overskrifter, legender osv.), Og læs præcis som du vil have det til. Sprogeditoren giver dig mulighed for at vælge et bestemt sprog:

Hvordan man vælger et tema til dit Ning-netværk - dummies

Hvordan man vælger et tema til dit Ning-netværk - dummies

Du kan køre dit netværk på Ning uden at være en meget vellykket designer - og Ning's temaer lader dig få det til at ligne en million dollars! Folkene i Ning har taget godt af det og tilbyder dig mere end 50 flotte skabeloner (de kalder dem temaer), som du kan bruge med minimal indsats:

Valg af editor

Forstå kamphandlinger i rutefilter - dummier

Forstå kamphandlinger i rutefilter - dummier

De kamphandlinger, der er tilgængelige for rutefiltre, er identiske med dem, der er tilgængelige for andre routing politikker i Junos. Du kan acceptere ruter, afvise ruter, ændre attributter, der tilhører en rute, eller udføre flow kontrol type funktioner. Langt de mest almindelige handlinger, der skal bruges med rutefiltre, accepteres og afvises. Normalt vil du ...

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Vigtigheden af ​​at følge sikkerhedsprotokoller kan ikke være overvurderet. Hvis der ikke træffes passende forholdsregler, kan der opstå alvorlig skade for personale eller apparatet. Følg disse retningslinjer for at sikre din sikkerhed og beskytte enheden mod skade. Vær altid opmærksom og udøv god dømmekraft. Bemærk: Kun uddannet og kvalificeret personale skal installere enheden. Brug ...

Forstå matchtyper i rutefilter - dummies

Forstå matchtyper i rutefilter - dummies

Rutefilter matcher bestemte IP-adresser eller præfiksintervaller. I lighed med andre routingpolitikker indeholder de nogle matchkriterier og tilsvarende kamphandlinger. En vigtig forskel mellem rutefiltre og andre politiske matchforhold er, hvordan flere filtre håndteres. Hvis du har mere end en matchtilstand, behandles betingelserne som ...