Video: Milwaukee Metric Adjustable Wrenches 2025
Både clustering og klassificering er baseret på beregning af lighed eller forskel mellem to datapunkter. Hvis dit datasæt er numerisk - består af kun talfelter og værdier - og kan afbildes på et n -dimensionalt plot, er der forskellige geometriske målinger, du kan bruge til at skala din multidimensionale data.
Et n-dimensional plot er et flerdimensionalt scatter plotdiagram, som du kan bruge til at plotte n antal dimensioner af data.
Nogle populære geometriske beregninger, der bruges til at beregne afstande mellem datapunkter, omfatter Euclidiske, Manhattan eller Minkowski afstandsmålinger. Disse metrics er blot forskellige geometriske funktioner, der er nyttige til modellering af afstande mellem punkter. Den euklidiske metriske er et mål for afstanden mellem punkter tegnet på et euklidisk plan.
Manhattan-metriske er et mål for afstanden mellem punkter, hvor afstand beregnes som summen af den absolutte værdi af forskellene mellem to punkts kartesiske koordinater. Minkowski-afstandsmålet er en generalisering af de euklidiske og Manhattan-afstandsmetricer. Ofte kan disse metrics anvendes - udveksling.
Hvis dine data er numeriske, men ikke-plottelige (som kurver i stedet for point), kan du generere lighedsresultater baseret på forskelle mellem data i stedet for de faktiske værdier af selve dataene.
Endelig, for ikke-numeriske data, kan du bruge beregninger som Jaccard-afstandsmålet, hvilket er et indeks, der sammenligner antallet af funktioner, som to datapunkter har til fælles. For at illustrere en Jaccard-afstand skal du tænke på de to følgende tekststreng: Saint Louis de Ha-ha, Quebec og St-Louis de Ha! Ha!, QC.
Hvilke funktioner har disse tekststrenger til fælles? Og hvilke funktioner er forskellige mellem dem? Jaccard-metriske genererer en numerisk indeksværdi, der kvantificerer ligheden mellem tekststrengene.