Basics of Content-Based Predictive Analytics Filters - Dummies

Indholdsbaseret Rekommendationssystemer til predictive analytics matcher for det meste funktioner brugerens profil til at fremsætte anbefalinger. Når en bruger køber et emne, der har tagget funktioner, anbefales det, at elementer med funktioner, som svarer til de originale genstande, anbefales. Jo flere funktioner matcher, desto højere er sandsynligheden for, at brugeren kan lide anbefalingen. Denne sandsynlighedsgrad kaldes præcision.

Grundlæggende om tags for at beskrive varer

Generelt foretager firmaet, der laver salg (eller producenten), normalt sine varer med søgeord. På Amazon-hjemmesiden er det dog temmelig typisk aldrig at se mærkerne for varer købt eller vist - og ikke engang at blive bedt om at tagge en vare. Kunder kan gennemgå de varer, de har købt, men det er ikke det samme som mærkning.

Tagning af varer kan udgøre en skalaudfordring for en butik som Amazon, der har så mange elementer. Derudover kan nogle attributter være subjektive og kan være forkert mærket, afhængigt af hvem mærker det. En løsning, der løser skaleringsproblemet, er at give kunder eller offentligheden mulighed for at mærke varerne.

For at holde tags håndterbare og præcise, kan et acceptabelt sæt af tags leveres af hjemmesiden. Først når et passende antal brugere er enige (det vil sige brug samme tag til at beskrive et emne), vil det aftalte tag blive brugt til at beskrive varen.

Brugerbaseret tagging viser imidlertid andre problemer for et indholdsbaseret filtreringssystem (og samarbejdsfiltrering):

Troværdighed: Ikke alle kunder fortæller sandheden (især online) og brugere, der har kun en lille rating historie kan skew dataene. Derudover kan nogle leverandører give (eller opfordre andre til at give) positive vurderinger til deres egne produkter, mens de giver negative vurderinger til deres konkurrenters produkter.
Sparsity: Ikke alle elementer vil blive vurderet eller vil have tilstrækkelige ratings til at producere nyttige data.
Inkonsekvens: Ikke alle brugere bruger de samme søgeord til at tagge et emne, selv om betydningen kan være den samme. Derudover kan nogle attributter være subjektive. For eksempel kan en seer af en film overveje den kort, mens en anden siger, at den er for lang.

Attributter har brug for klare definitioner. En egenskab med for få grænser er svær at vurdere; at pålægge for mange regler om en egenskab, kan bede brugerne om at gøre for meget arbejde, hvilket vil fraråde dem fra mærkning af varer.

Tagning af de fleste varer i et produktkatalog kan hjælpe med at løse det koldstartsproblem, der plager samarbejdsfiltrering.I et stykke tid er præcisionen af systemets anbefalinger imidlertid lave, indtil den opretter eller opnår en brugerprofil.

Her er en prøvematrix af kunder og deres købte varer, viser et eksempel på indholdsbaseret filtrering. Funktion 4

Funktion 5	Element 1	X	X
Funktion 4	Funktion 5	X
X	X	X
X	Punkt 4	X	X
X	Punkt 5	X > X	X
Her, hvis en bruger kan lide Feature 2 - og det er optaget i sin profil - vil systemet anbefale alle elementer, der har Feature 2 i dem: Item 1, Item 2 og Item 4. > Denne tilgang fungerer selvom brugeren aldrig har købt eller gennemgå et emne. Systemet vil bare se i produktdatabasen for ethvert emne, der er blevet mærket med Feature 2. Hvis (for eksempel) en bruger, der leder efter film med Audrey Hepburn - og denne præference vises i brugerens profil - vil systemet anbefale alle de film der har Audrey Hepburn til denne bruger.	Dette eksempel viser dog hurtigt en begrænsning af den indholdsbaserede filtreringsteknik: Brugeren ved sikkert nok allerede om alle de film, som Audrey Hepburn har været i, eller kan nemt finde ud af - så fra brugerens synspunkt, har systemet ikke anbefalet noget nyt eller af værdi.	Sådan forbedres præcisionen med konstant feedback	En måde at forbedre præcisionen af systemets anbefalinger er at spørge kunder om tilbagemelding, når det er muligt. Indsamling af kundefeedback kan ske på mange forskellige måder gennem flere kanaler. Nogle virksomheder beder kunden om at bedømme en vare eller tjeneste efter køb. Andre systemer leverer sociale medier-links, så kunderne kan "lide" eller "ikke lide" et produkt. Konstant interaktion mellem

Sådan måles effektiviteten af systemanbefalinger

Succesen af systemets anbefalinger afhænger af, hvor godt det opfylder to kriterier:

præcision

(tænk på det som et sæt perfekte matcher - normalt et lille sæt) og

tilbagekald

(tænk på det som et sæt af mulige kampe - normalt et større sæt). Her er et nærmere kig:

Precision måler, hvor præcist systemets anbefaling var. Præcision er svært at måle, fordi det kan være subjektivt og svært at kvantificere. Når en bruger først besøger Amazon-webstedet, kan Amazon f.eks. Vide, om dens anbefalinger er på mål? Nogle anbefalinger kan forbinde med kundens interesser, men kunden kan stadig ikke købe. Den højeste tillid til, at en anbefaling er præcis, kommer fra klare beviser: Kunden køber varen. Alternativt kan systemet udtrykkeligt bede brugeren om at bedømme sine anbefalinger. Recall måler sæt af mulige gode anbefalinger, dit system kommer op med. Tænk på tilbagekaldelse som en oversigt over mulige anbefalinger, men ikke alle er perfekte anbefalinger. Der er generelt et omvendt forhold til præcision og tilbagekaldelse. Det er, som tilbagekaldelse går op, præcision går ned, og omvendt.

Det ideelle system ville have både høj præcision og høj tilbagekaldelse. Men realistisk er det bedste resultat at få en delikat balance mellem de to. Fremhævelse af præcision eller tilbagekaldelse afhænger virkelig af det problem, du forsøger at løse.