Hjem Personlig finansiering Basics of Content-Based Predictive Analytics Filters - Dummies

Basics of Content-Based Predictive Analytics Filters - Dummies

Indholdsfortegnelse:

Video: Machine Learning interview questions - What is Collaborative Filtering and content based filtering? 2025

Video: Machine Learning interview questions - What is Collaborative Filtering and content based filtering? 2025
Anonim

Indholdsbaseret Rekommendationssystemer til predictive analytics matcher for det meste funktioner brugerens profil til at fremsætte anbefalinger. Når en bruger køber et emne, der har tagget funktioner, anbefales det, at elementer med funktioner, som svarer til de originale genstande, anbefales. Jo flere funktioner matcher, desto højere er sandsynligheden for, at brugeren kan lide anbefalingen. Denne sandsynlighedsgrad kaldes præcision.

Grundlæggende om tags for at beskrive varer

Generelt foretager firmaet, der laver salg (eller producenten), normalt sine varer med søgeord. På Amazon-hjemmesiden er det dog temmelig typisk aldrig at se mærkerne for varer købt eller vist - og ikke engang at blive bedt om at tagge en vare. Kunder kan gennemgå de varer, de har købt, men det er ikke det samme som mærkning.

Tagning af varer kan udgøre en skalaudfordring for en butik som Amazon, der har så mange elementer. Derudover kan nogle attributter være subjektive og kan være forkert mærket, afhængigt af hvem mærker det. En løsning, der løser skaleringsproblemet, er at give kunder eller offentligheden mulighed for at mærke varerne.

For at holde tags håndterbare og præcise, kan et acceptabelt sæt af tags leveres af hjemmesiden. Først når et passende antal brugere er enige (det vil sige brug samme tag til at beskrive et emne), vil det aftalte tag blive brugt til at beskrive varen.

Brugerbaseret tagging viser imidlertid andre problemer for et indholdsbaseret filtreringssystem (og samarbejdsfiltrering):

  • Troværdighed: Ikke alle kunder fortæller sandheden (især online) og brugere, der har kun en lille rating historie kan skew dataene. Derudover kan nogle leverandører give (eller opfordre andre til at give) positive vurderinger til deres egne produkter, mens de giver negative vurderinger til deres konkurrenters produkter.

  • Sparsity: Ikke alle elementer vil blive vurderet eller vil have tilstrækkelige ratings til at producere nyttige data.

  • Inkonsekvens: Ikke alle brugere bruger de samme søgeord til at tagge et emne, selv om betydningen kan være den samme. Derudover kan nogle attributter være subjektive. For eksempel kan en seer af en film overveje den kort, mens en anden siger, at den er for lang.

Attributter har brug for klare definitioner. En egenskab med for få grænser er svær at vurdere; at pålægge for mange regler om en egenskab, kan bede brugerne om at gøre for meget arbejde, hvilket vil fraråde dem fra mærkning af varer.

Tagning af de fleste varer i et produktkatalog kan hjælpe med at løse det koldstartsproblem, der plager samarbejdsfiltrering.I et stykke tid er præcisionen af ​​systemets anbefalinger imidlertid lave, indtil den opretter eller opnår en brugerprofil.

Her er en prøvematrix af kunder og deres købte varer, viser et eksempel på indholdsbaseret filtrering. Funktion 4

Funktion 5 Element 1 X X Element 2 Funktion 3
Funktion 4 Funktion 5 X
X X X
X Punkt 4 X X
X Punkt 5 X > X X
Her, hvis en bruger kan lide Feature 2 - og det er optaget i sin profil - vil systemet anbefale alle elementer, der har Feature 2 i dem: Item 1, Item 2 og Item 4. > Denne tilgang fungerer selvom brugeren aldrig har købt eller gennemgå et emne. Systemet vil bare se i produktdatabasen for ethvert emne, der er blevet mærket med Feature 2. Hvis (for eksempel) en bruger, der leder efter film med Audrey Hepburn - og denne præference vises i brugerens profil - vil systemet anbefale alle de film der har Audrey Hepburn til denne bruger. Dette eksempel viser dog hurtigt en begrænsning af den indholdsbaserede filtreringsteknik: Brugeren ved sikkert nok allerede om alle de film, som Audrey Hepburn har været i, eller kan nemt finde ud af - så fra brugerens synspunkt, har systemet ikke anbefalet noget nyt eller af værdi. Sådan forbedres præcisionen med konstant feedback En måde at forbedre præcisionen af ​​systemets anbefalinger er at spørge kunder om tilbagemelding, når det er muligt. Indsamling af kundefeedback kan ske på mange forskellige måder gennem flere kanaler. Nogle virksomheder beder kunden om at bedømme en vare eller tjeneste efter køb. Andre systemer leverer sociale medier-links, så kunderne kan "lide" eller "ikke lide" et produkt. Konstant interaktion mellem

Sådan måles effektiviteten af ​​systemanbefalinger

Succesen af ​​systemets anbefalinger afhænger af, hvor godt det opfylder to kriterier:

præcision

(tænk på det som et sæt perfekte matcher - normalt et lille sæt) og

tilbagekald

(tænk på det som et sæt af mulige kampe - normalt et større sæt). Her er et nærmere kig:

Precision måler, hvor præcist systemets anbefaling var. Præcision er svært at måle, fordi det kan være subjektivt og svært at kvantificere. Når en bruger først besøger Amazon-webstedet, kan Amazon f.eks. Vide, om dens anbefalinger er på mål? Nogle anbefalinger kan forbinde med kundens interesser, men kunden kan stadig ikke købe. Den højeste tillid til, at en anbefaling er præcis, kommer fra klare beviser: Kunden køber varen. Alternativt kan systemet udtrykkeligt bede brugeren om at bedømme sine anbefalinger. Recall måler sæt af mulige gode anbefalinger, dit system kommer op med. Tænk på tilbagekaldelse som en oversigt over mulige anbefalinger, men ikke alle er perfekte anbefalinger. Der er generelt et omvendt forhold til præcision og tilbagekaldelse. Det er, som tilbagekaldelse går op, præcision går ned, og omvendt.

  • Det ideelle system ville have både høj præcision og høj tilbagekaldelse. Men realistisk er det bedste resultat at få en delikat balance mellem de to. Fremhævelse af præcision eller tilbagekaldelse afhænger virkelig af det problem, du forsøger at løse.

Basics of Content-Based Predictive Analytics Filters - Dummies

Valg af editor

Bygg dit eget sociale fællesskab for handel - dummies

Bygg dit eget sociale fællesskab for handel - dummies

På et velproduceret forretningswebsted, du Se ofte et link til et socialt samfundsområde, hvilket også kan føre offsite til sociale medier. Dette område er hvor kundeservice og FAQs sider lever. Du kan også finde et kunde-til-kunde-fællesskab, der tilskynder deltagelse fra dem, der besøger forretningssiden. Uanset om du vælger ...

Bedste praksis til e-mailmarkedsføring - dummies

Bedste praksis til e-mailmarkedsføring - dummies

Emnet for din sociale medievirksomhed e -mails skal være om at opfylde dine kunders interesser. Du kender dine kunder bedre end nogen. Hvis de vil have opskrifter, skal du f.eks. Have en opskrift i din e-mail. Har indhold, der vedrører din virksomhed og kundens behov. Bygg på loyalitetsforslaget og lav ...

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Sælger gennem billeder og indhold, du deler på populære sociale medier, er en fantastisk måde at nå ud til kunderne. Du kan gøre mere end blot at linke til produkter - find ud af hvordan du kan tjene penge på dit oprindelige indhold, du udgiver. Du genererer indtægter på din hjemmeside og sociale medier via annoncer og links. Hvis du producerer ...

Valg af editor

Hvordan man bruger f-distributioner i Excel - dummies

Hvordan man bruger f-distributioner i Excel - dummies

F-distributioner er sandsynlighedsfordelinger i Excel, der sammenligner forholdet i variationer af prøver trukket fra forskellige populationer. Denne sammenligning giver en konklusion om, hvorvidt afvigelserne i de underliggende populationer ligner hinanden. F. DIST: Left-tailed f-distribution sandsynlighed F. DIST-funktionen returnerer den venstre-tailed sandsynlighed for at observere et forhold på to samples 'variationer så store ...

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Logaritmer og logaritmisk skalering er værktøjer, som du vil bruge i dine Excel-diagrammer, fordi de gør det muligt for dig at gøre noget meget kraftfuldt. Ved logaritmisk skalering af din værdi-akse kan du sammenligne den relative ændring (ikke den absolutte ændring) i datareserværdier. For eksempel, sig at du vil sammenligne salget ...

Sådan bruges Flash Fill in Excel 2016 - dummies

Sådan bruges Flash Fill in Excel 2016 - dummies

Excel 2016s handy Flash Fill-funktion giver dig evnen at tage en del af de data, der er indtastet i en kolonne i et regnearktabell, og indtast bare disse data i en ny tabelkolonne ved kun at bruge et par tastetryk. Serien af ​​indgange vises i den nye kolonne, bogstaveligt talt i en flash (således ...

Valg af editor

ØGe din blog med bedre indhold - dummier

ØGe din blog med bedre indhold - dummier

Som du tænker på måder at generere buzz på din blog, du kan også forbedre kvaliteten af ​​din blog ved at fokusere på dine bogføringsteknikker. Disse tip kan give dig nogle gode promoveringsideer: Skriv om aktuelle eller kontroversielle problemer. Denne ide virker som en no-brainer, men det er nemt at glemme. Betal ...

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Søgemaskineoptimering ) handler om at øge din blogs synlighed i søgemaskiner som Google. Forbedre din WordPress blogs SEO gennem smarte design valg. Antag for eksempel at du skriver et indlæg om planlægning af en superhelt fødselsdagsfest. Du vil gerne have, at posten vises i søgeresultater, når nogen skriver "superheltefødselsdagsfest" i ...

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mest WordPress mobile plug- ins for din blogs design kan tilpasses. Du tilpasser en mobil plugin til din blog ved at ændre farver og temaer, tilføje et brugerdefineret logoikon og indstille en brugerdefineret hjemmeside. Med WPtouch mobile plug-in kan du tilføje branding som supplerer din blogs design og gør det nemmere at navigere. Før du ...