Gennemsnitlige forskellige forudsigelser for maskinindlæring - dummier

Video: 10 Interesting Aye-aye Facts 2025

Både gennemsnits- og afstemningssystemer kan også fungere fint, når du bruger en blanding af forskellige maskinindlæring algoritmer. Dette er gennemsnitlig tilgang, og den bruges meget, når du ikke kan reducere estimatvariancen.

Når du forsøger at lære af data, skal du prøve forskellige løsninger, så du modellerer dine data ved hjælp af forskellige maskinindlæringsløsninger. Det er god praksis at kontrollere, om du kan sætte nogle af dem med succes i ensembler ved hjælp af forudsigelsesgennemsnit eller ved at tælle de forudsagte klasser. Princippet er det samme som ved bagning af ikke-korrelerede forudsigelser, når modeller blandet sammen kan producere mindre variansberørte forudsigelser. For at opnå effektiv gennemsnitsværdi skal du

Opdel dine data i trænings- og testsæt.
Brug træningsdataene med forskellige alarmer til maskinindlæring.
Optag forudsigelser fra hver algoritme og evaluer levedygtigheden af resultatet ved hjælp af testsættet.
Korrelér alle de forudsigelser, der er tilgængelige med hinanden.
Vælg de forudsigelser, der mindst korrelerer og gennemsnit deres resultat. Eller, hvis du klassificerer, vælg en gruppe mindst korrelerede forudsigelser, og for hvert eksempel vælger du som en ny klasse forudsigelse den klasse, som de fleste af dem forudsagde.
Test den nyligt gennemsnitlige eller forkastede stemmeberegning mod testdataene. Hvis du lykkes, opretter du din endelige model ved at gennemsnitlige resultaterne af modeldelen af det succesfulde ensemble.

For at forstå, hvilke modeller der korrelerer mindst, tager forudsigelserne en efter en, korrelerer hver enkelt mod de andre, og gennemsnit korrelationerne for at opnå en gennemsnitlig korrelation. Brug den gennemsnitlige korrelation til at rangordne de udvalgte forudsigelser, der er mest egnede til gennemsnittet.