Video: 3d print: Sådan kommer du fra idé til produkt 2025
Når dine data er klar, og du er ved at begynde at opbygge din forudsigelsesmodel til analyse, er det nyttigt at skitsere din testmetode og udarbejde en testplan. Testning bør styres af de forretningsmål, du har samlet, dokumenteret og samlet alle nødvendige data, der kan hjælpe dig med at opnå.
Du bør udtænke en metode til at teste om et forretningsmål er nået. Da predictive analytics måler sandsynligheden for et fremtidigt resultat - og den eneste måde at være klar til at køre en sådan test ved, er at træne din model på tidligere data, skal du stadig se, hvad det kan gøre, når det står i vejen for fremtidige data.
Du kan selvfølgelig ikke risikere at køre en uberørt model på virkelige fremtidige data, så du skal bruge eksisterende data til at simulere fremtidige data realistisk. For at gøre det skal du opdele de data, du arbejder på i træning og test datasæt.
Sørg for, at du vælger disse to datasæt tilfældigt, og at begge datasæt indeholder og dækker alle de dataparametre, du måler.
Når du deler dine data i test- og træningsdatasæt, undgår du effektivt overbelastningsproblemer, der kan opstå som følge af overtraining af modellen på hele datasættet og opsamling af alle støjmønstre eller specifikke funktioner, der kun tilhører stikprøvedatasættet og gælder ikke for andre datasæt.
At adskille dine data til træning og testdatasæt, henholdsvis 70 og 30 procent, sikrer en nøjagtig måling af præstationen af den prædiktive analysemodel, du bygger. Du vil evaluere din model mod testdataene, fordi det er en nem måde at måle om modelens forudsigelser er korrekte.