Video: What is Dark Matter and Dark Energy? 2025
Når dine data er på mere end ét sted, har du brug for måder at sætte det hele på sammen. Når du deltager i to datasæt med forskellige variabler, er du sammenlægning af data. Sammensmeltning er en fælles operation. Sammensmeltning bruges ofte i data mining, der kombinerer linkede data såsom
-
Kundeopgørelser og marketingkampagnedata
-
Før og efter testresultater
-
Interne og sælgerdata
Hvis du vil flette datasæt, skal du have en variabel, der identificerer tilfælde til matchning; dette kaldes en nøgle eller identifikator variabel. Og du kan muligvis identificere et datasæt som primært; Den primære tabel må kun have én sag for enhver værdi af nøglevariablen.
Nogle data-mining applikationer har mere end et værktøj til sammenlægning af datasæt: Den første figur viser værktøjet til grundlæggende fusioner, og den anden figur viser værktøjet til opsætning af mere komplekse fusionskriterier.
Hvis dine datakilder indeholder de samme variabler (mere eller mindre, kampen behøver ikke at være identisk), men forskellige tilfælde bliver det kaldt tilføjelse eller sammenkædning >. Som fusion er dette en fælles operation. Den bruges, når du har nye tilfælde til noget, som du allerede har sporet.
tilføj, sammenkæd eller sammenflet rækker.