Passende strukturdata i dine Excel-datamodeller - dummies

Video: Data Modul - ein AHA!Video 2025

Som byggesten til dine Excel-rapporter skal dataene i dine datamodeller struktureres korrekt. Ikke alle datasæt er skabt ens. Selvom nogle datasæt arbejder i et standard Excel-miljø, fungerer de muligvis ikke til datamodelleringsformål. Før du bygger din datamodel, skal du sikre dig, at dine kildedata er passende struktureret til dashboarding.

Risikoen for overforenkling indeholder datasæt, der typisk bruges i Excel, i tre grundlæggende former:

Regnearkrapporten
Den flade datafil
Tabelldatasættet

Stempellinjen er, at kun flade datafiler og tabulære datasæt gør det muligt for effektive datamodeller.

Regnearkrapporter giver mulighed for ineffektive datamodeller

Regnearkrapporter viser højt formaterede, opsummerede data og er ofte designet som præsentationsværktøjer til ledelse eller administrerende brugere. En typisk regnearkrapport gør en god brug af tom plads til formatering, gentager data til æstetiske formål og præsenterer kun højniveauanalyse. Følgende figur illustrerer en regnearkrapport.

En regnearkrapport.

Selv om en regnearkrapport kan se godt ud, er det ikke en effektiv datamodel. Hvorfor? Den primære årsag er, at disse rapporter ikke giver dig nogen adskillelse af data, analyse og præsentation. Du er i det væsentlige låst i en analyse.

Selvom du kunne lave diagrammer fra den viste rapport, ville det være upraktisk at anvende en analyse uden for, hvad der allerede er der. For eksempel, hvordan ville du beregne og præsentere gennemsnittet af alt cykelsalg ved hjælp af denne rapport? Hvordan ville du beregne en liste over de ti bedste markeder?

Med denne opsætning bliver du tvunget til meget manuelle processer, der er vanskelige at vedligeholde måned efter måned. Enhver analyse uden for de højtstående niveauer, der allerede findes i rapporten, er grundlæggende i bedste fald - selv med fancy formler. Hvad sker der endvidere, når du skal vise cykelhandel pr. Måned? Når din datamodel kræver analyse med data, der ikke findes i regnearkrapporten, er du nødt til at søge efter et andet datasæt.

Fladdatafiler låne sig fint til datamodeller

En anden type filformat er en flad fil. Fladfiler er datalager placeret efter række og kolonne. Hver række svarer til et sæt dataelementer, eller en post. Hver kolonne er et -felt. Et felt svarer til et unikt dataelement i en post. Følgende figur indeholder de samme data som den foregående rapport, men udtrykt i et fladt datafilformat.

En flad datafil.

Bemærk, at hvert datafelt har en kolonne, og hver kolonne svarer til et dataelement. Derudover er der ingen ekstra afstand, og hver række (eller rekord) svarer til et unikt sæt informationer. Men nøgleattributtet, der gør dette til en flad fil, er, at intet enkelt felt identificerer en rekord unikt. Faktisk skal du angive fire separate felter (Region, Marked, Forretningssegment og en måneds salgsbeløb), før du kunne identificere posten entydigt.

Fladfiler låne sig fint til datamodellering i Excel, fordi de kan være detaljerede nok til at holde de data, du har brug for, og stadig fremmer et bredt udvalg af analyser med enkle formler - SUM, AVERAGE, VLOOKUP og SUMIF, bare for at nævne nogle få.

Tabulære datasæt er perfekte til drejeborddrevne datamodeller

Mange effektive datamodeller drives primært af pivottabeller. Pivottabeller er Excels førende analyseværktøjer. For de af jer, der har brugt pivottabeller, ved du, at de giver en glimrende måde at opsummere og forme data til brug ved at rapportere komponenter, som diagrammer og tabeller.

Tabular datasæt er ideelle til drejeborddrevne datamodeller. Den følgende figur illustrerer et tabulært datasæt. Bemærk, at den primære forskel mellem et tabulært datasæt og en flad datafil er, at i tabulære datasæt ikke dobbeltkolonne etiketter dobbelt som faktiske data. For eksempel indeholder kolonnen Salgsperiode månedsidentifikatoren. Denne subtile forskel i struktur er, hvad der gør tabulære datasæt optimale datakilder til pivottabeller. Denne struktur sikrer, at nøglepivottabellfunktioner som sortering og gruppering fungerer som de skal.

Et tabulært datasæt.

Attributterne til et tabulært datasæt er som følger:

Den første række af datasættet indeholder feltetiketter, der beskriver oplysningerne i hver kolonne.
Kolonneetiketterne trækker ikke dobbeltarbejde som dataelementer, der kan bruges som filtre eller forespørgsels kriterier (som f.eks. Måneder, datoer, år, regioner eller markeder).
Der er ingen tomme rækker eller kolonner - hver kolonne har en overskrift, og en værdi er i hver række.
Hver kolonne repræsenterer en unik kategori af data.
Hver række repræsenterer individuelle elementer i hver kolonne.