Indholdsfortegnelse:
- Grave gennem data. gov
- Checking Out Canada Open Data
- Dykning i data. gov. uk
- Checking US Census Bureau Data
- Siden starten i 1958 har NASA offentliggjort alle sine ikke-klassificerede projektdata. Det har været i open-data-spillet så længe, at NASA har tonsvis af data! NASA datasæt er vokset endnu hurtigere med de seneste forbedringer inden for satellit- og kommunikationsteknologi. Faktisk genererer NASA nu 4 terabyte nye jordvidenskabelige data om dagen - det svarer til over en million MP3-filer.Mange af NASAs projekter har akkumuleret data i petabyte-serien.
- Verdensbanken er et internationalt finansielt institut, der drives af De Forenede Nationer. Det giver lån til udviklingslande til at betale for kapitalinvesteringer, der vil føre (en forhåbning) til fattigdomsreduktion og noget overskud, således at modtagerlandene kan tilbagebetale lånene over tid. Fordi Verdensbankens officerer skal træffe velinformerede beslutninger om hvilke lande der vil være mere tilbøjelige til at tilbagebetale deres lån, har de samlet en enorm mængde data om medlemslandene. De har gjort disse data tilgængelige for offentligheden på Verdensbankens åbne data-side.
- tidsserier
- crowdsourcing
- gaffel
- OSM-platformen er ret robust. Regeringer og private virksomheder er begyndt at bidrage til og trække fra de delte datasæt. Selv virksomheder, der er så store som Apple, er afhængige af OSM-data. OSM har nu over 1 million registrerede brugere. For at illustrere, hvordan en person kan oprette data i OSM, forestille sig, at nogen forbinder GPS-systemerne på sin mobiltelefon til OSM-applikationen. På grund af denne tilladelse kan OSM automatisk spore vejruterne, mens personen rejser. Senere kan denne person (eller en anden OSM-bruger) gå ind på OSM online platform for at verificere og mærke ruterne.
Video: Pat Gelsinger, VMware | VMworld 2018 2025
Åbne data er en del af en større tendens mod en mindre restriktiv og mere åben forståelse af ideen om intellektuel ejendom, en tendens, der har fået en enorm popularitet i løbet af det sidste årti. Åbn data er data, der er gjort offentligt tilgængelige og tilladt at blive brugt, genbrugt, bygget på og delet med andre. Åbne data er en del af den åbne bevægelse.
Ud over åbne data indeholder denne passende navn åben bevægelse også open source-software, åben hardware, kreativt arbejde med åben indhold, åben adgang til videnskabelige tidsskrifter og åben videnskab - alle forpligtet til at forestille sig, at indhold (herunder rå data fra forsøg) bør deles frit.
Det kendetegnende ved åbne licenser er, at de har copyleft i stedet for ophavsret. Med copyleft, er den eneste begrænsning, at kilden til arbejdet skal identificeres, undertiden med den forbehold, at afledte værker ikke kan ophavsretligt beskyttes med en mere restriktiv licens end originalen. Hvis den anden betingelse er i kraft, bliver det vanskeligt at markedsføre arbejdet selv, selv om folk ofte finder masser af andre indirekte, kreative muligheder for kommercialisering.
Vær opmærksom på at nogle gange arbejde, der er mærket som åbent, muligvis ikke passer til den accepterede definition. Du er ansvarlig for at kontrollere licensrettigheder og begrænsninger for de åbne data, du bruger.
Folk forvirrer ofte åbne licenser med Creative Commons licenser. Creative Commons er en ikke-for-profit organisation, der er dedikeret til at opmuntre og sprede kreative værker ved at tilbyde en lovramme, hvorigennem brugstilladelser kan indrømmes og opnås, således at delingspartier er sikre af juridiske risici, når de bygger på og brug af arbejde og viden, der er blevet åbent delt. Nogle Creative Commons licenser er åbne, og nogle udtrykkeligt forbyder afledte værker og / eller kommercialisering.
Som en del af de seneste åbne offentlige initiativer begyndte regeringerne rundt om i verden at frigive åbne regeringsdata. Regeringerne leverer generelt disse data, så de kan bruges af frivillige analytikere og civile hackere - programmører, der arbejder sammen for at opbygge open source-løsninger, der bruger åbne data til at løse sociale problemer - med det formål at gavne samfundet stor. I 2013 underskrev G8-nationerne (Frankrig, USA, Det Forenede Kongerige, Rusland, Tyskland, Japan, Italien og Canada) et charter, der forpligter sig til at åbne data og prioritere områderne national statistik, valgresultater, statsbudgetter, og nationale kort.
Den åbne regeringsbevægelse fremmer regeringens gennemsigtighed og ansvarlighed, opmuntrer et velinformeret valg og fremmer offentligt engagement. For at udtrykke det i databehandlingsbetingelser letter den åbne regering et læs / skriv forhold mellem en regering og dens borger.
Grave gennem data. gov
Dataene. gov-programmet blev startet af Obama-administrationen for at give åben adgang til ikke-klassificerede amerikanske regeringsdata. Data. Gov data produceres af alle afdelinger i den udøvende afdeling - Det Hvide Hus og alle kabinetsafdelinger - samt datasæt fra andre regeringsniveauer. Ved midten af 2014 kunne du søge efter over 100.000 datasæt ved at bruge dataene. gov søgning. Webstedet er en uovertruffen ressource, hvis du leder efter data fra amerikanske regeringer om følgende indikatorer:
- Økonomisk
- Miljø
- STEM-industri
- Livskvalitet
- Juridisk
Checking Out Canada Open Data
Hvis du kigger på Canada Open Data-webstedet, er landets stærke engagement i data overvældende tydeligt. På Canada Open Data hjemmeside kan du finde over 200, 000 datasæt. Blandt de 25 mest populære tilbud på Canada Open Data-webstedet er datasæt, der dækker følgende indikatorer:
- Miljø
- Unionsborgerskab
- Livskvalitet
Dykning i data. gov. uk
Det Forenede Kongerige begyndte at gå sent i den åbne regeringsbevægelse. Data. gov. Storbritannien blev startet i 2010, og i midten af 2014 var der kun ca. 20.000 datasæt endnu tilgængelige. Ligesom Data. gov, data. gov. uk er også drevet af CKAN datakataloget.
Selvom data. gov. Storbritannien spiller stadig indhøstning, den har en imponerende samling af Ordnance Survey-kort, der er gamle nok - 50 år eller mere - for at være ude af ophavsret. Hvis du leder efter verdensberømte, gratis at bruge undersøgelseskort, data. gov. uk er et fantastisk sted for dig at udforske. Bortset fra dens stjerneskønne kort, data. gov. uk er en nyttig kilde til data om følgende indikatorer:
- Miljø (data. Storbritanniens mest produktive tema)
- Offentlige udgifter
- Samfund
- Sundhed
- Uddannelse
- Erhverv og økonomisk
Checking US Census Bureau Data
US-folketællingen afholdes hvert tiende år, og siden 2010 er dataene gjort frit tilgængelige. Statistikkerne er tilgængelige ned til niveauet for folketællingsblokken - som aggregeres med 30 personer i gennemsnit. Demografiske data fra US Census Bureau kan være yderst hjælpsomme, hvis du laver markedsføring eller reklameforskning, og du skal målrette dit publikum i henhold til følgende klassifikationer:
- Alder
- Gennemsnitlig årlig indkomst
- Husstandsstørrelse < Køn eller race
- Uddannelsesniveau
- Kendskab til NASA-data
Siden starten i 1958 har NASA offentliggjort alle sine ikke-klassificerede projektdata. Det har været i open-data-spillet så længe, at NASA har tonsvis af data! NASA datasæt er vokset endnu hurtigere med de seneste forbedringer inden for satellit- og kommunikationsteknologi. Faktisk genererer NASA nu 4 terabyte nye jordvidenskabelige data om dagen - det svarer til over en million MP3-filer.Mange af NASAs projekter har akkumuleret data i petabyte-serien.
NASAs åbne dataportal kaldes data. Denne portal er en kilde til alle slags vidunderlige data, herunder data om
Astronomi og rum (selvfølgelig!)
- Klima
- Biovidenskab
- Geologi
- Engineering
- Wrangling World Bank Data
Verdensbanken er et internationalt finansielt institut, der drives af De Forenede Nationer. Det giver lån til udviklingslande til at betale for kapitalinvesteringer, der vil føre (en forhåbning) til fattigdomsreduktion og noget overskud, således at modtagerlandene kan tilbagebetale lånene over tid. Fordi Verdensbankens officerer skal træffe velinformerede beslutninger om hvilke lande der vil være mere tilbøjelige til at tilbagebetale deres lån, har de samlet en enorm mængde data om medlemslandene. De har gjort disse data tilgængelige for offentligheden på Verdensbankens åbne data-side.
Hvis du leder efter data for at bekæmpe dit argument i et virkelig interessant data-journalistik, der understøttes af globale statistikker, skal Verdensbanken være din go-to-kilde. Uanset omfanget af dit projekt, hvis du har brug for data om, hvad der sker i udviklingslande, er Verdensbanken stedet at gå. Du kan bruge hjemmesiden til at downloade hele datasæt eller blot se datavisualiseringerne online. Du kan også bruge Verdensbankens Open Data API til at få adgang til det, du har brug for.
Verdensbankens åbne data leverer data om følgende indikatorer (og mange mange flere):
Landbrug og udvikling af landdistrikterne
- Økonomi og vækst
- Miljø
- Videnskab og teknologi
- Finansiel sektor < Fattigdomsindkomst
- Verdensbankens data indeholder også
- mikrodata
- stikprøveundersøgelser af husholdninger og virksomheder i udviklingslande. Du kan bruge mikrodata til at udforske variationer i dine datasæt. Lær at vide Knoema Data Knoema (udtalet "no-mah") sigter at være det største arkiv af offentlige data på nettet. Knoema-platformen indeholder en spændende 500 + databaser ud over sine 150 millioner
tidsserier
- 150 millioner dataindsamlinger om attributværdier over tid, med andre ord. Knoema omfatter, men er ikke begrænset til, alle disse datakilder: Regeringsdata fra industrilandene Nationale offentlige data fra udviklingslande
- De Forenede Nationers data
- Internationale organisationsdata
- Virksomhedsdata fra globale virksomheder
- Knoema er en fremragende ressource, hvis du leder efter internationale data om landbrug, kriminalstatistik, demografi, økonomi, uddannelse, energi, miljø, fødevaresikkerhed, udenrigshandel, sundhed, arealanvendelse, nationalt forsvar, fattigdom, forskning og udvikling, telekommunikation, turisme, transport eller vand.
- Udover at være en utrolig datakilde, er Knoema en multifacetteret tasking platform. Du kan bruge Knoema platformen til at lave dashboards, der automatisk sporer alle dine yndlingsdatasæt. Du kan bruge platformens data visualiseringsværktøjer til hurtigt og nemt at se dine data i et tabelformat eller kortformat.Du kan bruge Knoema Data Atlas til at bore ned mellem kategorier og / eller geografiske regioner og hurtigt få adgang til de specifikke datasæt, du har brug for. Som individ kan du uploade dine egne data og bruge Knoema som en gratis hosting service. Ud over alt dette tilbyder Knoema selv Knoema Market - et sted hvor du kan gå for at blive betalt, bare for at være en del af data-drevne projekter.
Selv om mange af Knoemas data er ret generelle, kan du stadig finde nogle overraskende specifikke data. Hvis du har svært ved at finde data på et bestemt emne, har du måske held til at finde det på Knoema-platformen. Figuren illustrerer lige, hvordan specifikke Knoema data kan være.
Indekset for insektoptegnelser i Knoemas søgning.
Køber op med Quandl Data
Quandl er et Toronto-baseret websted, der har til formål at være en søgemaskine til numeriske data. I modsætning til de fleste søgemaskiner genereres dets database ikke automatisk af edderkopper, der kryber på nettet. Det fokuserer snarere på linkede data, der opdateres viacrowdsourcing
- med andre ord manuelt opdateret via menneskelige kuratorer. Da de fleste økonomiske data er i numerisk format, er Quandl et glimrende værktøj til at holde sig ajour med den nyeste forretningsinformatik. Som du kan se, returnerer en søgning på Apple
over 4, 700 datasæt fra 11 forskellige kilder med tidsserier på dagligt, ugentligt, månedligt, kvartalsvis eller årligt niveau. Mange af disse resultater er relateret til FN's landbrugsdata. Hvis du leder efter data på Apple Computers, kan du begrænse omfanget af din søgning ved at erstatte Apple søgeordet med firmaets forkortelse, AAPL. Indekset for Apple-poster i Quandl-søgning. Quandl-databasen indeholder links til over 10 millioner datasæt (selv om den bruger en generøs metrisk til at erklære, hvad der adskiller et datasæt fra et andet). Quandl links til 2. 1 million FN datasæt og mange andre kilder, herunder datasæt i Open Financial Data Project, centralbankerne, ejendomsorganisationer og velkendte tænketanke.
Exploring Exversion Data Modelleret efter GitHub - den cloud-hosted platform, hvorigennem programmerere kan samarbejde og dele kode - Collaboration har til formål at give den samme samarbejdsfunktionalitet omkring data, som GitHub giver rundt kode. Exversion-platformen tilbyder versionskontrolfunktionalitet og hosting-tjenester, som du kan uploade og dele dine data med. For at illustrere hvordan Exversion fungerer, forestil dig en platform, der giver dig mulighed for at
gaffel
(eller kopiere) et datasæt og derefter foretage de ønskede ændringer. Exversion ville være der for at holde styr på, hvad der er ændret fra det oprindelige sæt og enhver ændring, du gør til det. Exversion tillader også brugere at bedømme, gennemgå og kommentere datasæt. Datasæt, der er hostet på Exversion-platformen, leveres enten af en bruger eller oprettet af en edderkop, der gennemgår og indekserer åbne data for at gøre det søgbart fra et enkelt applikationsprogrammeringsinterface (API).Ligesom GitHub, med en gratis brugerkonto, er alle de data, du uploader til Exversion, offentlige. Hvis du er villig til at betale for en konto, kan du oprette dine egne, private datalager. Også med den betalte konto får du mulighed for at dele dine data med udvalgte brugere til samarbejdsprojekter. Mapping OpenStreetMap Spatial Data
OpenStreetMap (OSM) er et åbent publikum, der er et alternativ til kommercielle kortlægningsprodukter som Google Maps og ESRI ArcGIS Online. I OSM opretter brugerne, uploader eller digitaliserer geografiske data i centraldatabasen.
OSM-platformen er ret robust. Regeringer og private virksomheder er begyndt at bidrage til og trække fra de delte datasæt. Selv virksomheder, der er så store som Apple, er afhængige af OSM-data. OSM har nu over 1 million registrerede brugere. For at illustrere, hvordan en person kan oprette data i OSM, forestille sig, at nogen forbinder GPS-systemerne på sin mobiltelefon til OSM-applikationen. På grund af denne tilladelse kan OSM automatisk spore vejruterne, mens personen rejser. Senere kan denne person (eller en anden OSM-bruger) gå ind på OSM online platform for at verificere og mærke ruterne.
Dataene i OSM lagres ikke som kort, men som geometriske og tekstrepræsentationer - punkter, linjer, polygoner og kortannoteringer - så alle OSM-data kan hurtigt downloades fra hjemmesiden og nemt samles i en kartografisk repræsentation via en desktop applikation.