De åbne data og de åbne data er datadigitale inklusive adgang og brug overlades gratis til brugere, som kan komme fra private kilder, men for det meste offentlige, især produceret af et samfund eller en offentlig institution. De distribueres på en struktureret måde efter en metode og en åben licens, der garanterer deres fri adgang og genbrug af alle uden tekniske, juridiske eller økonomiske begrænsninger.
Adgang til data har på den ene side til formål at give borgerne bedre kontrol over administrationen, på den anden side at bruge disse data, hvilket indebærer, at denne ret til adgang ledsages af en ret til genbrug.
Disse rettigheder til adgang og genbrug er en del af tankegangen, der betragter offentlig information som et fælles gode (som defineret af Elinor Ostrom ), hvis formidling er af almen og almen interesse .
Dataens åbenhed er således både en filosofi om adgang til information, en bevægelse til forsvar for friheder og en offentlig politik .
Nogle lande var pionerer, herunder USA , Storbritannien , Australien og Canada og derefter Frankrig . Bevægelsen har spredt sig især under impulser fra NGO'er som Open Knowledge Foundation (OKFN) og Open Government Partnership (PGO).
Data er åben, hvis alle frit kan få adgang til dem, bruge dem, ændre dem og omfordele dem, uanset hvad deres formål er.
Den åbne data er en bevægelse af skuespillere kæmper for åbne data. Det er også en offentlig politik, der består i at åbne offentlige data for at fremme åben innovation i den offentlige sektor, være ansvarlig over for borgerne og forbedre gennemsigtigheden i den offentlige handling og til sidst stille ressourcer til rådighed for den private sektor. .
Artikel 15 i erklæringen om menneskerettighederne og borgeren fra 1789 nævner, at samfundet har ret til at stille enhver offentlig embedsmand i dets administration til ansvar. Denne artikel udgør det juridiske grundlag for retten til adgang til offentlig information.
Den Freedom of Information Act , implementeret i 1967, skaber en ret til information til borgerne. Det blev især ændret i 2007 ved OPEN Government Act .
FrankrigOpen Data er en udvidelse af fremgangsmåden, der følger af loven af 17. juli 1978 vedrørende adgang til administrative dokumenter, selvom dette ikke kræver offentliggørelse af digitale data eller proaktiv offentliggørelse af information. Den anerkender simpelthen retten til at få formidling af dokumenter, som en administration har, uanset deres form eller medium.
I Den Europæiske Union tilskynder direktiv 2003/98 / EF (" Offentlig sektorinformation " (PSI )) fra Rådet for Den Europæiske Union af 17. november 2003 om genbrug af offentlige data og INSPIRE- direktivet i 2008 åbne data .
Direktiv 2019/1024 ”Direktiv om åbne data” fra 2019 erstatter direktivet fra 2003.
Forenede StaterMed valget af Barack Obama bliver åbningen af offentlige data en central akse for den amerikanske regering med Open Government Initiative, som også nævner kriterierne for offentliggørelse af open data.
I sin indvielsestale meddelte Barack Obama, at han havde til hensigt at "skabe et hidtil uset niveau af åbenhed i regeringen " med det formål at "styrke demokratiet og fremme dets effektivitet inden for regeringen" .
I marts 2009, lancerer den amerikanske regering den føderale open data portal data.gov . I december samme år fastlægger det åbne regeringsdirektiv de tre søjler for samarbejde mellem staten og borgerne, som er: regeringens gennemsigtighed, deltagelse og samarbejde. Vivek Kundra , førende føderale informationssystemer ( Chief Information Officer ) i Obama-administrationen, bemærker, at "frigivelsen af disse data har ført til en gemning af applikationer [...] der har været en eksplosion af disse samfundsudviklere" .
UKI Det Forenede Kongerige opfordrer artiklen offentliggjort af The Guardian i 2006 "Giv os tilbage kronjuvelerne" en liberalisering af offentlige data og tjener som "det indledende øjeblik for bevægelsen med åben data " .
Gordon Brown lancerede den åbne dataportal Data.gov.uk i januar 2010 under ledelse af Tim Berners-Lee .
FrankrigI Frankrig har visse lokale myndigheder som Rennes eller Paris iværksat en åben datatilgang i 2010. På nationalt plan oprettede regeringen i februar 2011 Etalab- missionen , en tjeneste fra premierministeren, der er ansvarlig for at koordinere denne offentlige politik for åbne data, og lancerede en bestemt portal, data.gouv.fr , i december samme år.
På G8-topmødet i 2013 underskrev statsoverhovederne for G8 et " G8-charter til åbning af offentlige data ."
I Frankrig giver loven for en digital republik i oktober 2016 i Frankrig, som fastlægger princippet om åben som standard kommunikationsbare offentlige data og skaber begrebet offentlig datatjeneste , åbne data et lovgivningsmæssigt grundlag.
Det er de åbne data fra Public Health France om Covid-19-pandemien, der har gjort det muligt for et samfund af analytikere at offentliggøre grafer og kort efter pandemien på nationalt niveau, blandt dem Guillaume Rozier .
Åbningen af data om offentlige finanser har været kernen i den åbne dataflytning fra starten. I 2007, i Storbritannien, designede Jonathan Gray projektet " Hvor går mine penge hen ", en visualisering af britiske regerings udgiftsdata , der giver borgerne let adgang til dem.
Åben videnskabelig data og åben adgang er to relaterede, men forskellige emner. Open access vedrører videnskabelige publikationer, ofte peer-reviewed. Åbning af videnskabelige data kan vedrøre de data, som disse artikler er baseret på, eller enhver database af videnskabelig art (for eksempel meteorologiske optegnelser eller andre) for at tillade reproduktion af de udførte eksperimenter for at bekræfte eller bekræft dem. ugyldiggør dem.
De kan også være data fra offentlige videnskabelige forskningsinstitutter (eller private, der drager fordel af offentlig finansiering, eller frivilligt ønsker at åbne og dele deres data), ofte samtidig med gratis formidling af forskningsresultater; man taler derefter i denne sammenhæng om "fri adgang" eller "fri formidling" , hvis første definition blev givet i den internationale erklæring om åben adgang i Budapest, som blev afholdt den14. februar 2002, kendt under akronymet BOAI (fra det engelske Budapest Open Access Initiative ) .
Derfra er der kommet mange andre initiativer andre steder i verden med f.eks. Berlinerklæringen fra 2003 om fri adgang til viden inden for videnskab og humaniora ; fulgt i marts 2005, fra Southampton , en ny erklæring hedder Berlin III at styrke de foranstaltninger, der er vedtaget som en del af Berlin I .
Projektet til sekventering af det humane genom blev muliggjort af et Open Data Consortium oprettet på forslag af Jim Kent (en) i 2003, hvis modtagere blandt andet vil være udviklingslande , hvor universiteter og forskningscentre ikke altid har adgang til videnskabelige tidsskrifter.
I 2010 lancerede EU den lovgivningsmæssige projekt om åbning af transport af data via intelligente transportsystemer (ITS) direktiv og afklaret sin ansøgning i 2017 med delegerede forordning (EU) 2017/1926.
I Frankrig er åbningen af data vedrørende transport underlagt flere love. For det første Macron lov af 2015 forpligter transport organiserende myndigheder til at give fast passager- transport af data . Derefter udvider Lemaire-loven fra 2016 gennem forpligtelsen til at åbne data af almen interesse, såsom dem, der er produceret inden for rammerne af delegationer for public service (DSP) , det dataområde, der skal åbnes. Dette vedrører især transportdata, fordi DSP er den mest anvendte styringstilstand for bypassagertransport i Frankrig.
Den 2019 Mobilitet Orientering Law (LOM) angiver disse data åbning forpligtelser og udvider dem. Den specificerer, at det er mobilitetsorganiserende myndighed (AOM), der er ansvarlig for at koordinere levering af data. Formålet med at åbne disse data er at lette udviklingen af MaaS (Mobility as a service) applikationer og tjenester, der samler flere rejseløsninger .
Disse data er både statiske og dynamiske rejse- og trafikdata samt historiske trafikdata. Faktisk forklarer LOM gennem artikel L1115-1 i transportkodeksen , at de data, der skal åbnes, er dem, der er specificeret i tillægget til delegeret forordning (EU) 2017/1926, her er nogle eksempler:
Den LOM går videre end den europæiske forordning, som kun forpligter offentliggørelse af statiske data, og udvider åbenhed af data til dynamiske data, at ladestik til elektriske eller hybride køretøjer samt til samkørsel tjenester , som skal give et adgangspunkt til deres tjenesteudbud .
Den styring af åbne data er også angivet af LOM . Artikel L1115-2 nævner, at AOM eller transportoperatører skal sikre "leverer data op til standarder og opdateringer gennem det nationale adgangspunkt (NAP)." I Frankrig er det nationale adgangspunkt transport.data.gouv- stedet, der i april 2021 høstede 441 datasæt.
Den publikation licens er ikke pålagt af LOM , men det er som led i Lemaire lov af 2016, der finder anvendelse, og gør det muligt at åbne dataene under Etalab licens eller under ODbL licens (Open Database License) .
Endelig med hensyn til dataformatet indfører den europæiske forordning standarder, der letter interoperabilitet : valg af NeTEx- eller TAP PSI- og SIRI- standarder eller specifikationer i realtid . Imidlertid er meget af de data, der offentliggøres af private operatører og offentlige myndigheder, i GTFS- format . I sidste ende vil NAP levere gfts-datakonverter til NETEX-format, så AOM kan overholde forordningen.
Det åbne data- økosystem inkluderer aktører fra civilsamfundet som Open Data Institute eller Open Knowledge Foundation eller OpenStreetMap , offentlige administrationer, private virksomheder, aktører fra forskningsverdenen, aktører fra journalistikens verden, finansierere og internationale organisationer.
I 2010 etablerede Sunlight Foundation en liste over ti kriterier, der karakteriserer åbne data. For at data skal siges at være "åbne", skal de være:
I 2010 foreslog Tim Berners-Lee en åben datakvalitetsskala (1 til 5 stjerner).
★ | Ufiltrerede data (muligvis nedbrudt) fx uploadet med ethvert format |
★ ★ | Data tilgængelige på en struktureret måde (f.eks. Tabeldata i CSV , XML , Excel , RDF ) |
★ ★ ★ | Gratis data, der kan udnyttes - lovligt (se licenser) - teknisk (i ikke-proprietære formater, ikke specielt i Excel) |
★ ★ ★ ★ | Data identificeret ved webadresser (med opdateringsdato), så vi kan "pege" et link til dem (og muligvis finde dem opdaterede) |
★ ★ ★ ★ ★ | Data, der er knyttet til andre data, for at kontekstualisere og berige dem |
Denne skala vedrører grundlæggende digitale data, men dens kriterier kan tilpasses til aggregerede data eller mere kompliceret offentlig information (fotos, videoer, rapporter, undersøgelser osv., Som også skal sættes online, ideelt med kvalitetsmetadata . Og kan også omfatte hypertekst i tilfælde af rapporter og undersøgelser eller endda visse videoer)
Det primære mål var at sætte data produceret af staten eller andre online uden at vente på implementeringen af et samfund af private interesser ( jf. Nedenstående debat om kylling eller kyllingeparadox. Ægget ), hvilket kunne bremse tilgængeligheden af data på netværket, og derfor indirekte bremse fremkomsten af teknologiske gennembrud inden for den semantiske webbevægelse, som Tim Berners-Lee er en af initiativtagerne til.
Inden for flere forskningsområder, på trods af opfordringer til god praksis inden for gennemsigtighed og datadeling, meddeles rådataene ikke af forfatterne, ikke engang til anmelderne.
Mange videnskabelige svig i forskning kunne ikke opdages tidligt af revisionsudvalgene, fordi forfatterne nægtede at dele deres data (selv nogle gange med deres medforfattere), især inden for psykologi, hvor 50% af eksperimenterne viser ikke-reproducerbare resultater, som udgør alvorlige problemer med tillid til resultaterne og har skabt et initiativ kaldet peer reviewers 'Openenness Initiative , hvorefter når der ikke er nogen etiske grunde til ikke at gøre det, bør gennemsigtighed og åbenhed af data være grundlæggende værdier for videnskaben, især for at muliggøre korrekturlæsers arbejde.
Der findes forskellige moderne måder til deling af videnskabelige data, herunder førudgivelse og efterudgivelse. Derudover ser forfattere, der deler deres data, deres chancer for at blive citeret øges.
I Storbritannien har krydsning af åbne data muliggjort en reduktion på 30% i energiforbrugsregningen i offentlige bygninger på bare to måneder.
Åbne data muliggør ideelt set fair konkurrence mellem alle virksomheder. Sociologiske undersøgelser i Indien og Canada har imidlertid vist, at adgang og brug af åbne data er betinget af materiale (elektricitet, besiddelse af computerudstyr) og sociale (uddannelses) kriterier.
I henhold til visse undersøgelser vil frigivelsen af disse offentlige data desuden opdele med fem den kapital, der er nødvendig for at udøve en professionel aktivitet i mobiltelefonisektoren . MEPSIR-rapporten fra 2006, finansieret af Europa-Kommissionen, anslår, at det europæiske marked, der er knyttet til genbrug af offentlig information, repræsenterer 27 milliarder euro.
Derudover er de direkte og indirekte økonomiske virkninger blevet anslået til 140 mia. Euro om året for Europa.
Fra og med 2016 har flere regeringer planer om at udvikle kunstig intelligens . Disse regeringer understregede den vigtige rolle, som åbne data spiller for udviklingen af en økonomisk sektor med kunstig intelligens.
Der er forskellige meninger om implementeringen af åbne data, som koges ned til ” Kylling- og ægparadoxet ”:
Åbning af data kræver påføring af en licens, der angiver betingelserne for, at disse data kan kopieres, distribueres, genbruges frit. Da juridiske sammenhænge varierer fra land til land, anvendes forskellige licenser i dag rundt om i verden.
Open data commons er et projekt, der blev lanceret i Storbritannien i december 2007 af Open Knowledge Foundation . Den første gratis licens til projektet blev udviklet i marts 2008 af Jordan Hatcher og D r Charlotte Waelde.
Disse licenser kan anvendes på databaser, og de data, de indeholder, tages isoleret. Den Open Viden Foundation har udviklet tre typer af free data licenser, som er baseret på deres interne lovgivning, selv baseret på den angelsaksiske model, og som adskiller sig fra Romano-germanske rettigheder, dvs. civilret, med en mere anerkendt og succesrig beskyttelse af moralsk rettigheder. Derfor er anvendelsen af nogle af disse licenser på intellektuelle værker ikke gyldig i Frankrig, men kan overvejes til formidling af offentlige data, for så vidt de pr. Definition er offentlige.
Public Domain Dedikation og licensDet offentlige rum og License (PDDL) giver mulighed for at bruge, kopiere, modificere, redistribuere en database uden nogen begrænsning. Det er en fri licens for alle rettigheder, public domain type. Dataene kan derfor bruges på en helt gratis måde, og forfatteren opgiver sine moralske rettigheder.
Åbn Database CommonsDenne licens, som findes under akronymet ODC-by, giver tilladelse til brug, kopiering, omfordeling, ændring, produktion af værker, der stammer fra databasen, med forbehold for angivelse af navnet på forfatteren af den oprindelige database. Disse principper findes i Creative Commons By-licens .
Open Data Commons Åben databaselicensODbL-licensen er baseret på copyright og sui generis-databaseret. Det giver brugerne mulighed for at kopiere, distribuere, bruge, ændre og producere et afledt værk fra en database, der er genstand for omfordeling på samme betingelser som den oprindelige licens. Det indebærer også at angive navnet på forfatteren af den originale database.
Med undtagelse af den specialdesignede CC-0-licens er licenser i Creative Commons-familien ikke egnede til databasebrug. De er faktisk kun centreret om ophavsret og forsømmer databasernes sui generis- ret : dette risikerer på den ene side at gøre dem ineffektive (overholdelse af deres forpligtelser er ikke længere knyttet til overførsel af rettigheder.) Og på den anden side for at gøre usikker status på de data, der formidles under disse licenser (den mulige sui generis- ret til, at databaser ikke deles).
I henhold til fransk lovgivning anses offentlige data for sandsynligt at indeholde følsomme oplysninger, enten fordi de gør det muligt at identificere en person, eller fordi de er underlagt ophavsret, statshemmelighed eller af nationale forsvarshensyn . I denne sammenhæng kan data ikke formidles frit uden forudgående tilladelse eller skal være genstand for anonymisering. Når tv-rettighederne er garanteret, gælder licenser. Forskellige organisationer har udviklet gratis licenser, der gælder for enhver form for indhold, offentlighed eller skabelse af sindet. Dette er enkle forretningslicensmodeller, der ikke kræver overholdelse. Ikke-offentliggjorte kontrakter kan udarbejdes på betingelse af, at national lovgivning respekteres, både med hensyn til bestemmelserne i lovene af 17. juli 1978 eller endda den 6. januar 1978 og med hensyn til reglerne for den offentlige orden, der gælder for kontrakten. I Frankrig er der anbragt op til fem forskellige genbrugslicenser til åbne data. I 2013 førte harmoniseringen af praksis til brugen af to standardlicenser, der blev anvendt i tilsvarende proportioner: Open License og Open Database License.
Licens fra det franske justitsministeriumJustitsministeriet har taget initiativ til at designe en licens tilpasset offentlige data, den frit genanvendelige offentlige informationslicens, der almindeligvis kaldes LIP.
Det giver mulighed for at genbruge dataene fra ministeriets katalog gratis, selv til kommercielle formål på betingelse af at nævne kilderne, datoen for opdateringen, ikke for at ændre dataene og ikke forvride betydningen.
Det forudsættes også, at brugeren kun kan godkende en ny genbrug under en licens på betingelse af at have merværdi til de originale data.
Åben licensDenne licens oprettet af ETALAB er især beregnet til at blive brugt på data.gouv.fr.
Åbn databaselicensODbL-licensen er blevet oversat til fransk af byen Paris for at tilpasse den til national brug. En række projekter bruger denne licens, fra OpenStreetMap til lokalsamfund (Paris, Nantes, Toulouse ...).
Den Open Viden Foundation offentliggjorde Global åbne data indeks .
Den World Wide Web Foundation udgiver Open data barometer til at måle åbenhed af data og dens indvirkning efter land.
Den OECD udgiver en ranking kaldet Open Government data om åbenhed offentlige data i medlemslandene.
Hvert år i slutningen af februar eller begyndelsen af marts arrangerer Open Knowledge Foundation den åbne datadag (i) .