De databaser bibliografisk répertorient enhver klasse af objekter bibliografiske bøger, samlinger, anmeldelser, magasin artikler via deres metadata såsom dens titel , forfatter, abstrakt, emne deskriptor. De er resultatet af computeriseringen af bibliotekskataloger og muliggør søgninger ved hjælp af nøgleord samt dataanalyse ( bibliometri osv.). WorldCat er et eksempel på en sådan database.
Bibliografiske databaser eller mere præcist bibliografiske referencedatabaser blev oprettet fra 1960'erne.
I årene 1960-70 er udtrykket databank privilegeret. Derefter udpeger den databaser, ofte med bibliografiske referencer på det tidspunkt, der vedrører "et defineret vidensområde og organiseret til at blive tilbudt til brugernes konsultationer". Dette udtryk gjorde det muligt at skelne disse dokumentarsystemer fra selve softwaren eller databasesystemer (DBMS).
Bibliografiske databaser har udviklet sig, især siden 2000'erne, langs to akser, som kan kombineres:
Udtrykket database, der bruges her, skal forstås med forsigtighed. Snarere er det mere en samling af data eller bibliografiske poster. Denne tilsyneladende enkle struktur kan skjule kompleksitetsfaktorer.
Optegnelsens struktur kan være relativt elementær (enkel samling af felter), mere kompleks med MARC-formater (eller i overensstemmelse med ISO 2709- standarden ) og nu af enhver struktur med XML .
Sammenlignet med relationsdatabaser kommer en kompleksitetsfaktor fra umuligheden af at fryse datastørrelsen. Næsten alle felterne har variabel længde med gentagelsesfaktorer, der kan blive meget store. For eksempel er et forfatternavn i gennemsnit mindre end 10 tegn, men der er forfattere på mere end 100 tegn. En videnskabelig artikel har i gennemsnit 2 eller 3 forfattere, men man kan finde fysikartikler med 500 forfattere.
Mange bibliografiske databaser indeholder oplysninger, der beskriver indhold ved hjælp af en liste med indeksudtryk eller nøgleord. Disse nøgleord hører ofte til terminologiske arkiver, hvis natur er variabel: enkel liste over kontrollerede ord, klassificeringsplan, dokumentar synonymordbog eller ontologi .
Ud over indeksering kan en stor del data henvise til specialiserede arkiver, såsom titler på tidsskrifter eller tilknytninger.
Endelig kodificerer visse databaser også referencerne til bibliografien over de behandlede artikler, såsom Science Citation Index, og den bibliografiske database bliver derefter sit eget arkiv.
De bibliografiske databaser er også defineret i henhold til de valgte temaer. De kan påvirke basens struktur væsentligt (for eksempel inden for biovidenskab kodificering af gener).
En base defineres også af dens dækning eller mere præcist, hvordan basen er sammensat. I mange tilfælde (Medline, Pascal) er dækningen defineret af et sæt anmeldelser, der systematisk analyseres.