ISO 15924

ISO 15924- standarden viser "Koder til repræsentation af scriptnavne  ". Den Unicode Consortium styrer kontoret for registrering og vedligeholdelse myndighed for standarden på vegne af ISO, som definerer og godkender standarden. Imidlertid er ISO 15924-standarden ikke en del af Unicode- standarden (som bruger ensartede scripts, der kun beskæftiger sig med abstrakte karakterskel).

Betegnelse og organisering af skrivesystemer i henhold til ISO 15924

Standarden definerer for hvert skrivesystem:

For en komplet (og opdateret) liste over definerede koder og navne henvises blot til det websted, der er angivet i slutningen af ​​artiklen.

Nomenklatur og numerisk klassificering

De digitale kodeelementer er grupperet i serie på hundrede efter typologien og den relative nærhed af skrivesystemerne (se eksempler nedenfor).

Kodeelementerne og navne er defineret for også at tage hensyn til de bibliografiske behov vedrørende hele tekster og dokumenter og er ikke kun forbeholdt isolerede tegn. Også forskellige skrivestil ved hjælp af det samme abstrakte alfabet har specifikke elementer, klassificeret med elementer tæt på den samme serie, hvis det er muligt i træk. Til dette tildeles de digitale kodeelementer ikke kun i trin på 1 (der er “huller” i nummereringen).

Følgende serier er i øjeblikket i brug:

Sammensætning og tildeling af alfabetiske kodeelementer

De alfabetiske kodeelementer med fire bogstaver bruger det grundlæggende alfabet med 26 bogstaver. Sagen med disse kodeelementer er ikke signifikant, men det anbefalede tilfælde bruger store bogstaver efterfulgt af tre små bogstaver. Disse alfabetiske kodeelementer er inspireret af skrifternes navne af mnemoniske grunde. Variantstilarter for det samme script adskiller sig dog så vidt muligt kun ved deres fjerde bogstav. Disse varianter kan også genkendes af deres lignende digitale kodeelementer i samme serie. For eksempel :

Eller:

Og også :

Imidlertid betegner to alfabetiske kodeelementer, der starter med de samme første tre bogstaver, ikke nødvendigvis to varianter af det samme skrivesystem (som muligvis kan ses takket være den numeriske klassifikation i separat serie):

Specielle kodetter

Hvis de standardiserede skrifter ikke er tilstrækkelige, er der 50 kodeelementer, der kan bruges efter brugerens skøn (de anvendte navne er ikke normative og kan ændres):

Der er specielle kodeelementer beregnet til tilfælde af uskrevne sprog (for eksempel til brug af klassificering af fotografier og video- eller lydoptagelser i samlinger af mediebiblioteker og museer), eller når en skrivning ikke kan bestemmes på en pålidelig måde, fordi flere ( i forskellige familier, og for hvilke hele ikke har en mere præcis foruddefineret kode), eller endda når teksten ikke er specificeret, men muligvis kan angives mere præcist med en anden kode:

Historisk

Denne liste over kodeelementer og scriptnavne blev oprettet og vedligeholdes af Michael Everson , også medlem af Unicode Technical Committee (UTC). Teksten til ISO 15924 blev først godkendt den9. januar 2004, der fastlagde de generelle principper for definitionen af ​​kodepunkter.

Den første liste over kodeelementer, der var meget komplette på det tidspunkt, blev offentliggjort den 1 st maj 2004online på Unicode Consortium-webstedet . Den omfattede blandt andet alle de scripts, der blev anvendt eller defineret på det tidspunkt i Unicode 4.0- standarden og ISO / IEC 10646-standarden. Et betydeligt antal korrektioner fulgte i de følgende uger, og listen blev færdiggjort den29. maj 2004.

Siden da er der regelmæssigt tilføjet nogle nye scripts til scripts behov i løbet af standardiseringen i ISO / IEC 10646 og Unicode eller til bibliografiske anvendelser såvel som til scripts, der endnu ikke er standardiseret, og som stadig skal være genstand for ' undersøgelser.

Forholdet til andre standarder og anbefalinger

Forholdet til ISO 639 sprogkodeelementer

Derudover starter ISO 15924-alfabetiske kodeelementer så vidt muligt med de samme bogstaver som de tre bogstaver sprogkodeelementer i henhold til ISO 639 -2 eller dens udvidelse ISO 639 -3 (som dækker en udvidet liste over sprog) , når navnene på manuskriptet og sproget er ensbetydende. For eksempel :

Den fremtidige ISO 639 -6- standard under forberedelse, som skal udvide sprogkodeelementerne til fire bogstaver (for at identificere et større antal sprogvarianter) tager dette princip op og bruger om muligt de samme kodeelementer, der allerede er bevaret i ISO 15924 for homonyme sprogskripter for at opretholde kompatibilitet med den nuværende RFC  5646 (BCP 47) standard:

IETF-sprogkode

ISO 15924 bruges af IETF-sprogkodestandarden .

Regionale indstillinger

ISO 15924 bruges undertiden til regionale indstillinger .

Forskelle i navne fra dem i ISO / IEC 10646

Der er ingen nøjagtig sammenhæng mellem de engelske og franske scriptnavne defineret i ISO 15924 og de engelske og franske betegnelser, der bruges i de normative navne på tegn og tegnblokke, der er tildelt i ISO / IEC 10646-standarderne (og derfor også Unicode ).

Fremtidige blokke af tegn og tegn, der er standardiseret i ISO / IEC 10646 (og derfor også Unicode), navngives dog, hvis det er muligt, i overensstemmelse med ISO 15924.

Forskelle mellem alfabetiske kodeelementer og dem i Unicode- standarden

Ligeledes er der ingen nøjagtig sammenhæng mellem de alfabetiske kodeelementer , der er standardiseret i ISO 15924, og de scriptkoder, der bruges i egenskabstabellerne med Unicode- tegn . Faktisk indeholder ISO 15924-standarden yderligere elementer, der skelner til bibliografisk brug, mellem scripts, der er samlet i ISO- og Unicode-tegnkodningsstandarderne. ISO 15924-standarden indeholder kodeelementer og særprægede navne til scripts, der således er blevet samlet i en i Unicode (som behandler dem som typografiske varianter uden forskel i kodning af tegn og deres normative eller informative egenskaber).

På den anden side, da ISO 15924-standarden blev oprettet efter Unicode-standarden, kan formatet på ISO 15924-alfabetiske kodeelementer afvige fra de normative koder, der anvendes i Unicode-egenskabstabellerne (som kan være længere og indeholder understregninger).

Kun til informationsformål definerer ISO 15924-standarden et alias (eller "synonym for egenskabsværdi") til standardskripter for at kende korrespondancen med karakteregenskaberne defineret i Unicode-standarden, når en sådan forskel eksisterer. Siden ISO 15924-standarden blev offentliggjort, har Unicode Consortium forpligtet sig til ikke længere at definere nye koder udover dem, der er defineret i ISO 15924, og bruger derfor, når det er muligt, de alfabetiske kodeelementer i ISO 15924-standarden. Det er derfor ikke alle synonymer for Unicode-egenskaber er nævnt i ISO 15924-tabellerne (de anvendte koder kan findes i egenskabsfilerne i selve Unicode-standarden, og Unicode har tilføjet synonymer for karakteregenskabsværdier, som nu kun tillader ISO 15924-kodepunkter, der skal bruges i Unicode-kompatibel applikationer).

Se også

eksterne links

Relaterede artikler

  1. (in) Anmodning om kommentarer nr .  5646 .