HTML
Udvidelser | .html, .htm |
---|---|
MIME-type | text/html |
Udviklet af | World Wide Web Consortium & WHATWG |
Oprindelig version | 1993 |
Formattype | Markup sprog |
Baseret på | Standard generaliseret markup sprog |
Oprindelse af | XHTML |
Standard |
ISO / IEC 15445 W3C HTML 4.01 W3C HTML5 |
ISO | 15445 |
Specifikation | Åbent format |
Websteder |
www.w3.org/html html.spec.whatwg.org/multipage w3c.github.io/html |
Den HyperText Markup Language , almindeligvis forkortet HTML eller i sin seneste HTML5 er det kodesprog designet til at repræsentere websider .
Dette sprog tillader:
Det bruges ofte i forbindelse med JavaScript- programmeringssprog og Cascading Style Sheets (CSS). HTML er inspireret af SGML ( Standard Generalized Markup Language ). Dette er et åbent format .
Det engelske Hypertext Markup Language oversættes bogstaveligt talt til hypertext markup sprog . Normalt bruges akronymet HTML, undertiden gentages ordet "sprog" som i "HTML-sprog". Hypertekst er undertiden skrevet HyperText for at markere T i akronymet HTML.
Den til tider uoplyste offentlige talende HTM i stedet for HTML, hvor HTM er filtypenavnet forkortet til tre bogstaver, en begrænsning der findes på ældre operativsystemer fra Microsoft .
I første halvdel af 1990'erne , før fremkomsten af web-teknologier , såsom f.eks JavaScript (JS), Cascading Style Sheets (CSS), og Document Object Model (Dom), udviklingen af HTML dikterede udviklingen af World Wide Web . Siden 1997 og HTML 4 er udviklingen af HTML bremset betydeligt; 10 år senere bruges HTML 4 stadig på websider . I 2008 er specifikationen af HTML5 under undersøgelse og bliver almindelig brugt i anden halvdel af 2010'erne .
HTML er en af de tre opfindelser, der dannede grundlaget for World Wide Web sammen med Hypertext Transfer Protocol (HTTP) og webadresser ( URL'er ). HTML blev opfundet for at gøre det muligt at skrive hypertekstuelle dokumenter, der forbinder forskellige internetressourcer med hyperlinks . I dag kaldes disse dokumenter " webside ". IAugust 1991, når Tim Berners-Lee offentligt annoncerer på internettet på Usenet , citerer han kun SGML , men giver URL'en til et suffiksdokument.html.
I sin bog Vævning på nettet , Tim Berners-Lee beskriver beslutningen om at basen HTML på SGML som værende som "diplomatisk", som det er teknisk: teknisk, han fandt SGML for kompleks, men han ønskede at tiltrække den hypertekst samfund , der så SGML som sproget. det mest lovende for standardisering af formatet på hypertekstdokumenter. Derudover var SGML allerede i brug af sin arbejdsgiver, Den Europæiske Organisation for Atomforskning (CERN). ;
De første HTML-elementer inkluderer:
Beskrivelsen af HTML er så ret uformel og defineres hovedsageligt af support fra forskellige moderne webbrowsere . Dan Connolly hjalp med at gøre HTML til en ægte SGML- applikation .
HTML-tilstanden svarer derefter til det, vi kunne kalde HTML 1.0 . Der er dog ingen specifikationer med dette navn, især fordi sproget var i fuld udvikling. Men en standardisering indsats var i gang. Fra slutningen af 1993 blev udtrykket HTML + brugt til at henvise til den fremtidige version af HTML. På trods af den således initierede standardiseringsindsats, og indtil slutningen af 1990'erne blev HTML primært defineret af browserimplementeringer.
Med NCSA Mosaic- browseren kender HTML to store opfindelser:
Med fremkomsten af Netscape Navigator 0.913. oktober 1994understøttes mange præsentationselementer: tekstattributter, blinkende, centrering osv.
HTML-udvikling tager derefter to forskellige stier:
Designere følger SGML's principper om at overlade præsentation til et stilsprog. I dette tilfælde er Cascading Style Sheets (CSS) beregnet til HTML. Kun understøttelsen af tabeller integreres hurtigt i browsere, især fordi det giver en meget klar forbedring af præsentationen. Ud over multiplikationen af præsentationselementer er software, der producerer og bruger HTML, ofte udtænkt af dokumenter som en række formateringskommandoer snarere end som en markering, der repræsenterer træstrukturen i dag kendt som Document Object Model (DOM). Manglen på struktur af HTML, der derefter blev implementeret, fordømmes undertiden som " tag suppe " på engelsk : tag suppe .
I Marts 1995, det nystiftede World Wide Web Consortium (W3C) tilbyder resultatet af sin forskning i HTML +: HTML 3.0- udkastet . Det inkluderer understøttelse af tabeller, figurer og matematiske udtryk. Dette udkast udløber den28. september 1995uden direkte opfølgning. I slutningen af 1995 blev RFC 1866, der beskriver HTML 2.0, afsluttet. Hovedredaktøren er Dan Connolly . Dette dokument beskriver HTML, som det eksisterede førJuni 1994, så uden de mange tilføjelser af Netscape Navigator .
Det 14. januar 1997, offentliggør W3C HTML 3.2- specifikationen . Den beskriver den nuværende praksis, der blev observeret i begyndelsen af 1996 , derfor med en del af tilføjelserne af Netscape Navigator og Internet Explorer . Dens vigtigste nyheder er standardisering af tabeller og mange præsentationselementer. HTML 3.2 går forud for HTML 4.0 snævert og indeholder elementer til styling og scripting support.
Det 18. december 1997, offentliggør W3C HTML 4.0- specifikationen, som standardiserer mange udvidelser, der understøtter typografier og scripts, rammer og objekter (generaliseret indholdsinddragelse). HTML 4.0 bringer også forskellige forbedringer for tilgængeligheden af indhold, hovedsageligt muligheden for en mere eksplicit adskillelse mellem struktur og præsentation af dokumentet eller understøttelse af yderligere information om bestemt komplekst indhold såsom formularer, tabeller eller akronymer. HTML 4.0 introducerer tre variationer af formatet, der har til formål at fremme udviklingen mod mere meningsfuld markering, mens der tages højde for de midlertidige begrænsninger af produktionsværktøjer:
Disse variationer fortsatte derefter uden væsentlige ændringer i HTML 4.01 og i XHTML 1.0- overgangsformatet fra HTML. Den seneste HTML-specifikation er version 4.01 dateret24. december 1999. Det foretager kun mindre rettelser til version 4.0 .
Udviklingen af HTML som en anvendelse af Standard Generalized Markup Language (SGML) opgives officielt til fordel for XHTML , en anvendelse af Extensible Markup Language (XML). I 2004 oprettede udgivere af webbrowsere imidlertid webgruppen Hypertext Application Technology (WHATWG) med det formål især at genstarte udviklingen af HTML-formatet og imødekomme nye behov på et teknologisk grundlag, der anses for lettere implementeret end det. den XHTML 2.0 er udformet. Dette er en del af sammenhængen med en mere generel udfordring for driften af W3C, som nogle udviklere og webdesignere anser for for lukkede.
I Marts 2007, der trækker konsekvensen af en del af branche- og webindholdsdesignernes modvilje mod XHTML 2.0 , genstarter W3C udviklingen af HTML og opretter en ny arbejdsgruppe under opsyn af Chris Wilson ( Microsoft ) og oprindeligt Dan Connolly ( W3C ), nu Michael Smith ( W3C ). Disse inkluderer:
Arbejdet i WHATWG blev formelt vedtaget i Maj 2007som udgangspunkt for en ny HTML5- specifikation . Dette dokument blev offentliggjort som et Working Draft on22. januar 2008. Blandt de designprincipper, som arbejdsgruppen nævner, er især:
En taskforce for tilgængelighed oprettes af W3C inovember 2009for at løse kompatibilitetsproblemerne i det nye format med tilgængelighedsstandarder , især knyttet til implementeringen af ARIA , til tekstalternativer og til nye elementer canvasog video.
Udviklingen af XHTML 2.0 fortsættes oprindeligt parallelt som svar på behovene i andre områder af internettet, såsom mobile enheder, virksomhedsapplikationer og serverapplikationer. Så indjuli 2009, beslutter W3C ikke at forny XHTML 2- arbejdsgruppen i slutningen af 2009.
Når XHTML 2 opgives , forbliver version XHTML 1.1 derfor den standardiserede version. HTML5 er kompatibel med XHTML og XML og tillader derfor XHTML5- dokumenter . Det er dog sandsynligt, at W3C bevæger sig mod en direkte opgivelse af XHTML 1.1 , fordi implementeringen af XML i HTML5 gør definitionen af dokument af typen XHTML y unødvendig . y (hvor yy er versionsnumrene).
I januar 2011, meningsforskelle mellem Ian Hickson (ingeniør hos Google), der skriver HTML5-specifikationen, og medlemmerne af W3C-arbejdsgruppen leder WHATWG til at skabe HTML-levestandard (bogstaveligt talt: levestandard til HTML), en specifikation af HTML beregnet til være i konstant udvikling for at holde fast i den hurtige udvikling af nye funktionaliteter fra udviklere af browsere (i modsætning til nummererede versioner, derfor "faste").
Den HTML-Living Standard har til formål at omfatte HTML5, og at udvikle det kontinuerligt. Især i versionen af22. august 2012, forklarer referencedokumentet, at W3C HTML5, offentliggjort den 22. juni 2012, er baseret på en version af HTML-levestandarden , men at HTML-levestandarden ikke stopper ved denne version og fortsætter med at udvikle sig. Den udvikler især forskellene mellem W3C-versionen (HTML5) og HTML-levestandardversionen (for eksempel tages der ikke højde for nye fejl i HTML5, syntaktiske forskelle vises, og nye tags oprettet af HTML-levestandarden er ikke inkluderet i HTML5).
HTML er et sprog til dokumentformatbeskrivelse, der har form af et markup-sprog, hvis syntaks kommer fra Standard Generalized Markup Language (SGML).
Op til og med version 4.01 beskrives HTML formelt som en anvendelse af SGML ( Standard Generalized Markup Language ). Efterfølgende specifikationer indrømmer imidlertid på forskellige måder, at brugeragenter i praksis ikke er i overensstemmelse med SGML- parsere . De webbrowsere har ikke været i stand til at dechifrere alle variationer tilladt efter syntaks af SGML ; på den anden side er de generelt i stand til automatisk at fange mange syntaksfejl ifølge den første del af " Postels lov ": "Vær liberal i det, du accepterer, og konservativ i det, du sender" ( RFC 791). Faktisk har udviklere af websider og webbrowsere altid taget stor frihed med de syntaktiske regler i SGML . Endelig blev HTML- dokumenttypedefinitionen (DTD), den formelle tekniske beskrivelse af HTML, ikke skrevet af Dan Connolly før et par år efter introduktionen af HTML.
På trods af de friheder, der er taget med standarden, anvendes den terminologi, der er specifik for SGML : dokument, element, attribut, værdi, tag, enhed, gyldighed, anvendelse osv. Takket være DTD er det muligt automatisk at kontrollere gyldigheden af et HTML-dokument ved hjælp af en SGML- parser .
Oprindeligt blev HTML designet til simpelthen at markere (eller markere) tekst, herunder tilføje hyperlinks til den. Vi brugte et minimum af tags, som i følgende HTML-dokument:
<TITLE>Exemple de HTML</TITLE> Ceci est une phrase avec un <A HREF=cible.html>hyperlien</A>. <P> Ceci est un paragraphe où il n'y a pas d'hyperlien.Dette eksempel indeholder tekst, fem tags og en enhedsreference:
Et gyldigt HTML-dokument er et dokument, der respekterer SGML- syntaks , kun bruger standardiserede elementer og attributter og respekterer indlejringen af elementer, der er beskrevet i standarden. Der mangler kun en dokumenttypedeklaration fra det foregående eksempel, for at det kan være et gyldigt HTML 2.0-dokument.
Et gyldigt dokument er dog ikke tilstrækkeligt til at overholde den målrettede HTML-specifikation. Foruden gyldighedskravet er et overensstemmende dokument faktisk underlagt andre begrænsninger, som ikke udtrykkes af dokumenttypedefinitionen (DTD), men som udtrykkes af selve specifikationen. Dette er især tilfældet for indholdstypen for visse attributter, f.eks. For attributten datetime : for at være i overensstemmelse med HTML 4.01 skal den selv overholde et undersæt af ISO 8601- standarden . En strengt SGML- parser som f.eks. W3C HTML-validatoren kan derfor ikke garantere et HTML-dokuments overensstemmelse.
I de tidlige år blev HTML-dokumenter ofte set som flade strukturer og tags som stilkommandoer. Så tagget <p>blev betragtet som et linjeskift, og tagget </p>blev ignoreret. Eller når JavaScript 1.0 dukkede op, gav det kun adgang til dokumentlink og formularer gennem tabeller document.formsog document.links.
Med introduktionen af Cascading Style Sheets og Document Object Model blev det nødvendigt at overveje, at HTML-dokumenter har en ægte træstruktur med et rodelement, der indeholder alle de andre elementer. Disse elementers åbnings- og lukemærker forbliver valgfri. Men i dag er der en tendens til at markere hvert element og angive DTD. Med undtagelse af rodelementet har hvert element nøjagtigt et direkte overordnet element; dette "dokumenttræ" bruges især af formateringsstrukturen, der er afledt af det, til anvendelse af kaskadestilark, hvor hvert element kan have sin egen baggrund, kant og margen.
Websites struktur og kode kan også ses ved at tilføje view-source:foran url på siden. For den aktuelle side, der ville give . view-source:https://fr.m.wikipedia.org/wiki/Hypertext_Markup_Language
HTML-kilde | Dokumentskabelon |
---|---|
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN"> <html> <head> <title> Exemple de HTML </title> </head> <body> Ceci est une phrase avec un <a href="cible.html">hyperlien</a>. <p> Ceci est un paragraphe où il n’y a pas d’hyperlien. </p> </body> </html> |
html hoved titel tekst legeme tekst på tekst tekst s tekst |
Den version 4 af HTML beskriver 91 elementer . Efter specifikationen af HTML 4 kan funktionerne implementeret af HTML opdeles som følger:
Generel struktur for et HTML-dokument På det højeste niveau er et HTML-dokument adskilt mellem en overskrift og en brødtekst. Overskriften indeholder oplysninger om dokumentet, herunder dets titel og muligvis metadata . Kroppen indeholder det, der vises. Sprogoplysninger Det er muligt at angive sproget i en hvilken som helst del af dokumentet og styre blandingen af tekst skrevet fra venstre til højre med tekst fra højre til venstre . Semantisk tagging HTML hjælper med at differentiere specifikt indhold såsom citater fra eksterne værker, computerkodestykker, understregede passager og forkortelser. Nogle af disse elementer, der oprindeligt er designet til at understøtte teknisk dokumentation, bruges meget sjældent (differentiering mellem variable og eksempelværdielementer i f.eks. En computerkode eller endda en forekomst af et udtryk defineret i sammenhængen). Lister HTML skelner mellem uordnede og ordnede lister , afhængigt af om den formelle rækkefølge af indholdet i koden er information i sig selv. De lister definition findes også, men deres anvendelsesområde er præcist fastlagt. Tabeller Denne funktionalitet bruges formelt til præsentation af tabeldata, men blev hovedsageligt udnyttet til dens layoutmuligheder, før Cascading Style Sheets (CSS) nåede en tilstrækkelig grad af modenhed. Hyperlinks Den primære funktionalitet af HTML. Inkludering af billeder, applets og diverse genstande Oprindeligt tillod HTML kun hyperlinks til eksterne medier. Opfindelsen af specialiserede elementer til multimedier tillod automatisk inkludering af billede, musik, video osv. på websider. Gruppering af elementer Disse generiske elementer giver ikke nogen betydning for det indhold, de markerer, og det gør det muligt at anvende præsentationsstilarter, udføre behandling via scripts eller andre operationer, der kræver isolering af en del af indholdet. Præsentationsstil Hvert element eller endda hele dokumentet kan have typografier anvendt. Typografier er defineret i dokumentet eller kommer fra eksterne Cascading Style Sheets (CSS). Markering af tekstpræsentation Udviklet før generaliseringen af CSS til hurtigt at levere funktionalitet til grafiske designere. Det meste af brugen er nu officielt modløs. Rammer Også kendt som frames , en ofte kritiseret funktion, der lader dig vise flere HTML-dokumenter i et enkelt vindue. Formular til interaktiv dataindsættelse Formelementer giver besøgende mulighed for at indtaste tekst og filer på websider. Scripts Bruges til at knytte programstykker til brugerhandlinger på dokumentet. De anvendte sprog er generelt JavaScript og VBScript .Attributterne bruges til at specificere egenskaberne for HTML-elementer. Der er 188 attributter i HTML- version 4 .
Nogle attributter gælder for næsten alle elementer:
Andre attributter er unikke for et enkelt element eller lignende elementer. For eksempel :
De fleste attributter er valgfri. Nogle elementer har dog obligatoriske attributter:
Indholdstypen af HTML-attributter ligger delvis uden for denne standard, og validering af den falder ind under tredjepartsstandarder såsom URI'er , indholdstyper eller sprogkoder .
Endelig er nogle attributter af boolsk type. Dette er de eneste attributter, hvis syntaks kan være gyldigt implicit i HTML: attributten selectedfor en formkontrol kan således afkortes til formularen, der selectederstatter den komplette formular selected="selected". Denne særlige form er et af de punkter, der adskiller HTML fra syntaksen for "velformede" dokumenter i XML-forstand.
Websider kan skrives på alle slags sprog, og der kan bruges meget mange tegn , der kræver enten et tegnsæt pr. Skrivetype eller et universelt tegnsæt. Da HTML dukkede op, blev Unicode universelle tegnsæt endnu ikke opfundet, og mange tegnsæt blev brugt sammen med hinanden, herunder ISO-8859-1 for det latinske og vesteuropæiske alfabet , Shift-JIS for japanerne , KOI8-R for Kyrillisk . I dag er kodning af UTF-8 til Unicode mest udbredt.
Den HTTP- kommunikationsprotokol transmitterer navnet på tegnsættet. HTML-overskriften kan indeholde en påmindelse om dette tegnsæt, som skal være den samme, medmindre der er en indstillingsfejl. Endelig, efter en forkert indstilling, kan det faktisk anvendte tegnsæt stadig afvige fra det annoncerede sæt. Disse forkerte indstillinger forårsager generelt tekstvisningsfejl, især for tegn, der ikke er dækket af ASCII- standarden .
UdstødningsteknologiInden generaliseringen af Unicode blev enheder defineret til at repræsentere visse ikke- ASCII- tegn . Det startede med tegnene i ISO 8859-1 i HTML 2.0- standarden . For diakritikere følger disse enheder et simpelt princip: bogstavet efterfulgt af forkortelse af det tilknyttede diakritiske middel.
Karakter | enhedsreference | Bemærk |
---|---|---|
PÅ | Á | acutefor den akutte accent |
PÅ | Â | circtil circumflex accent |
PÅ | À | gravefor den alvorlige accent |
PÅ | Å | ringtil chefrunden |
PÅ | Ã | tildetil tilde |
PÅ | Ä | umltil umlaut |
VS | Ç | cediltil cedillaen |
Ø | Ø | slashtil skråstreg |
Som formaliseret af W3C er HTML designet til at optimere dokumenters interoperabilitet . HTML bruges ikke til at beskrive den endelige gengivelse af websider . Især, i modsætning til desktop publishing , er HTML ikke designet til at specificere det visuelle udseende af dokumenter. I stedet er HTML designet til at give mening om de forskellige dele af teksten: titel, liste, vigtig passage, citat osv. HTML blev udviklet med den intuition, at enheder af enhver art ville blive brugt til at surfe på nettet: personlige computere med skærme af forskellig opløsning og farvedybde, mobiltelefoner, computersyntese- og genkendelsesenheder. Tale, computere med lav og høj båndbredde og så på.
Da HTML ikke fokuserer på den endelige gengivelse af dokumentet, kan det samme HTML-dokument ses ved hjælp af en lang række hardware og software. På hardwareniveau kan et dokument især vises på en computerskærm i grafisk tilstand eller en computerterminal i teksttilstand , det kan udskrives, eller det kan tales ved stemmesyntese . På softwareniveau antager HTML heller ikke antagelser, og flere typer software læser HTML: webbrowser , crawler , forskellige scripts (i Perl , PHP ) til automatisk behandling.
En høj grad af interoperabilitet hjælper med at sænke omkostningerne for indholdsudbydere, fordi en enkelt version af hvert dokument tjener en lang række behov. For webbrugeren tillader interoperabilitet eksistensen af mange konkurrerende browsere, som alle kan se hele internettet.
Hver version af HTML har forsøgt at afspejle den største konsensus blandt branchens aktører, så investeringerne fra indholdsudbydere ikke spildes, og deres dokumenter hurtigt bliver uleselige. Adskillelsen af indholdet og formen blev ikke altid respekteret under udviklingen af sproget, som det f.eks. Fremgår af markeringen af tekststil, som gør det muligt især at angive den ønskede skrifttype til visning, dens størrelse eller dens farve.