web adresse

De webadresser er en af tre opfindelser ved foden af World Wide Web , og i henhold til dens opfindere, den mest grundlæggende. Offentligheden kender dem i form af etiketter på ti tegn, der ofte starter med "www", og som identificerer en webside  ; f.eks www.example.com. Den teknisk korrekte adresse skal faktisk starte med et protokolnavn  ; til dette eksempel giver det http://www.example.com. Webadresser er grundlaget for webhyperlinks .

På det tekniske sprog taler vi ikke om en webadresse, men om URI (for Uniform Resource Identifier eller uniform resource identifier ), URL (for Uniform Resource Locator eller uniform resource locator , en type URI) eller mere sjældent URN ( Ensartet ressource navn eller ensartet ressource navn , en anden type URI). Der er tre standarderInternettet, der specificerer syntaks og semantik for webadresser, herunder RFC  1738, RFC  2396 og RFC  3986. Derudover  understreger U "uniformen", der oprindeligt betød universal ( RFC 1630), den næsten universelle adressering disse adressers muligheder: Usenet- fora , postkasser , filer på et FTP- sted osv. ; eller praktisk talt alt, hvad der er tilgængeligt på Internettet og endda videre, såsom referencedokumenter, bøger osv.

Webadresser bør ikke forveksles med e-mail-adresser eller IP-adresser . Navnet Internetadresse kan henvise til en webadresse, men det er faktisk helt tvetydigt.

En grundlæggende opfindelse

De tre opfindelser ved bunden af World Wide Web er:

Selvom en protokol (HTTP) og et dataformat (HTML) er udviklet specifikt til internettet, er internettet designet til at pålægge et minimum af tekniske begrænsninger. Især kan andre formater og protokoller end HTTP og HTML bruges. For at en ressource skal være en del af internettet, skal den dog være udtrykkelig som en webadresse. Det er i denne forstand, at adresser er den mest grundlæggende opfindelse.

For eksempel et HTML-dokument gemt i en navngivet computerfil, der erpage.html placeret i biblioteket /home/tim/ på en kaldet computer www.example.com. Afhængigt af de midler, der bruges til at få adgang til den, kan denne ressource være kendt under forskellige adresser:

file:///home/tim/page.html Der er adgang til ressourcen som en lokal fil page.htmli biblioteket /home/tim/. Denne adresse fungerer kun på den computer, hvor ressourcen er registreret. http://www.example.com/tim/page.html Ressourcen er tilgængelig på HTTP-serveren www.example.com under stien /tim/page.html . Den HTTP-serveren er konfigureret til at matche stien /tim/til mappen /home/tim/. ftp://tim:[email protected]/tim/page.html Der er adgang til ressourcen ved hjælp af File Transfer Protocol (FTP ) med konto timog adgangskode sEcReTpå serveren www.example.com. FTP-serveren er konfigureret til at give kontoen timbiblioteket /home/tim/.

Flere andre protokoller kunne bruges til at få adgang til denne ressource, forudsat at den relevante server er installeret: Gopher , HTTPS osv. Andre ressourcer kan være konceptuelt meget forskellige fra en fil, for eksempel:

mailto:[email protected] Ressourcen er destinations- e-mail til e-mail-adresse [email protected] . news:alt.hypertext Ressourcen er Usenet- diskussionsforum . alt.hypertext

Anvendelser

Support til webbrowsere

Adresse bar

Når du surfer på nettet, vises webbrowseren i adresselinjen adressen på den konsulterede ressource. Hvis du vil høre et dokument, som du kender webadressen til, kan du skrive det direkte i denne bjælke.

I de tidlige år af internettet , web-browsere kun accepteret teknisk gyldige adresser til at identificere ressourcer. Men efter udviklingen af ​​Internettet er HTTP- kommunikationsprotokollen blevet afgørende for at overføre langt størstedelen af ​​de konsulterede ressourcer. Så en webside URL næsten altid begynder med . Webbrowsere har derfor udviklet sig til at tillade udeladelse af disse tegn, når de indtaster deres adresselinje. tilføjes automatisk, hvis det er nødvendigt. Nogle browsere går så langt som at udfylde en adresse som en adresse, der kan udnyttes ved automatisk at tilføje de manglende tegn "http" og derefter ":" og "// uden at udelade" www "og ved at tilføje den relevante nationale eller kommercielle udvidelse i slutningen. , men risikoen for fejlagtig afslutning er da ikke ubetydelig. Især da det samme navn kan give adgang til to helt forskellige sider afhængigt af om de er i ".com" (kommerciel udvidelse gyldig over hele verden eller i ".fr"; .es; .it; etc. osv. Og derfor den nationale udvidelse garanterer kun unikhed i det pågældende land. http://http://exemplehttp://www.example.com/

Daglig liv

Webadresser angives ofte i reklamer eller angives på produkter. Derefter søges der efter let at huske adresser. Disse adresser skal indtastes i adresselinjen i en browser, så http://protokollen kan udelades. Webadressen kommer derefter ned til et simpelt domænenavn , som f.eks www.example.com. Dette navn har vist sig så vigtigt i kommunikationen mellem visse virksomheder , at de under internetboblen tog adressen på deres websted ( Amazon.com osv.).

På den anden side blev der dannet en specialiseret økonomisk aktivitet til at købe domænenavne baseret på almindelige ord, der sandsynligvis ofte søges af internetbrugere. Så domænet sex.comer meget dyrt. Juridisk mere uklar, typosquatting består af at købe domæner, hvis navne er relateret til velkendte mærker, der tilhører tredjeparter uden tilladelse. Den cybersquatting direkte er at købe et domænenavn med et navn, der tilhører en tredjepart, til at sælge ham dyrt. Det er ulovligt i mange lande.

Phishing svindel

Svindlen kaldet phishing indebærer at sende et offer en webadresse, der ligner et legitimt websted, ligesom deres banks, når det faktisk er adressen på et websted designet til at afpresse fortrolige oplysninger, såsom adgangskoder til bankkonti.

Syntaks

Den grundlæggende syntaks for webadresser er som følger:

  • protocole:partie_spécifique

Den originale syntaks for webadresser er stadig den mest udbredte. Nu og da defineres en ny protokol.

Tegnsæt

Oprindeligt indeholdt adresserne kun ASCII- tegn . For at kunne repræsentere ikke-ASCII-tegn er der et escape- system, der i ASCII koder for den hexadecimale værdi for hver byte af et tegn: hvor er et hexadecimalt tal. Dette flugtsystem angiver dog ikke, hvad den underliggende karakterkodning er ( ISO / IEC 8859-1 , UTF-8 osv.). %HHHH

En URI-udvidelse er oprettet for at udvide webadresser ud over ASCII: Internationaliserede ressourceidentifikatorer (IRI'er).

Hierarkisk syntaks

Mange protokoller (HTTP, FTP) har en form for såkaldt hierarkisk adresse.

http: // tim: [email protected]: 8888 / path / acces? req = data # her
http : // tim : hemmelighed @ www.eksempel.com : 8888 / sti / adgang ? req = data # her
protokol : // efternavn : adgangskode @ vært : Havn adgangssti ? anmodning # fragment

Navn, adgangskode og portnummer bruges sjældent. Imidlertid kan phishing- angreb udnytte denne syntaks til at skjule et ulovligt domænenavn som et legitimt navn:

http://ma.banque.fr:[email protected]/chemin/acces
http : // ma.banque.fr : 8888 @ illegitime.net / sti / adgang
protokol : // efternavn : adgangskode @ vært adgangssti
Adressereferencer

Med hierarkiske webadresser er det muligt at specificere en adresse i forhold til en anden adresse. Forholdet er etableret på stieniveau. Således, hvis vi har:

URI http: // tim @ sEcReT: www.example.com: 8888 / path / acces? req = data # her
relativ reference foo
URI refereres relativt http: // tim @ sEcReT: www.example.com: 8888 / path / toto

Udvikling af terminologi

I tekniske kredse har webadresser været kendt under forskellige navne: WWW-adresse, Universal Document Identifier , Universal Resource Identifiers ( RFC  1630) og til sidst opdelt i Uniform Resource Locators (URLs, RFC  1738, RFC  1808) og Uniform Resource Navne. ( URN, RFC  1737), idet det hele er ensartede ressourceidentifikatorer (URI, RFC  2396, RFC  3986). Forkortelsen URL bruges i HTML 3.2- standarden og er blevet den mest kendte og brugt af teknikere. Situationen blev tilstrækkelig forvirrende, at RFC  3305 blev skrevet for at afklare terminologien.

Forskellige franciseringer er blevet tilbudt af nationale organisationer. Den Computer og internet Ordforråd offentliggjort i Den Europæiske Unions Tidende af16. marts 1999af den generelle kommission for terminologi og neologi i Frankrig foreslog "retikulær adresse" og "universel adresse". Disse to navne blev afvist af Office québécois de la langue française på grund af deres manglende præcision, og de er ikke taget i brug i øjeblikket. Office québécois de la langue française tilbyder "URL-adresse", "URL", "webadresse" og "W3-adresse". Han bemærkede, at "webadresse" er normalt bruges til ressource hjemmesider , mens URL forkortelsen understreger det universelle i disse adresser, som kan identificere fora Usenet , sites, FTP , osv Offentligheden forveksler også ofte webadresse, e-mail- adresse og IP-adresse . For at undgå alle disse uklarheder bruger webfagfolk ofte forkortelsen "URL", selvom de faktisk henviser til URI'er.

Det originale navn, der blev givet til webadresser af opfinderen af internettet, var Universal Document Identifier (UDI). I sommeren 1992 foreslog han til Internet Engineering Task Force (IETF) at standardisere disse IDU'er, men navnet "universal" blev kasseret, fordi det blev anset for "arrogant" til et projekt, der var så ung som Internettet. Navnet Uniform Resource Identifier (URI) er det resulterende kompromis.

Ved standardisering af URI'er var det klart, at webadresser i praksis ikke identificerede dokumenter, men placeringer af dokumenter. Med andre ord, hvis et dokument flyttes, ændres dets adresse. I praksis brydes alle hyperlinks, der fører til den, når en ressource flyttes, hvilket resulterer i HTTP 404-fejlen på en HTTP-server .

I lyset af denne situation blev det besluttet, at webadresser skulle kaldes Uniform Resource Locator (URL). Ideen var at standardisere to slags URI'er: URL'er ville være URI'er, der angiver "hvordan" (på hvilken sti på netværket) for at få adgang til en ressource; Uniform Resource Names (URNs) ville være URI'er, der evigt identificerer de samme dokumenter, uanset hvor de er.

Tim Berners-Lee insisterede imidlertid på, at i det mindste i teorien skulle webadresser være designet til at være universelle. Han fandt også, at IETF spildte sin tid i diskussioner, også iJuni 1994det udgiver RFC  1630, Universal Resource Identifiers i WWW . Denne første anmodning om kommentarer til webadresser er i den informative kategori. Den beskriver simpelthen praksis for tiden og indeholder nogle fejl.

Noter og referencer

  1. De tre opfindelser i bunden af ​​World Wide Web er dens adresser, Hypertext Markup Language (HTML) og HyperText Transfer Protocol (HTTP).
  2. Opfinderne af World Wide Web er Tim Berners-Lee og Robert Cailliau .
  3. (da) Tim Berners-Lee , Weaving the Internet: the fortid, nutid and future of the World Wide Web by its opfinder , London, Orion Business,1999( ISBN  978-0-752-82090-3 , OCLC  894969957 ) , s.  42
  4. WWW er forkortelsen for World Wide Web .
  5. henhold til RFC  2606 er domænet example.comforbeholdt eksempler.
  6. (da) Anmodning om kommentarer nr .  1738 .
  7. (da) Anmodning om kommentarer nr .  2396 .
  8. (da) Anmodning om kommentarer nr .  3986 .
  9. (en) Anmodning om kommentarer nr .  1630 .
  10. RFC   3986, kap. 1.2.3
  11. (in) Anmodning om kommentarer nr .  1808 .
  12. (in) Anmodning om kommentarer nr .  1737 .
  13. RFC  1945, kapitel 3.2
  14. HTML 3.2 Reference Specification
  15. (in) Anmodning om kommentarer nr .  3305 .
  16. Computer- og internetordforråd , Journal officiel [fransk] af 16. marts 1999, culture.gouv.fr
  17. URL-adresse
  18. Vævning af nettet , s.  66

Se også

Relaterede artikler

eksterne links