Qu'est-ce qu'un localisateur de ressources uniforme?
Un localisateur de ressources, également connu sous le sigle URL, permet de spécifier l'emplacement et la méthode d'accès d'un objet sur Internet. Il inclut un schéma ou un nom de protocole décrivant comment accéder à l'objet. Il comprend également l'emplacement du réseau, ainsi que des identificateurs de requête et de fragment facultatifs. Une utilisation très courante d'une URL consiste à diriger un navigateur vers un site Web.
Le concept original de localisateur uniforme de ressources a évolué au début des années 90. La demande de commentaires (RFC) 1630 est la première norme en matière d'URL, publiée par l'IETF (Internet Engineering Task Force) en 1994. Un nom sans emplacement ni méthode d'accès associé est désormais appelé un nom de ressource uniforme (URN). En combinant les deux concepts, le terme identificateur de ressource uniforme (URI) est né. Un URI peut être une identité URN, une adresse URL ou les deux. Il peut même faire référence à un objet qui n'est pas du tout basé sur le réseau.
Dans les milieux techniques, le terme Uniform Resource Locator est rarement utilisé, l’URI est préférable. L'URL reste un nom populaire auprès du grand public et de la presse. La dernière spécification d'URI, publiée en 2009 sous le numéro RFC 3986, clarifie les concepts d'URL, d'URN et d'URI.
Un localisateur de ressources uniforme comprend deux parties. First est le nom d'un schéma d'URI, suivi de deux points. Un schéma définit le protocole ou une autre méthode utilisée pour accéder à la ressource. L'IANA (Internet Assigned Numbers Authority) gère une longue liste de schémas d'URI enregistrés. Les protocoles HTTP (Hypertext Transport Protocol), HTTP sécurisé (HTTPS) et FTP (File Transport Protocol) sont probablement les plus courants. De nombreux régimes non enregistrés sont également utilisés.
La deuxième partie d'un localisateur de ressources uniforme est spécifique à un schéma et peut inclure plusieurs composants. Cette partie d'une URL HTTP commence souvent par www. suivi d'un nom de domaine. Une adresse IP numérique peut être utilisée à la place du nom de domaine. Le nom peut être suivi du chemin d'accès à un objet spécifique. Une chaîne de requête, le nom d'un en-tête de fragment dans l'objet, ou les deux peuvent également être présents.
Lors de la saisie de l'URL d'une page Web dans un navigateur, le schéma et une partie du nom de domaine sont souvent facultatifs. Si laissé, "http: //" ou "http: // www." sera généralement assumé par le navigateur Web. Le chemin, la requête ou le fragment peut également contenir un nombre limité de caractères spéciaux sous forme numérique hexadécimale. Un espace -% 20 - est le plus couramment utilisé. Un identifiant de ressource internationalisé (IRI) autorise également les caractères Unicode.
Plusieurs localisateurs de ressources uniformes uniques peuvent décrire un chemin d'accès au même objet. Les moteurs de recherche peuvent utiliser un processus appelé normalisation d'URL pour déterminer si plusieurs URL font en réalité référence à la même chose. Les navigateurs Web et les robots d'exploration le font aussi. Une URL peut également pointer sur un objet introuvable, qu'il ait été déplacé ou qu'il n'ait jamais existé.