Co to jest jednolity lokalizator zasobów?
Uniform Resource Locator, znany również pod akronimowym adresem URL, jest sposobem na określenie lokalizacji i metody dostępu do obiektu w Internecie. Zawiera nazwę schematu lub protokołu opisującą sposób uzyskania dostępu do obiektu. Obejmuje również lokalizację sieci, a także opcjonalne identyfikatory zapytań i fragmentów. Bardzo częstym zastosowaniem adresu URL jest przekierowanie przeglądarki na stronę internetową.
Oryginalna koncepcja Uniform Resource Locator ewoluowała na początku lat dziewięćdziesiątych. Zapytanie o komentarze (RFC) 1630 było pierwszym standardem URL, wydanym przez Internet Engineering Task Force (IETF) w 1994 roku. Nazwa bez powiązanej lokalizacji lub metody dostępu stała się znana jako Uniform Resource Name (URN). Łącząc te dwie koncepcje, narodził się termin Uniform Resource Identifier (URI). Identyfikator URI może być tożsamością URN, adresem URL lub jednym i drugim. Może nawet odnosić się do obiektu, który w ogóle nie jest oparty na sieci.
W kręgach technicznych termin Uniform Resource Locator jest już rzadko używany - preferowany jest URI. Jednak adres URL pozostaje popularną nazwą wśród ogółu społeczeństwa i prasy. Najnowsza specyfikacja URI, wydana w 2009 roku jako RFC 3986, wyjaśnia pojęcia dotyczące adresów URL, URN i URI.
Jednolity lokalizator zasobów składa się z dwóch części. Pierwsza to nazwa schematu URI, a następnie dwukropek. Schemat definiuje protokół lub inną metodę dostępu do zasobu. IANA (Internet Assigned Numbers Authority) zarządza długą listą zarejestrowanych schematów URI. Hipertekstowy protokół transportowy (HTTP), bezpieczny HTTP (HTTPS) i protokół transportu plików (FTP) są prawdopodobnie najczęstsze. Wykorzystuje się także wiele niezarejestrowanych programów.
Druga część Uniform Resource Locator jest specyficzna dla schematu i może zawierać kilka składników. Ta część adresu URL HTTP często zaczyna się od www. a następnie nazwa domeny. Zamiast nazwy domeny można użyć numerycznego adresu IP. Po nazwie może znajdować się ścieżka do określonego obiektu. Może być również obecny ciąg zapytania, nazwa nagłówka fragmentu w obiekcie lub oba.
Podczas wpisywania adresu URL strony internetowej w przeglądarce schemat i część nazwy domeny są często opcjonalne. Jeśli pominięto, „http: //” lub „http: // www.” zwykle będzie przejmowana przez przeglądarkę internetową. Ścieżka, zapytanie lub fragment mogą również zawierać ograniczone znaki specjalne w szesnastkowej postaci numerycznej. Spacja -% 20 - jest najczęściej używana. Międzynarodowy identyfikator zasobu (IRI) pozwala również na stosowanie znaków Unicode.
Więcej niż jeden unikalny Uniform Resource Locator może opisywać ścieżkę do tego samego obiektu. Wyszukiwarki mogą używać procesu zwanego normalizacją adresów URL, aby ustalić, czy wiele adresów URL faktycznie odnosi się do tej samej rzeczy. Robią to również przeglądarki internetowe i roboty. Adres URL może również wskazywać obiekt, którego nie można znaleźć - został on przeniesiony lub nigdy nie istniał.