Was ist ein Uniform Resource Locator?
Ein Uniform Resource Locator, der auch unter der Abkürzung URL bekannt ist, gibt den Standort und die Zugriffsmethode eines Objekts im Internet an. Es enthält einen Schema- oder Protokollnamen, der den Zugriff auf das Objekt beschreibt. Es enthält auch den Netzwerkstandort sowie optionale Abfrage- und Fragment-IDs. Eine URL wird häufig verwendet, um einen Browser auf eine Website zu leiten.
Das ursprüngliche Konzept eines Uniform Resource Locator entwickelte sich in den frühen 1990er Jahren. Request For Comments (RFC) 1630 war der erste URL-Standard, der 1994 von der Internet Engineering Task Force (IETF) veröffentlicht wurde. Ein Name ohne zugehörigen Standort oder Zugriffsmethode wurde als Uniform Resource Name (URN) bezeichnet. Durch die Kombination der beiden Konzepte wurde der Begriff Uniform Resource Identifier (URI) geboren. Ein URI kann eine URN-Identität, eine URL-Adresse oder beides sein. Es kann sich sogar auf ein Objekt beziehen, das überhaupt nicht netzwerkbasiert ist.
In Fachkreisen wird der Begriff Uniform Resource Locator selten mehr verwendet - URI wird bevorzugt. URL bleibt jedoch ein beliebter Name in der Öffentlichkeit und in der Presse. Die neueste URI-Spezifikation, die 2009 als RFC 3986 veröffentlicht wurde, erläutert die URL-, URN- und URI-Konzepte.
Ein Uniform Resource Locator besteht aus zwei Teilen. Der erste ist der Name eines URI-Schemas, gefolgt von einem Doppelpunkt. Ein Schema definiert das Protokoll oder eine andere Methode für den Zugriff auf die Ressource. Die Internet Assigned Numbers Authority (IANA) verwaltet eine lange Liste registrierter URI-Schemata. Hypertext Transport Protocol (HTTP), Secure HTTP (HTTPS) und File Transport Protocol (FTP) sind wahrscheinlich die am häufigsten verwendeten. Viele nicht registrierte Schemata werden ebenfalls verwendet.
Der zweite Teil eines Uniform Resource Locator ist schemaspezifisch und kann mehrere Komponenten enthalten. Dieser Teil einer HTTP-URL beginnt häufig mit www. gefolgt von einem Domainnamen. Anstelle des Domänennamens kann eine numerische IP-Adresse (Internet Protocol) verwendet werden. Dem Namen kann der Pfad zu einem bestimmten Objekt folgen. Eine Abfragezeichenfolge, der Name einer Fragmentüberschrift innerhalb des Objekts oder beide können ebenfalls vorhanden sein.
Wenn Sie die URL einer Webseite in einen Browser eingeben, sind das Schema und ein Teil des Domainnamens häufig optional. Wenn weggelassen, "http: //" oder "http: // www." wird in der Regel vom Webbrowser übernommen. Der Pfad, die Abfrage oder das Fragment können auch begrenzte Sonderzeichen in hexadezimaler numerischer Form enthalten. Ein Leerzeichen (% 20) wird am häufigsten verwendet. Ein Internationalized Resource Identifier (IRI) lässt auch Unicode-Zeichen zu.
Mehr als ein eindeutiger Uniform Resource Locator kann einen Pfad zu demselben Objekt beschreiben. Suchmaschinen können einen Prozess namens URL-Normalisierung verwenden, um festzustellen, ob sich mehrere URLs tatsächlich auf dieselbe Sache beziehen. Dies tun auch Webbrowser und Crawler. Eine URL kann auch auf ein Objekt verweisen, das nicht gefunden werden kann - es wurde verschoben oder existierte zunächst nie.