URL (Uniform Resource Locator) — это уникальный адрес для доступа к информационным ресурсам в интернете (в частности, к веб-страницам). Если пользователю известен URL веб-страницы, он может ее увидеть ее, задав этот URL в адресной строке браузера.
URL представляет собой текстовую строку без пробелов. В начале URL указывается обозначение протокола, используемого для доступа к ресурсу. Протокол определяет тип программного обеспечения для доступа к ресурсу, и правила, по которым с ним ведется обмен информацией.
Наиболее часто встречающиеся обозначения протоколов:
- http — протокол HTTP, обычно применяемый для доступа к веб-страницам;
- https — протокол HTTPS, применяемый для безопасного (шифрованного) доступа к веб-страницам (например, для работы с интернет-банком);
- ftp — протокол FTP, применяемый для передачи файлов;
- mailto — протокол, указывающий, что далее следует адрес электронной почты (E-mail);
- ed2k — протокол, применяемый в файлообменных сетях eDonkey и eMule.
После названия протокола ставится двоеточие (:), которое отделяет его от остальной части URL, структура которой зависит от типа протокола.
Структура URL для протоколов HTTP и HTTPS (первые 4 пункта применимы также для FTP):
- доменное имя (адрес сервера) — уникальное обозначение сайта, содержащего данную веб-страницу; перед доменным именем в URL ставится два слеша (две наклонных черты: //), без них доменное имя будет восприниматься как путь доступа (см. ниже);
- номер порта на сервере — число от 1 до 65535, указывающее серверу, какой программе передать на обработку данный запрос; это позволяет, например, поддерживать на одном компьютере рабочую и тестовую версии сайта; между доменным именем и номером порта ставится двоеточие (:);
- путь доступа к странице на сервере — перечисляет в порядке вложенности имена папок на сервере, в которые нужно зайти, чтобы добраться до нужного ресурса (файла); после каждого имени папки ставится слеш (/); корневая папка сервера — безымянная, ее обозначют одним слешом;
- имя файла — имя запрашиваемого файла. Это может быть, в частности, веб-страница, файл для скачивания, скрипт, выполняемый на сервере.
- параметры скрипта — если указанный файл является скриптом (или веб-страницей, содержащей скрипт), то можно указать параметры для скрипта; параметры отделяются от предшествующей части URL знаком вопроса (?). Структура параметров зависит от используемого скрипта; чаще всего параметры представляют собой пары "имя=значение", отделяемые друг от друга знаком амперсенда (&);
- якорь — внутренняя ссылка на веб-странице, позволяющая сразу прокрутить ее в окне браузера к нужному месту; перед якорем ставится знак номера (#).
Ни одна из частей URL не является обязательной. Отсутствующие части восполняются по умолчанию программой, которая использует URL.
Пример полного URL для протокола HTTP (подчеркнуты доменное имя, путь доступа и парамеры скрипта):
http://www.mydomain.ru:8080/folder1/folder2/script.php?par1=val1&par2=val2#ancor
Правила восполнения отсутствующих частей URL браузерами:
Если опущено указание протокола, то предполагается:
- при задании в адресной строке — http;
- при ссылке с загруженной страницы — протокол, по которому была загружена страница.
Если опущено доменное имя, то предполагается:
- при задании в адресной строке: локальный компьютер
- при ссылке с загруженной страницы — сервер, с которого была загружена страница;
Если опущен номер протокола, то предполагается:
- для протокола HTTP — 80;
- для протокола HTTPS — 443;
- для протокола FTP — 21.
Если опущен путь доступа, то предполагается:
- при наличии доменного имени — корневая папка сервера;
- при отсутствии доменного имени — папка, из которой загружена последняя страница.
Если опущено имя файла, то предполагается:
- для серверов на базе программного обеспечения Microsoft default.htm или default.html;
- для других серверов index.htm или index.html,
- Но: эти умолчания могут быть перенастроены администратором сервера.
Если опущены параметры и якорь, они остаются пустыми.
Источники: