HTML 统一资源定位符

URL 是网页地址的另一种说法。

URL 可以由单词组成(例如 w3school.com.cn),也可以由互联网协议(IP)地址组成(例如 192.68.20.50)。

大多数人在上网时输入的是名称,因为名称比数字更容易记忆。

URL - 统一资源定位符

网络浏览器通过使用 URL 向 Web 服务器请求页面。

统一资源定位符(URL)用于寻址 Web 上的文档(或其他数据)。

https://www.w3school.com.cn/html/index.asp 这样的网址遵循以下语法规则:

scheme://prefix.domain:port/path/filename

解释:

  • scheme(协议) - 定义互联网服务的类型(最常见的是 httphttps
  • prefix(前缀) - 定义域名前缀(http 的默认前缀是 www
  • domain(域名) - 定义互联网域名(如 w3school.com.cn)
  • port(端口) - 定义主机上的端口号(http 的默认端口是 80
  • path(路径) - 定义服务器上的路径(如果省略:则代表站点的根目录)
  • filename(文件名) - 定义文档或资源的名称

常见 URL 协议

下表列出了一些常见协议:

协议 全称 用途
http 超文本传输协议 普通网页。未加密
https 安全超文本传输协议 安全网页。已加密
ftp 文件传输协议 下载或上传文件
file 您计算机上的文件

URL 编码

URL 只能使用 ASCII 字符集 在互联网上发送。如果 URL 包含 ASCII 集以外的字符,则必须对该 URL 进行转换。

URL 编码将非 ASCII 字符转换为可以通过互联网传输的格式。

URL 编码使用 "%" 后跟十六进制数字来替换非 ASCII 字符。

URL 不能包含空格。URL 编码通常用加号 (+) 或 %20 替换空格。

亲自试一试

如果您点击“提交”,浏览器会在将输入内容发送到服务器之前对其进行 URL 编码。

服务器上的一个页面将显示接收到的输入内容。

尝试输入其他内容并再次点击提交。

ASCII 编码示例

您的浏览器将根据您页面中使用的字符集对输入进行编码。

HTML5 中的默认字符集是 UTF-8。

字符 来自 Windows-1252 的编码 来自 UTF-8 的编码
%80 %E2%82%AC
£ %A3 %C2%A3
© %A9 %C2%A9
® %AE %C2%AE
À %C0 %C3%80
Á %C1 %C3%81
 %C2 %C3%82
à %C3 %C3%83
Ä %C4 %C3%84
Å %C5 %C3%85

如需所有 URL 编码的完整参考,请访问我们的 URL 编码参考手册