HTML 统一资源定位符
URL 是网页地址的另一种说法。
URL 可以由单词组成(例如 w3school.com.cn),也可以由互联网协议(IP)地址组成(例如 192.68.20.50)。
大多数人在上网时输入的是名称,因为名称比数字更容易记忆。
URL - 统一资源定位符
网络浏览器通过使用 URL 向 Web 服务器请求页面。
统一资源定位符(URL)用于寻址 Web 上的文档(或其他数据)。
像 https://www.w3school.com.cn/html/index.asp 这样的网址遵循以下语法规则:
scheme://prefix.domain:port/path/filename
解释:
- scheme(协议) - 定义互联网服务的类型(最常见的是 http 或 https)
- prefix(前缀) - 定义域名前缀(http 的默认前缀是 www)
- domain(域名) - 定义互联网域名(如 w3school.com.cn)
- port(端口) - 定义主机上的端口号(http 的默认端口是 80)
- path(路径) - 定义服务器上的路径(如果省略:则代表站点的根目录)
- filename(文件名) - 定义文档或资源的名称
常见 URL 协议
下表列出了一些常见协议:
| 协议 | 全称 | 用途 |
|---|---|---|
| http | 超文本传输协议 | 普通网页。未加密 |
| https | 安全超文本传输协议 | 安全网页。已加密 |
| ftp | 文件传输协议 | 下载或上传文件 |
| file | 您计算机上的文件 |
URL 编码
URL 只能使用 ASCII 字符集 在互联网上发送。如果 URL 包含 ASCII 集以外的字符,则必须对该 URL 进行转换。
URL 编码将非 ASCII 字符转换为可以通过互联网传输的格式。
URL 编码使用 "%" 后跟十六进制数字来替换非 ASCII 字符。
URL 不能包含空格。URL 编码通常用加号 (+) 或 %20 替换空格。
亲自试一试
如果您点击“提交”,浏览器会在将输入内容发送到服务器之前对其进行 URL 编码。
服务器上的一个页面将显示接收到的输入内容。
尝试输入其他内容并再次点击提交。
ASCII 编码示例
您的浏览器将根据您页面中使用的字符集对输入进行编码。
HTML5 中的默认字符集是 UTF-8。
| 字符 | 来自 Windows-1252 的编码 | 来自 UTF-8 的编码 |
|---|---|---|
| € | %80 | %E2%82%AC |
| £ | %A3 | %C2%A3 |
| © | %A9 | %C2%A9 |
| ® | %AE | %C2%AE |
| À | %C0 | %C3%80 |
| Á | %C1 | %C3%81 |
| Â | %C2 | %C3%82 |
| Ã | %C3 | %C3%83 |
| Ä | %C4 | %C3%84 |
| Å | %C5 | %C3%85 |
如需所有 URL 编码的完整参考,请访问我们的 URL 编码参考手册。