介绍
在本教程中,我们将激活并学习如何使用 Apache 2 的 mod_rewrite
模块来管理 URL 重写。 该模块允许我们以更简洁的方式重写 URL,将人类可读的路径转换为代码友好的查询字符串或根据附加条件重定向 URL。
本指南分为两部分。 第一个建立一个示例网站并涵盖一个简单的重写示例。 第二部分包含两个更深入的常用重写规则示例。
先决条件
要遵循本教程,您将需要:
- 使用 this initial server setup tutorial 设置一台 Ubuntu 16.04 服务器,包括 sudo 非 root 用户和防火墙。
- 按照 如何在 Ubuntu 16.04 上安装 Linux、Apache、MySQL、PHP (LAMP) 堆栈的第 1 步,在您的服务器上安装 Apache 2。
第 1 步 - 启用 mod_rewrite
首先,我们需要激活mod_rewrite
。 它可用,但未通过干净的 Apache 2 安装启用。
sudo a2enmod rewrite
这将激活模块或提醒您该模块已启用。 要使这些更改生效,请重新启动 Apache。
sudo systemctl restart apache2
mod_rewrite
现在已完全启用。 在下一步中,我们将设置一个 .htaccess
文件,我们将使用它来定义重定向的重写规则。
第 2 步 — 设置 .htaccess
.htaccess
文件允许我们在不访问服务器配置文件的情况下修改我们的重写规则。 因此,.htaccess
对您的 Web 应用程序的安全性至关重要。 文件名前面的句点确保文件被隐藏。
注意: 可以放入.htaccess
文件的任何规则也可以直接放入服务器配置文件中。 事实上, Apache 官方文档 建议使用服务器配置文件而不是 .htaccess
,因为 Apache 以这种方式处理它的速度更快。
但是,在这个简单的示例中,性能提升可以忽略不计。 此外,在.htaccess
中设置规则很方便,尤其是在同一台服务器上有多个网站时。 它不需要重新启动服务器即可使更改生效,并且不需要 root 权限来编辑这些规则,从而简化了维护并使更改可以使用非特权帐户进行。 一些流行的开源软件,如 Wordpress 和 Joomla,通常依赖 .htaccess
文件让软件根据需要修改和创建附加规则。
在开始之前,我们需要设置并保护更多设置。
默认情况下,Apache 禁止使用 .htaccess
文件来应用重写规则,因此首先您需要允许对文件进行更改。 使用 nano
或您喜欢的文本编辑器打开默认的 Apache 配置文件。
sudo nano /etc/apache2/sites-available/000-default.conf
在该文件中,您会发现从第一行开始的 <VirtualHost *:80>
块。 在该块内,添加以下新块,使您的配置文件如下所示。 确保所有块都正确缩进。
/etc/apache2/sites-available/000-default.conf
<VirtualHost *:80> <Directory /var/www/html> Options Indexes FollowSymLinks MultiViews AllowOverride All Require all granted </Directory> . . . </VirtualHost>
保存并关闭文件。 要使这些更改生效,请重新启动 Apache。
sudo systemctl restart apache2
现在,在 Web 根目录中创建 .htaccess
文件。
sudo nano /var/www/html/.htaccess
在新文件的顶部添加这一行以激活重写引擎。
/var/www/html/.htaccess
RewriteEngine on
保存文件并退出。
您现在有一个可操作的 .htaccess
文件,您可以使用它来管理您的 Web 应用程序的路由规则。 在下一步中,我们将创建用于演示重写规则的示例网站文件。
第 3 步 — 配置 URL 重写
在这里,我们将设置一个基本的 URL 重写,它将漂亮的 URL 转换为代码的实际路径。 具体来说,我们将允许用户访问http://your_server_ip/about
。
首先在 Web 根目录中创建一个名为 about.html
的文件。
sudo nano /var/www/html/about.html
将以下 HTML 代码复制到文件中,然后保存并关闭它。
/var/www/html/about.html
<html> <head> <title>About Us</title> </head> <body> <h1>About Us</h1> </body> </html>
您可以通过 http://your_server_ip/about.html
访问此页面,但请注意,如果您尝试访问 http://your_server_ip/about
,您将看到 404 Not Found 错误。 如果您希望用户仅使用 about
访问页面,重写规则将允许此功能。
所有 RewriteRules
都遵循以下格式:
通用 RewriteRule 结构
RewriteRule pattern substitution [flags]
RewriteRule
指定指令。pattern
是一个 正则表达式 ,它匹配来自 URL 的所需字符串,这是查看器在浏览器中键入的内容。substitution
是实际 URL 的路径,即 文件 Apache 服务器的路径。flags
是可选参数,可以修改规则的工作方式。
打开 .htaccess
文件。
sudo nano /var/www/html/.htaccess
在第一行之后,添加标记为红色的 RewriteRule
并保存文件。
/var/www/html/.htaccess
RewriteEngine on RewriteRule ^about$ about.html [NC]
在这种情况下,^about$
是模式,about.html
是替换,[NC]
是标志。 我们的示例使用了一些具有特殊含义的字符:
^
表示 URL 的开始,在your_server_ip/
之后。$
表示 URL 的结束。about
匹配字符串“about”。about.html
是用户访问的实际文件。[NC]
是使规则不区分大小写的标志。
现在,您现在应该可以在浏览器中访问 http://your_server_ip/about
了。 事实上,使用上面显示的规则,以下 URL 将指向 about.html
:
http://your_server_ip/about
,因为规则定义。http://your_server_ip/About
,因为规则不区分大小写。http://your_server_ip/about.html
,因为原始正确的文件名将始终有效。
以下不会:
http://your_server_ip/about/
,因为规则明确指出在about
之后使用$
字符可能没有任何内容。http://your_server_ip/contact
,因为它不会匹配规则中的about
字符串。
您现在拥有一个可操作的 .htaccess
文件,其中包含一个简单的规则,您可以根据需要对其进行修改和扩展。 在以下部分中,我们将展示常用指令的另外两个示例。
示例 1 - 使用 RewriteRule 简化查询字符串
Web 应用程序经常使用 查询字符串 ,这些字符串在地址后使用问号 (?
) 附加到 URL。 使用 & 符号 (&
) 分隔单独的参数。 查询字符串可用于在各个应用程序页面之间传递附加数据。
例如,用 PHP 编写的搜索结果页面可能使用 http://example.com/results.php?item=shirt&season=summer
之类的 URL。 在此示例中,将两个附加参数传递给虚构的 result.php
应用程序脚本:item
,值为 shirt
,season
值为 summer
。 应用程序可以使用查询字符串信息为访问者构建正确的页面。
Apache 重写规则通常用于将上述冗长且令人不快的链接简化为 友好的 URL ,这些 URL 更易于输入和视觉解释。 在本例中,我们希望将上述链接简化为 http://example.com/shirt/summer
。 shirt
和 summer
参数值仍在地址中,但没有查询字符串和脚本名称。
这是实现这一点的一个规则:
简单替换
RewriteRule ^shirt/summer$ results.php?item=shirt&season=summer [QSA]
shirt/summer
在请求的地址中显式匹配,并且 Apache 被告知要为 results.php?item=shirt&season=summer
提供服务。
[QSA]
标志通常用于重写规则。 他们告诉 Apache 将任何额外的查询字符串附加到所服务的 URL,因此如果访问者键入 http://example.com/shirt/summer?page=2
,服务器将响应 results.php?item=shirt&season=summer&page=2
。 没有它,额外的查询字符串将被丢弃。
虽然这种方法达到了预期的效果,但项目名称和季节都被硬编码到规则中。 这意味着该规则不适用于任何其他项目,例如 pants
,或季节,例如 winter
。
为了使规则更通用,我们可以使用 正则表达式 来匹配原始地址的部分,并在替换模式中使用这些部分。 修改后的规则将如下所示:
简单替换
RewriteRule ^([A-Za-z0-9]+)/(summer|winter|fall|spring) results.php?item=$1&season=$2 [QSA]
括号中的第一个正则表达式组匹配包含字母数字字符和数字的字符串,例如 shirt
或 pants
,并将匹配的片段保存为 $1
变量。 括号中的第二个正则 r 表达式组完全匹配 summer
、winter
、fall
或 spring
,并将匹配的片段保存为 [X163X ]。
然后在 item
和 season
变量中的结果 URL 中使用匹配的片段,而不是我们之前使用的硬编码 shirt
和 summer
值。
例如,上面会将 http://example.com/pants/summer
转换为 http://example.com/results.php?item=pants&season=summer
。 这个例子也是未来的证明,允许使用单个规则正确重写多个项目和季节。
示例 2 - 使用 RewriteConds 使用逻辑添加条件
重写规则不一定总是一一评估而没有任何限制。 RewriteCond
指令允许我们向重写规则添加条件,以控制何时处理规则。 所有 RewriteConds
都遵循以下格式:
通用 RewriteCond 结构
RewriteCond TestString Condition [Flags]
RewriteCond
指定RewriteCond
指令。TestString
是要测试的字符串。Condition
是要匹配的模式或条件。Flags
是可选参数,可以修改条件和评估规则。
如果 RewriteCond
计算结果为真,则将考虑紧随其后的 RewriteRule
。 如果不是,则该规则将被丢弃。 多个 RewriteCond
可以一个接一个地使用,并且在默认行为下,所有都必须评估为 true 才能考虑以下规则。
例如,假设您希望将所有对站点上不存在的文件或目录的请求重定向回主页,而不是显示标准的 404 Not Found 错误页面。 这可以通过以下条件规则来实现:
将所有对不存在的文件和目录的请求重定向到主页
RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule . /
有了以上内容:
%{REQUEST_FILENAME}
是要检查的字符串。 在这种情况下,它是请求的文件名,它是可用于每个请求的系统变量。-f
是一个内置条件,用于验证请求的名称是否存在于磁盘上并且是一个文件。!
是一个否定运算符。 结合起来,!-f
仅在指定名称不存在或不是文件时才计算为真。- 类似地,
!-d
仅在指定名称不存在或不是目录时才计算为真。
最后一行的 RewriteRule
仅对不存在的文件或目录的请求生效。 RewriteRule
本身非常简单,将每个请求重定向到 /
网站根目录。
结论
mod_rewrite
是一个有用的 Apache 模块,可以有效地用于确保人类可读的 URL。 在本教程中,您学习了如何使用 RewriteRule
指令来重定向 URL,包括带有查询字符串的 URL。 您还学习了如何使用 RewriteCond
指令有条件地重定向 URL。
如果您想了解有关 mod_rewrite
的更多信息,请查看 Apache 的 mod_rewrite Introduction 和 Apache 的 mod_rewrite 官方文档。