Cách viết lại URL bằng mod_rewrite cho Apache trên Ubuntu 16.04
Trong hướng dẫn này, ta sẽ kích hoạt và tìm hiểu cách quản lý việc ghi lại URL bằng modulemod_rewrite
của Apache 2. Mô-đun này cho phép ta viết lại URL theo cách rõ ràng hơn, dịch các đường dẫn có thể đọc được của con người thành các chuỗi truy vấn thân thiện với mã hoặc chuyển hướng URL dựa trên các điều kiện bổ sung. Hướng dẫn này được chia thành hai phần. Đầu tiên cài đặt một trang web mẫu và bao gồm một ví dụ viết lại đơn giản. Phần thứ hai chứa hai ví dụ chuyên sâu hơn về các luật viết lại thường được sử dụng.
Yêu cầu
Để làm theo hướng dẫn này, bạn cần :
- Một server Ubuntu 16.04 được cài đặt với hướng dẫn cài đặt server ban đầu này , bao gồm firewall và user không phải root có quyền sudo .
- Apache 2 được cài đặt trên server của bạn theo Bước 1 của Cách cài đặt ngăn xếp Linux, Apache, MySQL, PHP (LAMP) trên Ubuntu 16.04 .
Bước 1 - Bật mod_rewrite
Đầu tiên, ta cần kích hoạt mod_rewrite
. Nó có sẵn nhưng không được kích hoạt khi cài đặt Apache 2 sạch.
- sudo a2enmod rewrite
Thao tác này sẽ kích hoạt module hoặc thông báo cho bạn biết rằng module đã được bật. Để những thay đổi này có hiệu lực, hãy khởi động lại Apache.
- sudo systemctl restart apache2
mod_rewrite
hiện đã được kích hoạt hoàn toàn. Trong bước tiếp theo, ta sẽ cài đặt .htaccess
mà ta sẽ sử dụng để xác định các luật viết lại cho chuyển hướng.
Bước 2 - Cài đặt .htaccess
Tệp .htaccess
cho phép ta sửa đổi các luật viết lại của bạn mà không cần truy cập file cấu hình server . Vì lý do này, .htaccess
rất quan trọng đối với bảo mật ứng dụng web của bạn. Dấu chấm đứng trước tên file đảm bảo file được ẩn.
Lưu ý: Bất kỳ luật nào bạn có thể đặt trong .htaccess
cũng có thể được đặt trực tiếp vào file cấu hình server . Trên thực tế, tài liệu Apache chính thức khuyến nghị sử dụng các file cấu hình server thay vì .htaccess
vì Apache xử lý theo cách đó nhanh hơn.
Tuy nhiên, trong ví dụ đơn giản này, hiệu suất tăng sẽ không đáng kể. Ngoài ra, việc cài đặt các luật trong .htaccess
rất tiện lợi, đặc biệt là với nhiều trang web trên cùng một server . Nó không yêu cầu khởi động lại server để các thay đổi có hiệu lực và nó không yêu cầu quyền root để chỉnh sửa các luật đó, đơn giản hóa việc bảo trì và áp dụng các thay đổi có thể thực hiện được với account không có quyền . Một số phần mềm nguồn mở phổ biến, như Wordpress và Joomla, thường dựa vào .htaccess
để phần mềm sửa đổi và tạo các luật bổ sung theo yêu cầu.
Ta cần cài đặt và bảo mật một vài cài đặt nữa trước khi có thể bắt đầu.
Theo mặc định, Apache cấm sử dụng .htaccess
để áp dụng các luật viết lại, vì vậy trước tiên bạn cần cho phép các thay đổi đối với file . Mở file cấu hình Apache mặc định bằng nano
hoặc editor yêu thích của bạn.
- sudo nano /etc/apache2/sites-available/000-default.conf
Bên trong file đó, bạn sẽ tìm thấy một khối <VirtualHost *:80>
bắt đầu từ dòng đầu tiên. Bên trong khối đó, hãy thêm khối mới sau để file cấu hình của bạn trông giống như sau. Đảm bảo rằng tất cả các khối đều được thụt lề đúng cách.
<VirtualHost *:80> <Directory /var/www/html> Options Indexes FollowSymLinks MultiViews AllowOverride All Require all granted </Directory> . . . </VirtualHost>
Lưu và đóng file . Để những thay đổi này có hiệu lực, hãy khởi động lại Apache.
- sudo systemctl restart apache2
Bây giờ, tạo .htaccess
trong folder root của web.
- sudo nano /var/www/html/.htaccess
Thêm dòng này ở đầu file mới để kích hoạt công cụ viết lại.
RewriteEngine on
Lưu file và thoát.
Đến đây bạn có một .htaccess
hoạt động mà bạn có thể sử dụng để điều chỉnh các luật định tuyến của ứng dụng web của bạn. Trong bước tiếp theo, ta sẽ tạo các file trang web mẫu mà ta sẽ sử dụng để chứng minh các luật viết lại.
Bước 3 - Cấu hình ghi lại URL
Ở đây, ta sẽ cài đặt một trình ghi lại URL cơ bản, chuyển đổi các URL đẹp thành các đường dẫn thực tế đến mã. Cụ thể, ta sẽ cho phép user truy cập http:// your_server_ip /about
.
Bắt đầu bằng cách tạo một file có tên about.html
trong folder root của web.
- sudo nano /var/www/html/about.html
Sao chép mã HTML sau vào file , sau đó lưu và đóng nó.
<html> <head> <title>About Us</title> </head> <body> <h1>About Us</h1> </body> </html>
Bạn có thể truy cập trang này tại http:// your_server_ip /about.html
, nhưng lưu ý nếu bạn cố gắng truy cập vào http:// your_server_ip /about
, bạn sẽ thấy lỗi 404 Not Found . Thay vào đó, nếu bạn muốn user truy cập trang bằng cách sử dụng about
, thì việc viết lại các luật sẽ cho phép chính chức năng này.
Tất cả các RewriteRules
tuân theo định dạng sau:
RewriteRule pattern substitution [flags]
RewriteRule
chỉ định chỉ thị.-
pattern
là một biểu thức chính quy trùng với chuỗi mong muốn từ URL, là chuỗi mà người xem nhập vào trình duyệt. -
substitution
là đường dẫn đến URL thực, tức là đường dẫn của server Apache file . -
flags
là các tham số tùy chọn có thể sửa đổi cách luật hoạt động.
Mở .htaccess
.
- sudo nano /var/www/html/.htaccess
Sau dòng đầu tiên, thêm RewriteRule
được đánh dấu màu đỏ và lưu file .
RewriteEngine on RewriteRule ^about$ about.html [NC]
Trong trường hợp này, ^about$
là mẫu, about.html
là thay thế và [NC]
là cờ. Ví dụ của ta sử dụng một vài ký tự có ý nghĩa đặc biệt:
-
^
cho biết phần bắt đầu của URL, sauyour_server_ip /
. -
$
cho biết phần cuối của URL. -
about
trùng với chuỗi “about”. -
about.html
là file thực mà user truy cập. -
[NC]
là một cờ làm cho luật không phân biệt chữ hoa chữ thường.
Bây giờ, bạn có thể truy cập http:// your_server_ip /about
trong trình duyệt của bạn . Trên thực tế, với luật được hiển thị ở trên, các URL sau sẽ trỏ đến about.html
:
-
http:// your_server_ip /about
, do định nghĩa luật . -
http:// your_server_ip /About
, vì luật không phân biệt chữ hoa chữ thường. -
http:// your_server_ip /about.html
, vì tên file thích hợp ban đầu sẽ luôn hoạt động.
Những điều sau đây sẽ không:
-
http:// your_server_ip /about/
, bởi vì luật rõ ràng khẳng định rằng có thể có gì sau khiabout
sử dụng$
nhân vật. -
http:// your_server_ip /contact
, vì nó sẽ không trùng với chuỗiabout
trong luật .
Đến đây bạn có một .htaccess
hoạt động với một luật đơn giản mà bạn có thể sửa đổi và mở rộng theo nhu cầu của bạn . Trong các phần sau, ta sẽ đưa ra hai ví dụ bổ sung về các lệnh thường được sử dụng.
Ví dụ 1 - Đơn giản hóa chuỗi truy vấn với RewriteRule
Các ứng dụng web thường sử dụng các chuỗi truy vấn , được nối vào URL bằng dấu chấm hỏi ( ?
) Sau địa chỉ. Các tham số riêng biệt được phân tách bằng dấu và ( &
). Chuỗi truy vấn được dùng để chuyển dữ liệu bổ sung giữa các trang ứng dụng riêng lẻ.
Ví dụ: trang kết quả tìm kiếm được viết bằng PHP có thể sử dụng URL như http://example.com/results.php?item=shirt&season=summer
. Trong ví dụ này, hai tham số bổ sung được chuyển đến tập lệnh ứng dụng result.php
tưởng tượng: item
, với value shirt
và season
với value summer
. Ứng dụng có thể sử dụng thông tin chuỗi truy vấn để xây dựng trang phù hợp cho khách truy cập.
Các luật viết lại của Apache thường được sử dụng để đơn giản hóa các liên kết dài và khó hiểu như ở trên thành các URL thân thiện , dễ nhập và diễn giải trực quan hơn. Trong ví dụ này, ta muốn đơn giản hóa liên kết trên để trở thành http://example.com/shirt/summer
. Giá trị tham số shirt
và summer
vẫn có trong địa chỉ, nhưng không có chuỗi truy vấn và tên tập lệnh.
Đây là một luật để thực hiện điều này:
RewriteRule ^shirt/summer$ results.php?item=shirt&season=summer [QSA]
shirt/summer
được đối sánh rõ ràng trong địa chỉ được yêu cầu và Apache được yêu cầu phân phát results.php?item=shirt&season=summer
.
Cờ [QSA]
thường được sử dụng trong các luật viết lại. Họ yêu cầu Apache nối bất kỳ chuỗi truy vấn bổ sung nào vào URL được phục vụ, vì vậy nếu khách truy cập nhập http://example.com/shirt/summer? page=2
server sẽ trả lời với results.php?item=shirt&season=summer &page=2
. Nếu không có nó, chuỗi truy vấn bổ sung sẽ bị loại bỏ.
Trong khi phương pháp này đạt được hiệu quả mong muốn, cả tên mục và phần đều được mã hóa cứng vào luật . Điều này nghĩa là luật sẽ không áp dụng cho bất kỳ mặt hàng nào khác, như pants
hoặc các mùa, như winter
.
Để làm cho luật chung chung hơn, ta có thể sử dụng biểu thức chính quy để khớp các phần của địa chỉ root và sử dụng các phần đó trong một mẫu thay thế. Luật được sửa đổi sau đó sẽ trông như sau:
RewriteRule ^([A-Za-z0-9]+)/(summer|winter|fall|spring) results.php?item=$1&season=$2 [QSA]
Group biểu thức chính quy đầu tiên trong dấu ngoặc đơn trùng với một chuỗi có chứa các ký tự chữ và số như shirt
hoặc pants
và lưu phân đoạn đã so khớp dưới dạng biến $1
. Group biểu thức lại thông thường thứ hai trong ngoặc đơn đối sánh chính xác với summer
, winter
, fall
hoặc spring
và tương tự lưu phân đoạn đã khớp dưới dạng $2
.
Sau đó, các phân đoạn phù hợp được sử dụng trong URL kết quả trong các biến item
và season
thay vì các giá trị shirt
và summer
mà ta đã sử dụng trước đây.
Ở trên sẽ chuyển đổi, ví dụ: http://example.com/pants/summer
thành http://example.com/results.php?item=pants&season=summer
. Ví dụ này cũng là bằng chứng trong tương lai, cho phép các mục và phần thay đổi được viết lại chính xác bằng cách sử dụng một luật duy nhất.
Ví dụ 2 - Thêm điều kiện với logic bằng RewriteConds
Các luật viết lại không nhất thiết phải luôn được đánh giá từng cái một mà không có bất kỳ giới hạn nào. Chỉ thị RewriteCond
cho phép ta thêm điều kiện vào các luật viết lại của ta để kiểm soát thời điểm các luật sẽ được xử lý. Tất cả các RewriteConds
tuân theo định dạng sau:
RewriteCond TestString Condition [Flags]
RewriteCond
chỉ định chỉ thịRewriteCond
.-
TestString
là chuỗi để kiểm tra. -
Condition
là mẫu hoặc điều kiện để phù hợp. -
Flags
là các tham số tùy chọn có thể sửa đổi điều kiện và luật đánh giá.
Nếu RewriteCond
đánh giá là true, thì RewriteRule
ngay sau đó sẽ được xem xét. Nếu không, luật sẽ bị loại bỏ. Nhiều RewriteCond
được dùng lần lượt và với hành vi mặc định, tất cả đều phải đánh giá là true để luật sau được xem xét.
Ví dụ: giả sử bạn muốn chuyển hướng tất cả các yêu cầu đến các file hoặc folder không tồn tại trên trang web trở lại trang chủ thay vì hiển thị trang lỗi 404 Not Found tiêu chuẩn. Điều này có thể đạt được với các luật điều kiện sau:
RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule . /
Với những điều trên:
-
%{REQUEST_FILENAME}
là chuỗi cần kiểm tra. Trong trường hợp này, đó là tên file được yêu cầu, là một biến hệ thống có sẵn cho mọi yêu cầu. -
-f
là một điều kiện tích hợp để xác minh xem tên được yêu cầu có tồn tại trên đĩa và là một file hay không. Cái!
là một toán tử phủ định. Kết hợp!-f
chỉ có giá trị true nếu một tên cụ thể không tồn tại hoặc không phải là một file . - Tương tự
!-d
đánh giá là true nếu một tên cụ thể không tồn tại hoặc không phải là một folder .
Luật RewriteRule
trên dòng cuối cùng sẽ chỉ có hiệu lực đối với các yêu cầu đối với các file hoặc folder không tồn tại. Bản thân RewriteRule
rất đơn giản và chuyển hướng mọi yêu cầu đến folder root /
trang web.
Kết luận
mod_rewrite
là một module Apache hữu ích được dùng hiệu quả đảm bảo các URL có thể đọc được của con người. Trong hướng dẫn này, bạn đã học cách sử dụng lệnh RewriteRule
để chuyển hướng URL, bao gồm cả những URL có chuỗi truy vấn. Bạn cũng đã học cách chuyển hướng URL có điều kiện bằng chỉ thị RewriteCond
.
Nếu bạn muốn tìm hiểu thêm về mod_rewrite
, hãy xem Giới thiệu về mod_rewrite của Apache và tài liệu chính thức của Apache về mod_rewrite .
Các tin liên quan
Cách mã hóa kết nối Tomcat 8 với Apache hoặc Nginx trên CentOS 72017-01-24
Cách tạo chứng chỉ SSL trên Apache cho CentOS 7
2017-01-04
Cách bảo mật Apache bằng Let's Encrypt trên Debian 8
2016-12-20
Cách cung cấp các ứng dụng Django với Apache và mod_wsgi trên Debian 8
2016-12-19
Cách tạo chuyển hướng tạm thời và vĩnh viễn với Apache
2016-12-15
Cách di chuyển web root Apache đến một vị trí mới trên Debian 8
2016-12-14
Cách thiết lập mod_rewrite cho Apache trên CentOS 7
2016-10-26
Cách di chuyển web root Apache đến vị trí mới trên Ubuntu 16.04
2016-07-27
Cách thiết lập xác thực mật khẩu với Apache trên Ubuntu 16.04
2016-07-26
Cách cung cấp các ứng dụng Django với Apache và mod_wsgi trên Ubuntu 16.04
2016-05-17