標籤歸檔:中文url

再談Nginx Rewrite, 中文URL和其它

上次談到過Nginx和中文URL的問題,這幾天又加深了認識。 多分享幾個關於Nginx Rewrite的經驗。

Nginx匹配指定中文URL的方法:

rewrite "(*UTF8)^\x{66f4}\x{6539}$" /index.html last;

這個會將 http://www.cslog.cn/%E6%9B%B4%E6%94%B9 重定向到http://www.cslog.cn/index.html。
‘/%E6%9B%B4%E6%94%B9′是中文URL ‘/更改’, \x{66f4}\x{6539}是這兩個漢字的Unicode編碼。

注意配合PCRE 7.9以上版本使用,詳細看Nginx和中文URL的問題
繼續閱讀

發表在 信息處理, 站長文檔 | 標籤為 , , , , , , , , , , , , , | 一條評論

Nginx、PCRE和中文URL(UTF8編碼)rewrite路徑重寫匹配問題

最近遇到了使用Nginx 重寫中文UTF8編碼路徑的問題。 才發現默認情況下Nginx的rewrite是不支持UTF8匹配的。 比如:

rewrite ^/(..)$ /2個字符文章.html break; #用2個點
可以匹配到 /ab 或 /51, 但 /漢字 是匹配不到的。 我測試了一下, 要匹配兩個字的 /漢字 路徑, 得用

rewrite ^/(……)$ /2個漢字文章.html break; #要用六個點

如果要讓 ^/(..)$ 匹配到2個漢字字符,得開啟Nginx對UTF8字符的正則支持, 準確點說是開啟Nginx使用的PCRE庫的對UTF8字符的支持。因為Nginx的rewrite模塊是調用PCRE來處理正則的。 如果PCRE沒有問題,Nginx支持UTF8編碼的重寫樣式是:

rewrite "(*UTF8)^/(..)$" /2個字符文章.html break;
#注意(*UTF8)前綴和引號的加入。

繼續閱讀

發表在 信息處理, 站長文檔 | 標籤為 , , , , , , , , , , , , , | 2 條評論