Bộ mã hóa URL
Mã hóa văn bản cho URL với nhiều chế độ mã hóa (RFC 3986, Query String, Form Data), phân tích chi tiết từng ký tự một cách trực quan và phân tích mã hóa toàn diện. Xem chính xác những ký tự nào được mã hóa và tại sao.
Trình chặn quảng cáo đang ngăn chúng tôi hiển thị quảng cáo
MiniWebtool miễn phí nhờ quảng cáo. Nếu công cụ này hữu ích, hãy ủng hộ bằng Premium (không quảng cáo + nhanh hơn) hoặc cho phép MiniWebtool.com rồi tải lại trang.
- Hoặc nâng cấp Premium (không quảng cáo)
- Cho phép quảng cáo cho MiniWebtool.com, rồi tải lại
Giới thiệu về Bộ mã hóa URL
Chào mừng bạn đến với Bộ mã hóa URL, một công cụ mạnh mẽ để mã hóa phần trăm văn bản nhằm sử dụng an toàn trong các URL. Công cụ này cung cấp nhiều chế độ mã hóa (RFC 3986, Query String, Phân đoạn đường dẫn), phân tích trực quan từng ký tự và thống kê toàn diện. Xem chính xác những ký tự nào đã được mã hóa và hiểu lý do tại sao, làm cho nó trở nên hoàn hảo cho các nhà phát triển, chuyên gia SEO và bất kỳ ai làm việc với URL.
Mã hóa URL là gì?
Mã hóa URL (còn được gọi là mã hóa phần trăm) là một cơ chế mã hóa thông tin trong Định danh tài nguyên thống nhất (URI). Nó thay thế các ký tự ASCII không an toàn bằng dấu "%" theo sau là hai chữ số thập lục phân đại diện cho giá trị byte của ký tự trong mã hóa UTF-8.
Ví dụ:
- Khoảng trắng trở thành
%20(hoặc+trong chuỗi truy vấn) - Dấu và
&trở thành%26 - Dấu hỏi
?trở thành%3F
Tại sao mã hóa URL lại cần thiết?
Các URL chỉ có thể chứa một tập hợp ký tự hạn chế từ bộ ký tự US-ASCII. Các ký tự bên ngoài tập hợp này hoặc các ký tự có ý nghĩa đặc biệt trong URL (như &, =, ?), phải được mã hóa để:
- Ngăn chặn việc hiểu sai: Các ký tự đặc biệt như
&phân tách các tham số truy vấn. Nếu dữ liệu của bạn chứa&, nó phải được mã hóa thành%26. - Hỗ trợ các ký tự quốc tế: Các ký tự không thuộc ASCII (như tiếng Việt, tiếng Ả Rập, biểu tượng cảm xúc) phải được mã hóa dưới dạng chuỗi byte UTF-8.
- Đảm bảo truyền tải an toàn: Một số ký tự không an toàn cho URL do các vấn đề bảo mật tiềm ẩn hoặc sự cố truyền tải.
Giải thích các chế độ mã hóa
RFC 3986 (Thành phần URL)
Mã hóa tiêu chuẩn được xác định bởi RFC 3986. Tất cả các ký tự ngoại trừ các ký tự không được bảo lưu (A-Z, a-z, 0-9, -, ., _, ~) đều được mã hóa phần trăm. Khoảng trắng trở thành %20. Hãy sử dụng chế độ này cho hầu hết các thành phần URL.
Chuỗi truy vấn (application/x-www-form-urlencoded)
Mã hóa phổ biến cho các lần gửi biểu mẫu HTML và các truy vấn tìm kiếm. Khoảng trắng trở thành + thay vì %20. Đây là những gì trình duyệt sử dụng khi gửi biểu mẫu.
Phân đoạn đường dẫn
Tương tự như RFC 3986 nhưng vẫn giữ lại các dấu gạch chéo (/). Hãy sử dụng chế độ này khi mã hóa các đường dẫn URL mà bạn muốn duy trì cấu trúc thư mục.
Mã hóa hoàn toàn
Mã hóa mọi thứ ngoại trừ các ký tự chữ cái và số (A-Z, a-z, 0-9). Đây là chế độ mã hóa mạnh mẽ nhất, hữu ích khi yêu cầu sự an toàn tối đa.
Các ký tự phải được mã hóa
Ký tự được bảo lưu
Các ký tự này có ý nghĩa đặc biệt trong URL và phải được mã hóa khi được sử dụng làm dữ liệu:
| Ký tự | Đã mã hóa | Mục đích trong URL |
|---|---|---|
: | %3A | Dấu phân cách lược đồ (http:), dấu phân cách cổng |
/ | %2F | Dấu phân cách phân đoạn đường dẫn |
? | %3F | Dấu phân cách chuỗi truy vấn |
# | %23 | Mã định danh phân đoạn |
& | %26 | Dấu phân cách tham số truy vấn |
= | %3D | Dấu phân cách khóa-giá trị |
@ | %40 | Dấu phân cách thông tin người dùng |
Ký tự không an toàn
Các ký tự này phải luôn được mã hóa:
| Ký tự | Đã mã hóa | Lý do |
|---|---|---|
| Khoảng trắng | %20 hoặc + | Không được phép trong URL |
< > | %3C %3E | Tiềm ẩn nguy cơ HTML injection |
" | %22 | Dấu phân cách thuộc tính trong HTML |
{ } | %7B %7D | Không hợp lệ trong URL |
| | %7C | Ký tự không an toàn |
\ | %5C | Ký tự không an toàn |
Cách sử dụng công cụ này
- Nhập văn bản: Nhập hoặc dán văn bản bạn muốn mã hóa vào vùng nhập dữ liệu. Thử các nút ví dụ nhanh cho các trường hợp sử dụng phổ biến.
- Chọn chế độ mã hóa: Chọn chế độ thích hợp dựa trên trường hợp sử dụng của bạn (RFC 3986 cho các thành phần, Query String cho các tham số tìm kiếm, v.v.).
- Nhấp vào Mã hóa: Công cụ sẽ mã hóa văn bản của bạn và hiển thị kết quả.
- Xem lại phân tích: Xem phân tích chi tiết từng ký tự cho thấy ký tự nào đã được mã hóa và tại sao.
- Sao chép kết quả: Nhấp vào nút Sao chép để sao chép văn bản đã mã hóa vào khay nhớ tạm của bạn.
Các trường hợp sử dụng phổ biến
Tham số API
Khi truyền dữ liệu nhập của người dùng dưới dạng tham số URL:
https://api.example.com/search?q=Hello%20World%21
URL chuyển hướng
Khi mã hóa một URL để truyền dưới dạng tham số:
https://example.com/redirect?url=https%3A%2F%2Fother-site.com
Tên tệp
Khi mã hóa tên tệp có khoảng trắng hoặc ký tự đặc biệt:
/files/My%20Document%20%282024%29.pdf
Câu hỏi thường gặp
Mã hóa URL là gì?
Mã hóa URL, còn được gọi là mã hóa phần trăm, là một cơ chế mã hóa thông tin trong Định danh tài nguyên thống nhất (URI). Nó thay thế các ký tự ASCII không an toàn bằng dấu '%' theo sau là hai chữ số thập lục phân đại diện cho giá trị byte của ký tự đó. Ví dụ: khoảng trắng trở thành %20 và dấu và (&) trở thành %26.
Tại sao các URL cần được mã hóa?
Các URL chỉ có thể chứa một tập hợp ký tự hạn chế từ bộ ký tự ASCII. Các ký tự như khoảng trắng, ký hiệu đặc biệt và các ký tự không thuộc ASCII phải được mã hóa để truyền đi chính xác. Nếu không mã hóa, các ký tự này có thể bị hiểu sai là dấu phân cách URL hoặc gây ra lỗi truyền tải.
Sự khác biệt giữa mã hóa RFC 3986 và mã hóa chuỗi truy vấn (query string) là gì?
Mã hóa RFC 3986 sử dụng %20 cho khoảng trắng và là tiêu chuẩn cho các thành phần URL. Mã hóa chuỗi truy vấn (application/x-www-form-urlencoded) sử dụng dấu + cho khoảng trắng và thường được sử dụng trong việc gửi biểu mẫu HTML và các truy vấn tìm kiếm. Cả hai đều hợp lệ nhưng được sử dụng trong các ngữ cảnh khác nhau.
Những ký tự nào an toàn trong URL mà không cần mã hóa?
Theo RFC 3986, các ký tự không được bảo lưu không cần mã hóa là: chữ cái viết hoa (A-Z), chữ cái viết thường (a-z), chữ số (0-9) và bốn ký tự đặc biệt: dấu gạch ngang (-), dấu chấm (.), dấu gạch dưới (_) và dấu ngã (~). Tất cả các ký tự khác nên được mã hóa phần trăm.
Làm cách nào để mã hóa các ký tự đặc biệt như & và = trong tham số URL?
Các ký tự đặc biệt như & (dấu và) và = (dấu bằng) phải được mã hóa phần trăm khi được sử dụng làm dữ liệu trong tham số URL. & trở thành %26 và = trở thành %3D. Điều này giúp ngăn chúng bị hiểu là dấu phân cách tham số hoặc dấu phân cách khóa-giá trị.
Công cụ liên quan
- Bộ giải mã URL - Giải mã các URL đã được mã hóa phần trăm trở lại văn bản thuần túy
- Bộ mã hóa Base64 - Mã hóa văn bản sang định dạng Base64
- Bộ mã hóa thực thể HTML - Mã hóa các ký tự đặc biệt HTML
Tài nguyên bổ sung
Tham khảo nội dung, trang hoặc công cụ này như sau:
"Bộ mã hóa URL" tại https://MiniWebtool.com/vi/bộ-mã-hóa-url/ từ MiniWebtool, https://MiniWebtool.com/
โดยทีม miniwebtool อัปเดตล่าสุด: 14 ม.ค. 2026