URL là một trong những khái niệm công nghệ được sử dụng phổ biến nhất hiện nay. Về cơ bản, họ sử dụng các địa chỉ mà bạn sử dụng để truy cập các tài nguyên khác nhau – hầu hết thời gian, bạn sử dụng một địa chỉ để truy cập một trang web cụ thể có sẵn trên internet. Do URL được người dùng “xử lý” thường xuyên, nên điều quan trọng là phải cẩn thận khi chọn tên miền cũng như cấu trúc thư mục của trang web của bạn, vì các quyết định bạn đưa ra rõ ràng đối với người dùng và tác động đến trải nghiệm của họ khi điều hướng qua trang web của bạn. URL cũng rất quan trọng khi nói đến tối ưu hóa công cụ tìm kiếm.
URL là gì?
Danh mục bài viết
URL (Uniform Resource Locator) là từ viết tắt của bộ định vị tài nguyên đồng nhất, và nó là một khái niệm cốt lõi của máy tính hiện đại. Theo định nghĩa, URL là một chuỗi văn bản có định dạng đề cập đến vị trí của tài nguyên trên mạng máy tính (phổ biến nhất là Web). Thông thường, các tài nguyên này là các trang web, nhưng chúng cũng có thể là tài liệu văn bản, đồ họa, chương trình hay khác nhiều thứ có thể được lưu trữ kỹ thuật số.
Ngoài “địa chỉ” của tài nguyên, một URL đầy đủ cũng sẽ ngụ ý phương thức (hoặc giao thức) mà tài nguyên sẽ được truy xuất.
Một URL cơ bản sẽ bao gồm ba phần hoặc các chuỗi con, được phân tách bằng cách xác định các ký tự. Chúng bao gồm giao thức, tên máy chủ hoặc địa chỉ và vị trí tài nguyên. Một ví dụ đơn giản về chuỗi URL sẽ có dạng sau: http://www.example.com/index.html.
Thành phần của URL
Cách tốt nhất để kiểm tra cấu trúc của URL là thông qua ví dụ, vì vậy, với mục đích của chúng tôi, mình sẽ sử dụng URL giả sau đây và chia nhỏ thành các thành phần khác nhau của nó: http://www.whatever.com:80/whatever/whatever.html?this=that&that=this#fn2
- http:// – đây là lược đồ hoặc chuỗi con giao thức và nó chỉ ra giao thức nào phải được sử dụng để tìm nạp tệp hoặc tài liệu mong muốn. Mặc dù HTTP là phổ biến nhất, nhưng đây không phải là lựa chọn duy nhất. Các giao thức khác bao gồm HTTPS (phiên bản bảo mật của HTTP), mailto: (để mở ứng dụng thư khách), ftp: (để xử lý chuyển tập tin cơ bản) và các giao thức khác. Dấu hai chấm (:) là dấu phân cách lược đồ URI và dấu gạch chéo thuận (//) được xác định bắt đầu tên máy chủ cục bộ.
- www. – phần này của URL xác định nội dung, trong trường hợp này rộng thế giới web. Phần này của một URL cũng có thể được sử dụng để chỉ ra một tên miền phụ. Chẳng hạn, chúng tôi có thể thay đổi ví dụ của mình để bao gồm http://support.whthing.com để truy cập trang hỗ trợ nội bộ từ trang web mục tiêu.
- whatever.com – đây là tên miền, và được sử dụng để chỉ ra các máy chủ mục tiêu hoặc máy chủ web. Phần cuối cùng của tên miền của chúng tôi, .com, là hậu tố tên miền và được sử dụng để xác định loại hoặc vị trí của trang web được đề cập. Các hậu tố tên miền khác bao gồm .org, .net và các hậu tố cụ thể theo vùng như .co.uk. Hiện có hơn 500 hậu tố tên miền (hoặc gTLDs) tồn tại.
- : 80 – đây là cổng và nó cho biết “cổng” được sử dụng để truy cập tài nguyên trên máy chủ web dự định. Phần URL này thường bị bỏ qua khi máy chủ web đang sử dụng các cổng tiêu chuẩn cho giao thức HTTP hoặc HTTPS. Nếu một cổng phi tiêu chuẩn được sử dụng, phần này phải được bao gồm trong URL. Một lần nữa, dấu hai chấm (:) hoạt động như một dấu phân cách.
- whatever / whatever.html – điều này cho biết đường dẫn đến tài nguyên trên máy chủ. Ban đầu phần này chỉ đến một vị trí thực trên một máy chủ cụ thể, mặc dù bây giờ nó thường chỉ ra một vị trí trừu tượng của dữ liệu được tìm nạp. Dấu gạch chéo một lần nữa đóng vai trò như một tách để duy trì tính toàn vẹn của cú pháp thứ bậc URL.
- ? this = that & that = this – đây là chuỗi truy vấn. Nó bao gồm một dấu hỏi kèm theo một hoặc nhiều tham số mà máy chủ web có thể sử dụng để trả về nội dung cụ thể hoặc một phiên bản cụ thể của nội dung được yêu cầu. Các URL có chuỗi truy vấn thường được gọi là “URL động”. Các thông số được sử dụng trong các URL động không nhất thiết phải phổ biến, và mỗi máy chủ web có những quy định riêng của mình về việc sử dụng của họ.
- #fn2 – phần cuối cùng của URL là đoạn tùy chọn hoặc “neo”. Nó được biểu thị bằng hàm băm (#) và được theo sau bởi một số văn bản. Điều này được trình duyệt sử dụng để định vị trang web đó tại một vị trí cụ thể.
Các chuỗi con này được kết hợp với nhau tạo thành một URL hoàn chỉnh. Nó được định nghĩa là giao thức cần thiết để lấy một tập tin hoặc tài liệu; máy chủ, vị trí của nội dung đó trên máy chủ đó; cổng được sử dụng để truy cập máy chủ đó; thông tin liên quan đến máy chủ về nội dung; và thông tin liên quan đến khách hàng về màn hình hiển thị nội dung.
Thiết kế một URL tối ưu
Bây giờ chúng ta sẽ tìm hiểu tại sao cần phải thiết kế một URL tối ưu. chúng ta sẽ tìm hiểu sâu hơn những điều đóng góp vào việc tạo ra một URL tốt.
Tại sao cần tối ưu URL
Điều đầu tiên, URL là một trong số ít những thứ được sử dụng thường xuyên bất kể trình duyệt, hệ điều hành hoặc thiết bị đang được sử dụng
URL là công cụ hỗ trợ điều hướng được sử dụng bởi người thực, không chỉ máy móc, vì vậy thiết kế của họ là một phương pháp khác để bạn có thể tiếp cận đối tượng của mình.
Hầu hết tất cả, URL là một thỏa thuận không có căn cứ giữa người dùng của bạn và bạn. Đưa ra một URL cụ thể, người đó sẽ có thể sử dụng nó ngay bây giờ và vào một ngày sau đó để trả về một tài nguyên cụ thể (hoặc phần phụ của tài nguyên đó). Vì vậy, bạn nên tránh thay đổi URL sang các trang của mình nếu có thể. Nếu bạn phải, hãy thiết lập các chuyển hướng (nhưng làm như vậy sẽ thêm vào thời gian tải trang của bạn vì mỗi lần chuyển hướng phải được phân tích cú pháp và thực thi). Bởi vì điều này, việc thiết kế URL của bạn ngay từ đầu có nghĩa là bạn không cần phải lo lắng nhiều về việc cần phải thay đổi chúng vào thời điểm sau này.
Một số tip để có một URL tối ưu nhất
Đây là một số mẹo thiết thực để giúp bạn triển khai chúng:
- Sử dụng dấu gạch ngang trên dấu gạch dưới. Mặc dù các công cụ tìm kiếm đã từng có thời gian phân tích URL dễ dàng hơn với các dấu gạch dưới so với các dấu gạch nối, nhưng điều đó không còn đúng nữa. Điều này, kết hợp với thực tế là dấu gạch nối dễ sử dụng hơn, làm cho dấu gạch nối trở thành lựa chọn tốt hơn cho URL.
- Sử dụng các từ ngắn gọn, dễ nhớ. Điều này liên quan trực tiếp đến việc có các URL ngắn hơn, ảnh hưởng đến trải nghiệm người dùng. Ngoài việc dễ dàng sao chép và dán, chia sẻ và nhúng vào các trang web khác.
- Làm cho trường hợp URL của bạn không nhạy cảm. Mọi người rất có thể sẽ sử dụng tất cả các chữ cái viết thường khi gõ URL của bạn, nhưng bạn chắc chắn không muốn mất người dùng sử dụng / Home hoặc / HOME khi URL của bạn chỉ hoạt động với / home.
- Tránh các ký tự không phải ASCII. Chỉ sử dụng các ký tự ASCII giúp cải thiện trải nghiệm người dùng, vì họ dễ nhập hơn. Ngoài ra, sử dụng các ký tự không phải ASCII có nghĩa là URL của bạn ít có khả năng truyền tải thông tin đến người dùng về những gì họ có thể mong đợi để xem trên trang của bạn.
- Tránh mở rộng tập tin. Đầu tiên, tiện ích mở rộng tệp có xu hướng không tương thích về phía trước, vì vậy nếu các tiêu chuẩn thay đổi, bạn sẽ cần phải làm lại tất cả các URL của mình để các liên kết hiện tại không bị phá vỡ.
Kết luận
URL, một trong những khái niệm máy tính được sử dụng phổ biến nhất hiện nay, là các chuỗi văn bản được thiết kế để giúp định vị (các) tài nguyên mà bạn quan tâm – trong khi bạn rất có thể đang tìm kiếm một trang web cụ thể trên internet, URL có thể được sử dụng để định vị bất kỳ tài nguyên nào trên một mạng máy tính nhất định. Vì chúng thường được xử lý, thiết kế URL là một cách mà bạn có thể tác động đến trải nghiệm người dùng. Bằng cách dành thời gian để thiết kế URL của bạn để làm cho nó có nhiều thông tin và dễ sử dụng nhất có thể, bạn sẽ đảm bảo nhiều lượt xem trang hơn cho tài nguyên của mình.