Canonical URL là một thuật ngữ phổ biến trong lĩnh vực SEO. Tuy nhiên, không phải ai cũng hiểu rõ về ý nghĩa của nó và vai trò quan trọng mà nó đóng vai trong SEO. Vì vậy, trong bài viết này, chúng ta sẽ điểm qua Canonical URL là gì ? tầm quan trọng của nó đối với chiến lược SEO như thế nào ? 

Canonical URL là gì?

Canonical URL (còn được gọi là Rel Canonical) là một phần của mã HTML được sử dụng để xác định địa chỉ URL chính của một trang khi có nội dung bị trùng lặp trên các trang web. Thẻ Canonical được sử dụng trong trường hợp nội dung bị trùng lặp hoặc giống nhau trên nhiều địa chỉ URL khác nhau.

Trong trường hợp có nội dung tương đồng hoặc giống nhau trên các địa chỉ URL khác nhau, bạn có thể sử dụng nó để xác định phiên bản nào là chính và sau đó index

Canonical URL

>>> Xem thêm : Lỗi 404 Not Found là gì? Nguyên nhân và cách khắc phục

Cấu trúc chuẩn của Thẻ Canonical

Thẻ Canonical được cấu trúc như thế nào? Đó là một đoạn mã đơn giản, mạch lạc, thường được đặt trong phần của trang web, ví dụ như:

Canonical URL

Ý nghĩa của từng phần trong đoạn mã Canonical URL được hiểu như sau:

link rel=“canonical”: Liên kết trong thẻ này là bản gốc của trang này.
href=“https://example.com/sample-page/”: truy cập bản gốc tại đây.

Tại sao thẻ Canonical lại quan trọng trong SEO?

Khi một trang web trở nên ngày càng lớn và chứa nhiều thông tin, thường xảy ra việc xuất hiện các trang có nội dung tương tự hoặc trùng lặp nhau. Điều này có thể dẫn đến vấn đề “nội dung trùng lặp,” và có khả năng bị các thuật toán của các công cụ tìm kiếm xử phạt.

Vấn đề “nội dung trùng lặp” là một thách thức phức tạp. Khi các công cụ tìm kiếm thu thập các địa chỉ URL có nội dung giống nhau hoặc tương tự, nếu những URL này đều được đánh dấu để được index và xếp hạng cho cùng một cụm từ khóa, việc này có thể dẫn đến tình trạng các công cụ tìm kiếm chọn lựa xếp hạng cho những URL mà bạn không mong muốn. Thẻ Canonical là giải pháp cho vấn đề này.

Thẻ Canonical giúp:

  1. Xác định một URL chuẩn mà bạn muốn người tìm kiếm thấy trong kết quả tìm kiếm.
  2. Kết hợp các URL có nội dung tương tự hoặc trùng lặp.
  3. Đơn giản hóa việc theo dõi chỉ số cho một chủ đề hoặc sản phẩm.
  4. Quản lý phân phối nội dung: Khi nội dung được xuất bản trên các miền khác nhau, bạn muốn hợp nhất xếp hạng trang cho URL ưu tiên.
  5. Ngăn các bot của công cụ tìm kiếm dành thời gian thu thập dữ liệu từ các trang trùng lặp. Điều này giúp các bot tập trung vào khai thác nội dung mới (hoặc cập nhật) trên trang web thay vì dành thời gian thu thập dữ liệu từ các phiên bản dành cho máy tính để bàn và thiết bị di động trên cùng một trang.

Quy tắc sử dụng thẻ Canonical

Quy tắc 1: Sử dụng URL tuyệt đối

Nên sử dụng cấu trúc sau: <link rel=“canonical” href=“https://example.com/sample-page/” />

Thay vì sử  dụng cấu trúc : <link rel=“canonical” href=”/sample-page/” />

Quy tắc 2: Sử dụng chữ viết thường trong URL

Google thường xem xét URL viết hoa và viết thường là hai liên kết khác nhau. Tuy nhiên, nên sử dụng chữ viết thường trong URL trên máy chủ của bạn, sau đó sử dụng liên kết viết thường cho Thẻ Canonical.

Quy tắc 3: Sử dụng phiên bản miền HTTPS hoặc HTTP chính xác

Nếu bạn đã chuyển sang SSL, đảm bảo rằng bạn không sử dụng bất kỳ URL không phải SSL (HTTP) nào trong việc sử dụng Thẻ Canonical. Việc này lý thuyết có thể dẫn đến sự nhầm lẫn và kết quả không mong muốn.

Quy tắc 4: Sử dụng Thẻ Canonical tự tham chiếu

Vì điều này giúp Google hiểu rõ bạn muốn trang nào được index hoặc cấu trúc liên kết sẽ ra sao khi được index.

Quy tắc 5: Sử dụng 1 Thẻ Canonical cho mỗi trang

Nếu 1 trang có nhiều hơn 1 Thẻ Canonical, Google sẽ bỏ qua tất cả. Vì vậy, mỗi trang chỉ nên sử dụng 1 thẻ duy nhất!

Cách thực hiện: Có năm phương pháp để xác định liên kết gốc với các tín hiệu chuẩn hóa sau:

  1. Thẻ HTML
  2. Tiêu đề HTTP
  3. Bản đồ trang (Sitemap)
  4. Chuyển hướng 301 (301 redirect)
  5. Liên kết nội bộ (Internal links)

Thực hiện cài đặt thẻ Canonical

Thẻ Canonical bằng cách sử dụng HTML rel=”canonical”.

Sử dụng Thẻ rel=”canonical” là phương pháp đơn giản và rõ ràng nhất để xác định liên kết gốc. Việc thực hiện rất đơn giản: chỉ cần thêm đoạn mã dưới đây vào phần <head> của bất kỳ trang trùng lặp nào:

Giả sử bạn đang quản lý một trang web thương mại điện tử chuyên bán áo thun. Bạn muốn xác định URL gốc là https://yourstore.com/tshirts/black-tshirts/. Ngay cả khi nội dung trang đó có thể được truy cập thông qua các URL khác như https://yourstore.com/offers/black-tshirts/. Trong trường hợp này, bạn chỉ cần thêm đoạn mã thẻ sau vào bất kỳ trang trùng lặp nào: 

<link rel=“canonical” href=“https://yourstore.com/tshirts/black-tshirts/” />

Lưu ý rằng : Nếu bạn đang dùng CMS, bạn không cần phải lo lắng về mã code của trang

Thiết lập thẻ Canonical trong WordPress

Đầu tiên, bạn cần cài đặt plugin Yoast SEO để Thẻ Canonical tự động tham chiếu sẽ được thêm vào trang. Để thêm các tùy chọn tùy chỉnh cho thẻ này, hãy nhấp vào phần “Nâng cao” trên mỗi bài đăng hoặc trang.

Canonical URL

Hướng dẫn kiểm tra trang được khai báo thẻ Canonical chưa?

Sau khi bạn đã cài đặt Thẻ Canonical cho trang, bạn có thể thực hiện kiểm tra để đảm bảo hiệu suất SEO tối ưu. Dưới đây là một số mục bạn nên kiểm tra cụ thể:

Trang đã được khai báo Thẻ Canonical chưa?

URL chuẩn có thể thu thập dữ liệu và được lập chỉ mục không?

Một lỗi phổ biến là chỉ định chính tắc tới một URL bị chặn bởi tệp robots.txt hoặc đã được đánh dấu “noindex”. Điều này có thể tạo ra tín hiệu mơ hồ và khó hiểu cho các công cụ tìm kiếm. Vì vậy, hãy kiểm tra chúng:

Kiểm tra bằng cách xem mã nguồn trang

Trong hầu hết trình duyệt, bạn có thể chuột phải để xem mã nguồn trang (View Page Source) hoặc chỉ cần nhập vào địa chỉ sau: view-source: https://domain.com

Kiểm tra bằng công cụ Mozbar, SeoQuake…

Có nhiều công cụ giúp kiểm tra Thẻ Canonical, trong bài viết này, chúng tôi sẽ giới thiệu hai công cụ Mozbar và SeoQuake, đây đều là những công cụ SEO miễn phí.

Canonical URL

Một số sai lầm mắc phải khi sử dụng thẻ Canonical

Chặn URL được chuẩn hóa qua Robots.txt

Việc chặn một URL trong tệp robots.txt sẽ ngăn cản Google thu thập dữ liệu. Điều này đồng nghĩa rằng các Thẻ Canonical sẽ không thể hiện trên đó. Như vậy, Google cũng sẽ không thể chuyển “link equity” từ URL Phiên bản gốc sang URL Phiên bản chuẩn.

 Đặt URL được chuẩn hóa thành ‘noindex’

Hãy nhớ rằng, tốt nhất không nên kết hợp thẻ noindex với Thẻ Canonical. Bởi vì chúng là hai yếu tố hoàn toàn trái ngược nhau.

Thường thì Google ưu tiên Thẻ Canonical hơn là thẻ “noindex”. Trong trường hợp bạn muốn cùng lúc thực hiện noindex và gắn thẻ Canonical, hãy sử dụng chuyển hướng 301. Nếu không, chỉ sử dụng Thẻ rel=canonical.

Đặt mã trạng thái HTTP 4XX cho URL gốc

Việc đặt mã trạng thái HTTP 4XX cho URL gốc có tác động tương tự như việc dùng thẻ “noindex”. Google sẽ không thể nhận biết Thẻ Canonical để chuyển “link equity” từ Phiên bản không chuẩn sang Phiên bản gốc.

Kết hợp tất cả các Trang phân trang thành URL gốc

Không nên gắn URL Canonical vào các Trang phân trang để trỏ về Trang phân trang đầu tiên trong chuỗi. Thay vào đó, chúng ta nên sử dụng Thẻ tự tham chiếu trên các trang này.

Không sử dụng Thẻ Canonical với Hreflang

Thẻ hreflang được sử dụng để xác định đối tượng mục tiêu dựa trên ngôn ngữ và vị trí địa lý của trang web.

Sử dụng quá nhiều Thẻ rel=canonical

Sử dụng quá nhiều Thẻ rel=canonical sẽ làm cho Google dễ dàng bỏ qua tất cả chúng.

Việc này xảy ra do các thẻ được thêm vào hệ thống từ các nguồn khác nhau, chẳng hạn như bởi hệ thống quản lý nội dung (CMS), giao diện và các tiện ích (plugin). Đây chính là lý do tại sao nhiều plugin có tùy chọn ghi đè để đảm bảo chúng là nguồn duy nhất cho các URL Canonical.

Cũng có trường hợp mà thẻ rel=canonical được thêm vào thông qua JavaScript. Google chỉ chấp nhận trường hợp này khi URL gốc không xuất hiện trong mã HTML, sau đó bạn thêm thẻ rel=canonical bằng JavaScript.

Ngược lại, nếu trong mã HTML đã có thẻ, và bạn sử dụng JavaScript để thay đổi thành trang khác ưa thích, thì có lẽ bạn đang gây rối cho Google bằng hàng loạt tín hiệu kết hợp đa dạng. Hãy cẩn trọng nhé!

 Đặt rel=canonical trong phần thân của trang

Thẻ rel=canonical chỉ nên xuất hiện trong phần <head> của tài liệu. Đặt Thẻ chuẩn trong phần <body> của trang dễ dàng bị bỏ qua.

Mặc dù mã nguồn của trang có thể chứa thẻ rel=canonical ở vị trí chính xác, nhưng khi nó được tạo ra trong trình duyệt hoặc hiển thị bởi Google, có thể xảy ra nhiều vấn đề như: thẻ không được đóng, JavaScript bị nhúng hoặc <iframes> trong phần <head>,… dẫn đến việc phần <head> phải kết thúc sớm trong khung trình duyệt.

Trong trường hợp này, Thẻ bị chuyển vào phần <body> của trang đang hiển thị mà không được chấp nhận.

Thông qua bài viết này Minh Dương Web đã trình bày về khái niệm Canonical URL và tầm quan trọng của nó trong SEO. Nếu bạn vẫn còn bất kỳ thắc mắc nào liên quan đến Canonical URL, hãy liên hệ ngay với chúng tôi để nhận được sự tư vấn và báo giá miễn phí về các dịch vụ SEO hiệu quả và hàng đầu hiện nay.