Thứ Hai, 28 tháng 12, 2015

Khái niệm về Url Canonicalization và sử dụng thẻ Canonical như thế nào cho đúng?

(Thegioiseo) - Google chắc chắn không phải là công cụ tìm kiếm đầu tiên trên Internet. Nhưng Google đã làm việc tốt hơn và cung cấp kết quả thực sự hữu ích. Google đã không ngừng phát triển công ty của họ.

Mặc dù SEO được thực hiện cho tất cả các công cụ tìm kiếm tồn tại hiện nay nhưng công cụ tìm kiếm lớn để xử lý hầu hết lưu lượng truy cập trên Internet là Google. Bất cứ khi nào chúng ta nói về SEO, mọi người sẽ mặc nhiên giả định rằng chúng ta đang nói về tối ưu hóa website cho Google.

Khi nói đến SEO, chúng ta cần phải kiểm tra nhiều yếu tố, cả onsite và offsite. Nhưng nếu chúng ta không làm tốt SEO onsite thì cho dù SEO offsite của bạn tốt đến mấy cũng không đạt được kết quả như bạn mong đợi.

Tôi đã kiểm tra một trong những website tôi đã làm SEO và tôi thấy rằng các trang web đã có một số vấn đề nghiêm trọng liên quan đến Canonicalization. Tôi khắc phục các vấn đề với tất cả thời gian của mình để cố gắng giải thích Canonicalization là gì và làm thế nào để thực hiện Canonicalization đúng trên một website.



URL Canonicalization là gì?

Thuật ngữ Canonicalization rất khó để hiểu đúng. Tôi sẽ cố gắng giải thích nó một cách đơn giản. Ví dụ một website có 2 URL:

  • http://thegioiseo.com
  • http://www.thegioiseo.com
Cả hai trang đó hiển thị nội dung và không có trang nào chuyển hướng đến nhau. Điều này có thể dẫn đến vấn đề trùng lặp nội dung trên Google và bạn có thể phải đối mặt với một hình phạt.

Chúng ta hãy xem một ví dụ nữa. Có 2 URL của một website mà kết quả dẫn đến một trang tương tự.
  • http://thegioiseo.com
  • http://www.thegioiseo.com/index.php
Nếu cả 2 web page hiển thị kết quả tương tự thì điều này là tốt.

Bạn có thể không quan tâm nhiều đến vấn đề này nhưng điều này có thể dẫn đến hình phạt trùng lặp nội dung nghiêm trọng. Vấn đề với bots tìm kiếm là chúng không thể quyết định phiên bản URL được thêm vào chỉ mục của chúng. Nếu 2 trang có cùng nội dung, chúng sẽ được giả định là một bản copy của bản copy khác và trang web của bạn sẽ bị phạt.

Nếu site của bạn được mở trên 2 URL hiển thị cùng nội dung thì bạn phải sửa chữa nó. Bạn phải sử dụng thiết lập máy chủ cho dù người dùng mở bằng www hoặc không phải www, trang web sẽ mở bất kỳ phiên bản nào. Bằng cách này bạn có thể khắc phục canonicalization.

Mặc dù có những lúc bạn muốn chia sẻ cùng một nội dung trên 2 URL thì bạn có thể sử dụng thẻ rel = "canonical" để công cụ tìm kiếm biết rằng đó là một bản gốc và đó là một bản sao của nó. Điều này có thể giúp bạn tránh hình phạt nội dung trùng lặp.

Làm thế nào để áp dụng URL Canonicalization chính xác?

Bây giờ chúng ta kiểm tra làm thế nào để áp dụng URL Canonicalization. Chúng ta không cần phải nhập vào dòng code để làm điều đó. Một thẻ rel=”canonical” đơn giản là đủ để áp dụng Canonicalization.

slide ​

Ví dụ, có 2 URL trên website dẫn đến nội dung tương tự khi chúng được giải quyết. 2 URL là:
HTML Canonicalization

Kết quả URL thứ 2 có nội dung tương tự như URL đầu tiên. Cả 2 đều hiển thị cùng một trang và do đó bạn có thể áp dụng thẻ rel=”canonical”, trong trường hợp này để chỉ ra rằng URL với index.php là một URL Canonical đầu tiên.

Đây là cách nó được áp dụng.
Code:
<link rel=”canonical” href=”http://thegioiseo.com/index.php”>
HTTP Header Canonicalization

Đánh dấu trên có thể được sử dụng trong trường hợp của nội dung HTML nhưng nếu chúng ta đang đối phó với nội dung non-HTML như một tài liệu PDF thì sao? Trong những trường hợp đó, chúng ta có thể sử dụng HTTP Header Canonicalization.
Code:
> HTTP/1.1 200 OK
> Content-Type: application/pdf
> Link: <http://www.example.com/white-paper.html>; rel=”canonical”
> Content-Length: 785710
Bạn có thể nhận được thêm thông tin về HTTP Header dựa vào Canonicalization trên blog chính thức của Google Webmaster.

Khi nào bạn nên sử dụng Canonicalization?

Khi bạn đã biết chính xác Canonicalization là gì, bạn có thể xem khi nào bạn nên sử dụng nó. Dưới đây là một vài điều kiện có thể được ngăn chặn bằng URL Canonicalization thích hợp.

- URL khác nhau cho một nội dung tương tự
- Nhiều categories khác nhau và các thẻ có kết quả trong cùng nội dung
- Trang web di động hiển thị nội dung tương tự nhưng URL/subdomain khác nhau
- URL có URL HTTP và HTTPS và cả 2 kết quả trong cùng một nội dung
- Các cổng khác nhau
- Khi website có phiên bản www và non-www
- Trong trường hợp chia sẻ nội dung syndicated

Đây là một số điều kiện chủ yếu mà chúng ta có thể áp dụng URL Canonicalization để tránh đối mặt với hình phạt nội dung trùng lặp.

Đây là lúc bạn không nên thực hiện URL Canonicalization

Kịch bản mà chúng ta không nên thực hiện URL Canonicalization và phần này là mục tiêu hướng tới việc xác định các điều kiện cụ thể. Bạn cũng có thể coi chúng là lỗi khi nói đến URL Canonicalization. Tôi sẽ liệt kê từng cái một, tôi sẽ cố gắng giải thích chúng sao cho đơn giản nhất có thể.

Bỏ qua phân trang canonicalization

Bạn không nên thêm một thẻ canonicalization trên trang thứ 2 của một URL khi URL đó không được index bởi Google.

Nhiều thẻ Canonical là tồi tệ

Nếu một web page có nhiều thẻ rel="canonical" thì nó sẽ hại bạn. Tạo một thẻ cụ thể và làm cho nó rõ ràng theo những gì bạn thích.

Đừng thêm thẻ Canonical vào URL được rút ngắn

Tôi đã thấy nhiều người áp dụng tag Canonical như thế này:
Code:
<link rel=”canonical” href=”index.php”>
Loại canonicalization này có chứa nhiều lỗi. Bạn cần phải hiểi rằng bạn cần phải làm cho canonical hoàn chỉnh hơn:
Code:
<link rel=”canonical” href=”http://thegioiseo.com/index.php”>
Đánh dấu trên là một cách tốt hơn để áp dụng canonicalization.

Không sử dụng canonicalization với #SEO #Google địa phương 

Điều này có nghĩa là nhắm mục tiêu và thao túng nội dung của website để phục vụ nó trên khu vực mà bạn nhắm mục tiêu. Nếu bạn thực sự muốn tạo ra một trang web tốt hơn cho khán giả trên toàn cầu, bạn có thể đọc hướng dẫn này để tạo ra trang web đa ngôn ngữ bởi Google.

Canonicalization trên phiên bản mobile của website

Chỉ cần một thẻ canonical để phân biệt một trang web di động trên subdomain của website chính là không đủ. Google khuyến cáo bạn sử dụng rel=”alternate” và rel=”canonical” để hiển thị phiên bản di động của website.

Đây là cách bạn có thể thực hiện nó:
Code:
> <html>
> <head>
> <link rel=”canonical” href=”http://example.com/” >
> <link rel=”alternate” href=”http://m.example.com/” media=”only screen and (max-width: 640px)”>
> </head>
> <body>
Không sử dụng một thẻ Canonical bên ngoài <head>

Bots tìm kiếm sẽ hoàn toàn bỏ qua thẻ đặt bên ngoài <head>, bạn cần phải thêm nó vào giữa <head></head>.

Không sử dụng nhiều thẻ Canonical trên một website

Việc sử dụng nhiều thẻ Canonical là vô nghĩa. Công cụ tìm kiếm sẽ bỏ qua cả các thẻ và bạn sẽ phải đối mặt với hành vi SEO kì quái và các vấn đề khác. Nhiều thẻ URL canonical đôi khi khiến bạn gặp một vài sự cố, vì vậy hãy theo dõi nó.

Không trỏ Canonical URL vào một website với mã trạng thái non-200

Một trang web với một mã như 301 và 302 sẽ buộc công cụ tìm kiếm thu thập thêm URL và điều này có nghĩa là họ cần phải thu thập 2 URL cùng một lúc. Điều này có thể tăng thêm một số lượng lớn URL được thu thập và nó có thể dễ dàng làm cạn kiệt ngân sách thu thập dữ liệu của bạn.

Một URL với mã trạng thái 404 khiến cho việc thu thập hoàn toàn bị lãng phí và công cụ tìm kiếm sẽ bỏ qua thẻ của bạn.

Không sử dụng Canonicalization cho PageRank Sculpting

PageRank không còn là một thực thể của một website nhưng nó vẫn được xem xét bởi công cụ tìm kiếm. Nếu bạn đang có kế hoạch sử dụng thẻ Canonical cho PageRank sculpting để có thứ hạng tốt hơn thì đó là một suy nghĩ hoàn toàn sai lầm.

Tóm lại

Khái niệm SEO onsite lớn hơn nhiều so với những gì bạn tưởng tượng. Bạn cần phải làm nhiều việc cùng một lúc và bạn cũng cần phải luôn cập nhật với những thay đổi diễn ra hàng ngày.

Bài viết này đã cho bạn thấy làm thế nào để áp dụng URL Canonical trên một website. Hãy nhớ ràng Canonicalization là một quá trình tinh tế và nếu bạn thực hiện sai lầm nó có thể gây tổn hại cho trang web của bạn. Hãy kiểm tra trang web của bạn và chắc chắn rằng bạn đã thực hiện Canonical đúng cách.

Không có nhận xét nào:

Đăng nhận xét