Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
SEOThiết kế website

Cách khắc phục lỗi Sitemap is HTML – Sơ đồ trang web là HTML

Thông báo lỗi trong Google Search Console có xu hướng khó hiểu và khó giải quyết, nhưng lỗi “Sitemap của bạn dường như là một trang HTMLYour Sitemap appears to be an HTML page”, rất may, không phải là một trong số đó. Nếu bạn gặp lỗi Sơ đồ trang web là HTMLSitemap is HTML và đang thắc mắc là lỗi này có vấn đề gì không và bạn cần làm gì để khắc phục sự cố này. Và điều gì sẽ xảy ra nếu Sitemap của bạn đã ở định dạng phù hợp mà bạn vẫn gặp lỗi này? Trong bài viết này, chúng tôi sẽ giúp bạn hiểu rõ hơn về sitemap là gì, cách thức hoạt động của Sitemap, cách tạo sitemap và cách để xử lý lỗi Sitemap is HTML.

Sitemap là gì?

Google không tự động biết khi nào bạn thêm một trang mới vào trang web của mình, chẳng hạn như khi bạn xuất bản một bài đăng trên blog hoặc phát hành một sản phẩm mới trong cửa hàng của mình. Với hàng triệu trang trên web, việc thu thập thông tin về mỗi trang là điều không thể với con người. Bạn có biết cách các công cụ tìm kiếm tìm thấy trang web của bạn không?

Câu trả lời là với một bot nhỏ được gọi là trình thu thập thông tin web – một công cụ tự động được gửi bởi các công cụ tìm kiếm để lập chỉ mục các trang trên website của bạn. Trình thu thập thông tin web đi qua internet, lưu thông tin vào bộ nhớ đệm trên mọi trang và phần phương tiện. Google sẽ định kỳ gửi trình thu thập thông tin web đến thăm trang web của bạn và xem liệu có gì thay đổi không, nhưng quá trình này không diễn ra ngay lập tức.

Khi bạn có một trang web lớn, trình thu thập thông tin sẽ dễ dàng bỏ lỡ các trang chính ngay cả sau nhiều lần truy cập. Lúc này, Sitemap sẽ hỗ trợ giúp các con bot thu thập thông tin web chính xác và đầy đủ hơn. Vậy sitemap là gì? Sitemap hay còn gọi là sơ đồ trang web, là một tập tin chứa đựng thông tin bao gồm tất cả URL của trang web. Sitemap giúp các công cụ tìm kiếm thu thập thông tin và lập chỉ mục tất cả nội dung của web. Bên cạnh đó, sitemap còn giúp cho các công cụ tìm kiếm biết được những trang nào trên webiste của bạn là trang quan trọng nhất. Từ đó đưa ra kết quả tìm kiếm tối ưu nhất cho trang web của bạn trên SERPs.

Cách chúng hoạt động chỉ đơn giản là liệt kê tất cả các trang, tệp (hình ảnh, video…) trên trang web của bạn cùng với hệ thống phân cấp liên kết của chúng. Nó đảm bảo rằng Google nhìn thấy mọi thứ trên trang web của bạn và cải thiện SEO cho phù hợp.

Nếu bạn đã sử dụng một công cụ như Google Analytics hoặc Google Search Console, thì bạn có thể đã thấy một tùy chọn để liên kết đến Sitemap của mình. Google sẽ tham chiếu điều này đầu tiên khi họ gửi trình thu thập thông tin web đến trang web của bạn.

Sự khác biệt giữa Sitemap HTML và XML

Sitemap của bạn là một trang HTML, nhưng vấn đề chính xác với điều đó là gì? Tại sao Google muốn bạn thay đổi nó? Sitemap phải được viết ở một định dạng cụ thể để trình thu thập thông tin web hiểu chúng. Nó có thể đọc RSS, Atom, KML hoặc tệp văn bản, nhưng XML là lựa chọn phổ biến nhất.

XML là viết tắt của “Ngôn ngữ đánh dấu có thể mở rộng”. Đó là một ngôn ngữ web rất giống với HTML. Sự khác biệt là công dụng của nó: mặc dù con người có thể đọc được, nhưng chức năng chính của nó là giúp máy móc mã hóa tài liệu và đọc dữ liệu.

Trong trường hợp này, nó giúp trình thu thập thông tin web hiểu vị trí của các trang và phương tiện khác trên trang web của bạn và cách chúng tương tác với nhau.

Nhưng bạn có thể đã thấy thuật ngữ “Sitemap” được sử dụng trước đây trong một ngữ cảnh rất khác. Sitemap HTML có tồn tại, nhưng sự khác biệt lớn là chúng được tạo ra cho con người, không phải cho trình thu thập thông tin web.

Nếu bạn đã từng nhấp vào liên kết đến điều hướng của trang web và tìm thấy danh sách các trang có thể đọc được và được thiết kế đẹp mắt trên trang web, thì về mặt kỹ thuật, đây được gọi là Sitemap. Nhưng trong khi nó có thể hữu ích cho khách truy cập của bạn, nó không phải là những gì Google đang tìm kiếm.

Sơ đồ trang XML sẽ trông giống như một mớ mã không thể đọc được hoặc một bức tường liên kết khổng lồ cho hầu hết người dùng, vì vậy nếu bạn muốn thêm một trang điều hướng hữu ích vào trang web của mình, hãy tạo một sơ đồ trang HTML cùng với nó… nhưng bạn phải tạo một Sitemap XML cũng vậy.

Các loại Sitemap khác

Khi bạn nghĩ về Sitemap, điều bạn nghĩ đến có thể là một danh sách đơn giản gồm các trang trên trang web của bạn. Nhưng Google sử dụng một số loại Sitemap khác nhau để lập danh mục thông tin khác nhau. Bao gồm các:

  • Video: Các video trên trang web của bạn có thể được lập chỉ mục đặc biệt để xuất hiện trong kết quả Google Video.
  • Hình ảnh: Tương tự với hình ảnh. Một số hình ảnh, chẳng hạn như những hình ảnh được nhúng trong mã Javascript, có thể không được lập chỉ mục theo thông lệ. Sơ đồ trang bằng hình ảnh có thể giúp đảm bảo trang web của bạn xuất hiện trong Google Hình ảnh.
  • Tin tức: Viết chuyên mục? Google có một phần Google Tin tức chuyên dụng đặc biệt trong tìm kiếm của mình và Sitemap dành cho Tin tức có thể đảm bảo rằng bạn đang xuất hiện chính xác ở đó và nhận được nhiều lưu lượng truy cập hơn.
  • Mã: Google lập chỉ mục các đoạn mã để giúp lập trình viên tìm kiếm mã và tệp .
  • Dữ liệu địa lý: Bạn có thể sử dụng Sitemap KML đặc biệt để cung cấp cho Google dữ liệu tốt hơn về vị trí doanh nghiệp của bạn.

Thông thường, một số thông tin này có trong Sitemap chính của bạn. Những người khác phải có Sitemap chuyên dụng đặc biệt của họ. Và cuối cùng, tất cả chúng cần được định dạng thích hợp ở định dạng XML hoặc một định dạng được hỗ trợ khác, không phải HTML.

Cách tạo Sitemap XML

Nếu bạn đã cố tình gửi một liên kết đến một sơ đồ trang HTML, bạn sẽ cần phải thay thế nó bằng một tệp XML. Nếu bạn không biết cách tạo, bạn có thể tìm thấy một số cách khác nhau để tạo nó bằng các plugin và trình tạo WordPress mà bạn có thể tìm thấy trên mạng.

Ngay cả khi bạn có một sơ đồ trang XML không hoạt động, việc tạo lại hoặc gửi một sơ đồ trang khác có thể khắc phục sự cố. Có hai cách dễ dàng để có được Sitemap: sử dụng một plugin hoặc tạo một plugin với Sitemap.

Tạo Sitemap bằng Plugin

Với WordPress, cách dễ nhất để có được Sitemap cập nhật động trên trang web của bạn là tải xuống một plugin. Bằng cách này, bạn không phải tải bất kỳ tệp nào lên máy chủ của mình theo cách thủ công. Có khá nhiều plugin sẽ tạo Sitemap:

  • Yoast SEO: Plugin SEO phổ biến nhất trên kho lưu trữ cũng đi kèm với việc tạo Sitemap. Bạn có thể tìm thấy các cài đặt trong SEO> Chung> Tính năng và Sitemap XML .
  • RankMath: Bên cạnh một sơ đồ trang thông thường, plugin SEO này cũng có thể tạo một sơ đồ trang WooCommerce và một Sitemap dữ liệu địa lý KML. Đi tới RankMath> Cài đặt Sitemap .
  • Sitemap XML: Như tên của nó, Sitemap XML sẽ tạo ra một Sitemap. Plugin là 100% miễn phí và mã nguồn mở, vì vậy không có phí ẩn.
  • Sitemap XML & Google Tin tức: Plugin này tạo Sitemap XML và Sitemap Google Tin tức. Nó cũng dễ dàng để cài đặt và thiết lập.
  • Trình tạo Sitemap Đồng hành – HTML & XML: Nếu bạn muốn tạo một Sitemap HTML cùng với một Sitemap XML, đây là plugin dành cho bạn. Cả hai đều được cập nhật tự động, vì vậy bạn không cần phải thực hiện bất kỳ thao tác thủ công nào.

Trang web của Trình tạo Sitemap

Thay vì một plugin, bạn có thể sử dụng một trình tạo Sitemap như XML-Sitemaps hoặc XML Sitemap Generator. Sau đó, bạn có thể tải nó lên trang web của mình.

  • Bước 1: Tạo sơ đồ trang bằng một trong các trang ở trên hoặc bất kỳ trình tạo nào bạn chọn. Tải xuống tài liệu XML.

  • Bước 2: Tải xuống FileZilla hoặc (nếu được hỗ trợ) sử dụng máy chủ web của bạn để kết nối với trang web của bạn qua FTP.
  • Bước 3: Đặt tệp XML vào thư mục gốc của trang web của bạn. Thư mục gốc là thư mục trên cùng của trang web của bạn – cùng thư mục mà bạn bắt đầu khi kết nối lần đầu.

Không giống như các Sitemap dựa trên plugin, các Sitemap được tạo với một trang web không động. Sitemap tĩnh sẽ không cập nhật khi bạn xuất bản các bài đăng và trang mới trên trang web của mình. Bạn sẽ cần tạo một tệp mới mỗi lần. Vì vậy, đối với các blog và các trang web khác cập nhật thường xuyên, nó không phải là lý tưởng.

Cách sửa lỗi Sơ đồ trang web là HTML

Lỗi Sitemap thường do bạn vô tình gửi một trang HTML thay vì một tệp XML được định dạng đúng. Nhưng nếu sơ đồ trang XML của bạn vẫn tuyên bố là một trang HTML, bạn có thể gặp sự cố sâu hơn.

Đừng lo lắng: vấn đề thường nằm ở xung đột dễ khắc phục trong các plugin WordPress của bạn. Dưới đây là một số gợi ý để Sitemap của bạn hoạt động bình thường trở lại.

Kiểm tra lỗi và chuyển hướng

Việc chẩn đoán sự cố sẽ dễ dàng hơn nhiều nếu bạn có mã lỗi rõ ràng để tìm kiếm. Điều đầu tiên bạn nên làm là truy cập trang Sitemap của mình và xem có mã lỗi lạ nào không. Nếu bạn nhận thấy lỗi khi truy cập Sitemap của mình, điều này sẽ khiến Google nghĩ rằng nó nhìn thấy một trang HTML. Sử dụng lỗi này để giúp bạn tìm kiếm để khắc phục sự cố.

Các lỗi máy chủ nhỏ và thời gian chờ sẽ đọc cho Google giống như Sitemap của bạn đột nhiên là một trang HTML vì nó hiển thị thông báo lỗi chứ không phải tệp XML. Miễn là lỗi hiếm gặp và không liên tục hoặc thường xuyên, nó thường không phải là nguyên nhân đáng lo ngại.

Một điều khác cần chú ý là chuyển hướng. Nếu bạn truy cập trang Sitemap của mình và đột nhiên kết thúc trên trang chủ hoặc trong một vòng lặp chuyển hướng vô hạn, điều này cũng sẽ khiến mọi thứ bị hỏng.

Nếu bạn tìm thấy bất kỳ lỗi hoặc chuyển hướng nào không biến mất, vấn đề thường nằm ở xung đột plugin. Các plugin tạo Sitemap như Yoast có thể gây ra xung đột hoặc plugin bộ nhớ đệm có thể là nguồn gốc của sự cố.

Nhưng đôi khi, ngay cả những plugin dường như ngẫu nhiên cũng có thể gây ra xung đột. Sử dụng plugin Health Check & Troubleshooting để xác định chúng. Cài đặt nó nếu chưa có, sau đó đi tới Tools > Site Health > Troubleshooting Mode.

Nó sẽ tạm thời tắt tất cả các plugin mà không ảnh hưởng đến khách truy cập của bạn. Xem lỗi hoặc chuyển hướng hiện đã biến mất chưa. Nếu đúng như vậy, hãy bật lại lần lượt các plugin cho đến khi trang web hoạt động trở lại.

Tắt bộ nhớ đệm

Một trong những nguyên nhân lớn nhất gây ra xung đột là với các plugin bộ nhớ đệm. Khi một Sitemap được lưu vào bộ nhớ cache, đôi khi nó có thể gây ra sự cố khi Google đọc nó dưới dạng trang HTML, vì bạn không nên lưu vào bộ nhớ cache các tệp XML theo cách này.

Hầu hết các plugin bộ nhớ đệm sẽ tránh lưu vào bộ đệm một trang Sitemap vì điều này, nhưng dù sao thì chúng cũng có thể làm như vậy sai, đặc biệt nếu bạn đang sử dụng một URL duy nhất cho Sitemap của mình. Rất may, bạn không cần phải tắt toàn bộ plugin bộ nhớ đệm. Bạn có thể thêm một ngoại lệ và vấn đề sẽ tự động giải quyết.

Đối với WP Super Cache, hãy đi tới Cài đặt > WP Super Cache. Trong tab Nâng cao, cuộn đến Thêm vào đây các chuỗi (không phải tên tệp) buộc trang không được lưu vào bộ nhớ đệm. Trong phần này, hãy nhập một phần URL của Sitemap của bạn. Ví dụ: nếu Sitemap của bạn được đặt tại “example-site.com/sitemap.xml”, hãy nhập “/sitemap.xml.”

Đối với W3 Total Cache, hãy điều hướng đến Performance > Page Cache, sau đó tìm Advanced > Never cache the following pages. Cũng giống như với WP Super Cache, hãy nhập URL Sitemap. Bạn cũng có thể muốn thêm nó vào Minify trong Performance > MinifyNever minify the following pages, vì điều này có thể dẫn đến sự cố.

Kiểm tra URL Sitemap của bạn

Mặc dù đây là một gợi ý nhỏ, nhưng nó luôn đáng để kiểm tra kỹ: bạn đã gửi đúng liên kết chưa? Đó là một sai lầm cơ bản để thực hiện, và thậm chí một ký tự không chính xác sẽ chỉ đến chỗ sai.

Kiểm tra liên kết bạn đã gửi, cả qua Google và trong bất kỳ plugin SEO hoặc Sitemap nào.

Một số plugin có thể thêm dấu gạch chéo vào cuối trang Sitemap của bạn (“example-site.com/sitemap/” thay vì “example-site.com/sitemap”). Một ký tự này có thể dẫn đến các vấn đề lớn, đặc biệt nếu nó gây ra một vòng lặp chuyển hướng.

Một lần nữa, hãy bật chế độ khắc phục sự cố trong plugin Kiểm tra sức khỏe và cố gắng tìm plugin nào đang gây ra sự cố này. Phần lớn thời gian, bạn có thể theo dõi nó trở lại một plugin riêng lẻ.

Xóa các Sitemap bổ sung

Mặc dù nó thường không gây ra sự cố miễn là bạn liên kết đến trang thích hợp, nhưng việc có thêm các Sitemap đang hoạt động đôi khi có thể gây ra sự cố hoặc nhầm lẫn cho chính bạn. Thêm vào đó, máy chủ của bạn đang sử dụng tài nguyên bổ sung để cập nhật một số Sitemap không cần thiết.

Các plugin có thể thêm các Sitemap khác nhau và bạn có thể không biết rằng WordPress thậm chí còn tạo ra các Sitemap riêng cho bạn. Bạn nên kiểm tra những thứ này và xóa tất cả trừ cái bạn muốn sử dụng. Dưới đây là một số URL bạn có thể thử trên trang web của mình:

  • /sitemap.xml – Một lựa chọn phổ biến cho các Sitemap được tạo trong hầu hết các plugin Sitemap.
  • /wp-sitemap.xml – Đây là Sitemap mặc định được tạo bởi WordPress kể từ phiên bản 5.5.
  • /sitemap_index.xml – URL của Sitemap do Yoast tạo.

Và nếu bạn đã tải xuống các plugin SEO hoặc Sitemap khác, chúng có thể đang sử dụng một URL hoàn toàn khác. Kiểm tra tài liệu và đảm bảo rằng bạn tắt bất kỳ chức năng Sitemap nào mà bạn không muốn.

Bạn có thực sự cần Sitemap không?

Đôi khi Sitemap có thể là nguồn gốc của một loạt các vấn đề liên tục. Và một sửa chữa đơn giản có thể không đủ để làm cho chúng biến mất. Nếu bạn liên tục gặp phải những vấn đề khó giải quyết, bạn có thể bắt đầu đặt câu hỏi liệu Sitemap có quan trọng đối với bạn hay không.

Thông thường, người ta khuyến khích tạo Sitemap, vì Google tự nói rằng nó sẽ không bao giờ phạt SEO của bạn vì làm như vậy. Nó chỉ có thể giúp cải thiện SEO của bạn và đưa trang web của bạn được lập chỉ mục nhanh hơn. Nhưng không bắt buộc bạn phải có trong một số trường hợp nhất định và bản thân Google cũng gợi ý rằng một số trang web không sử dụng chúng.

Giả sử trang web của bạn có ít hơn 500 trang và không bao giờ có khả năng có nhiều hơn thế. Trong trường hợp đó, miễn là nó được liên kết nội bộ tốt (điều mà bạn nên làm) và không có nhiều tệp phương tiện mà bạn muốn hiển thị trong Google Hình ảnh và Google Video, bạn có thể không cần phải có Sitemap.

Mặt khác, nó thực sự có thể giúp SEO của bạn có Sitemap và không có hại gì khi có Sitemap, vì vậy việc vượt qua và khắc phục vấn đề không thể làm gì khác ngoài việc tốt. Trang web của bạn bây giờ có thể nhỏ, nhưng có lẽ không phải lúc nào cũng vậy. Nếu gặp khó khăn, bạn luôn có thể nhờ đến sự hỗ trợ của máy chủ để tìm ra nguyên nhân có thể gây ra sự cố.

Kết luận

Lỗi “Sitemap is HTML – Sitemap dường như là một trang HTML” có thể gây khó chịu khi ghim xuống, nhưng nó thường chỉ là kết quả của một trang được định dạng không đúng hoặc xung đột bộ nhớ đệm dễ sửa. Khi bạn đã tìm ra vấn đề, bạn có thể dễ dàng giải quyết chỉ trong vài bước đơn giản.

Mèo

Không phải nắng mà cứ thích chói chang :)

Bài viết liên quan

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button