Sitemap được ví như cây cầu nối tiếp giúp Googlebot tiếp cận tới tất cả các nội dung trên website nhanh chóng hơn. Cũng như là một không thể thiếu trong việc SEO Technical cho bất kỳ website nào. Vậy Sitemap là gì? Làm thế nào để tạo và khai báo nó với Google, hãy cùng VietMoz tìm hiểu ngay bài viết dưới đây:
Sitemap là gì?
Sitemap là sơ đồ trang web XML, là một tập tin văn bản chứa tất cả các URL của website , giúp Google khám phá các trang quan trọng cũng như tần suất mà chúng được cập nhật trên trang.
Google cũng từng đề cập về vấn đề này trên trang trung tâm trợ giúp rằng:
Sơ đồ trang web cho trình thu thập thông tin biết tệp nào bạn cho là quan trọng trong trang web của mình và cũng cung cấp thông tin có giá trị về các tệp này: ví dụ: đối với các trang, thời điểm trang được cập nhật lần cuối, tần suất thay đổi trang và bất kỳ phiên bản ngôn ngữ thay thế nào của một trang.
Google bắt đầu sử dụng Sitemap vào năm 2005 và ngay sau đó đã được các công cụ tìm kiếm khác tham gia theo như MSN hay Yahoo. Ngày nay, Sitemap được sử dụng cho nhiều mục đích hơn là chỉ việc khám phá ra tất cả các URL trên một trang web nhất định.
Định dạng và ý nghĩa
Tất cả các sitemap XML đều bắt đầu với 2 dòng dưới đây, chỉ rõ định dạng của sitemap này là XML cho máy tìm kiếm khỏi nhầm lẫn:
<?xml version=”1.0″ encoding=”UTF-8″?>
< urlset xmlns=”https://www.sitemaps.org/schemas/sitemap/0.9″>
Tất cả các dòng trong sitemap XML đều có định dạng như dưới đây:
< url>
< loc>https://www.domain.com/</loc>
< lastmod>2012-01-01</lastmod>
< changefreq>monthly</changefreq>
< priority>1.0</priority>
</url>
Ý nghĩa
<loc> (bắt buộc): Khai báo địa chỉ URL đầy đủ của trang, bao gồm loại giao thức (http hay https) và gạch chéo. Địa chỉ này không được dài quá 2048 ký tự.
<lastmod> (không bắt buộc): Khai báo thời điểm cập nhật gần nhất của trang web. Định dạng ngày tháng là Năm-Tháng-Ngày.
<changefreq> (không bắt buộc): Khai báo tần suất cập nhật nội dung của trang:
- Luôn luôn
- Hàng giờ
- Hàng ngày
- Hàng tuần
- Hàng tháng
- Hàng năm
- Không bao giờ thay đổi
Đây là hướng dẫn dành cho bọ tìm kiếm, và hoàn toàn không ảnh hưởng đến tần suất index của bọ tìm kiếm.
<priority> (không bắt buộc): Khai báo độ ưu tiên của trang web so với các trang web khác trên website. Quản trị web sử dụng thông số này để báo trước cho bọ tìm kiếm biết trong số tất cả các trang web hiện có trên website, trang web nào quan trọng hơn, trang web nào ít quan trọng hơn.
Giá trị thay đổi từ 0.0 đến 1.0 và 1.0 là quan trọng nhất. Giá trị mặc định (nếu bạn không thiết lập) là 0.5.
Vì đây là chỉ số xác định mức độ quan trọng của trang web này so với trang web khác và chỉ có ý nghĩa trên website của bạn nên nếu bạn đặt mức độ ưu tiên trên tất cả các trang là 1.0 cũng sẽ không làm ảnh hưởng gì đến thứ hạng trang web.
Sitemap kết thúc với dòng code sau:
</urlset>
Tại sao Sơ đồ trang web lại quan trọng?
Mỗi trang web thì nên có một sơ đồ trang web bởi chúng cực kỳ quan trọng đối với các trang web lớn hoặc mới, các trang web có nhiều trang mồ côi, các trang web sử dụng nhiều video và hình ảnh.
Nếu như robots.txt giúp bạn loại trừ các phần trang web mà bạn không muốn nó được xếp hạng trong kết quả tìm kiếm của Google. Thì Sitemap lại làm điều hoàn toàn ngược lại, cụ thể nó giúp cho các công cụ tìm kiếm phát hiện và khám phá các trang mới nhanh hơn ngay cả khi nó không được trỏ đến trang chính của web.
Ngoài ra, nếu xét về phương diện sử dụng, Sitemap hỗ trợ trải nghiệm người dùng, gia tăng tỷ lệ nhấp chuột nhờ sự phân cấp từng mục trong web rõ ràng.
Vậy làm sao để biết được website của bạn đã có sitemap hay chưa? Cách nhanh nhất đó là xem nó ngay trong công cụ Google Search Console hoặc trong Bing Webmaster Tools thuộc mục “Sitemap”.
Nếu bạn kiểm tra sơ đồ trang web bằng Google Search Console thì chọn vào mục Báo cáo sơ đồ trang web => Xem đường dẫn sơ đồ trang web mới => Bạn sẽ thấy các sơ đồ trang web hiện có mà Google tìm thấy.
Nếu bạn kiểm tra sơ đồ trang web bằng Bing Webmaster Tools bạn cũng chọn các mục tương tự như Google Search Console.
So sánh sơ đồ trang web HTML và XML
Về cơ bản có 2 loại sơ đồ trang web đó là HTML và XML.
Sự khác biệt trong định dạng:
- HTML hiển thị thông tin từ nội dung văn bản, hình ảnh, video… cho người dùng trang web
- XML là nguồn cấp thông tin dữ liệu cho các công cụ tìm kiếm.
Hiểu chi tiết về HTML và XML
Sơ đồ trang HTML cũng giúp các công cụ tìm kiếm khám phá các URL mới thông qua việc phát hiện các liên kết nội bộ mà chúng theo trên trang.
Sơ đồ trang web XML là nguồn cấp dữ liệu tùy chỉnh giúp công cụ tìm kiếm hiểu mức độ ưu tiên URL nào nên được thu thập thông tin trước, bao gồm tần suất chúng được cập nhật, hay mới thêm vào trên trang web. Điều này hữu ích cho lịch trình của công cụ tìm kiếm ước tính tần suất thu thập lại thông tin của một URL.
Trong sitemap XML lại được chia ra nhiều định dạng khác bao gồm:
- Sitemap Index
- Sitemap-category.xml
- Sitemap-products.xml
- Sitemap-articles.xml
- Sitemap-tags.xml
- Sitemap-video.xml
- Sitemap-image.xml
Yêu cầu tối thiểu về sơ đồ trang web XML
Trước khi đi vào phần làm thế nào để tạo sitemap, bạn cần hiểu cách để đáp ứng các tiêu chuẩn sau đây nhằm giúp cho sơ đồ trang XML hoạt động tối ưu nhất. Cụ thể:
- Chỉ chứa các URL với mã trạng thái là 200.
- Tối đa 200 nghìn URL cho mỗi sơ đồ trang web và 50 nghìn sơ đồ trang web cho mỗi sơ đồ trang chỉ mục.
- Được tham chiếu trong tệp robots.txt.
- Được mã hóa UTF-8.
- Được nén ở định dạng .gz.
- Không lớn hơn 50MB hoặc chứa 50 nghìn URL.
Tất nhiên ngoài những yêu cầu trên bạn còn có thể báo hiệu cho Google biết URL nào là quan trọng bằng cách chỉ bao gồm các trang quan trọng ngay trong sitemap. Lưu ý bạn sẽ cần cập nhật các trang đó một cách thường xuyên để Googlebot thu thập dữ liệu. Điều này quan trọng cho việc đánh giá và xếp thứ hạng cho các trang nằm trên website của bạn.
Hướng dẫn tạo sitemap cho website và khai báo Google Search Console
Tạo sitemap bằng công cụ hỗ trợ online
Trước khi tạo bạn cần đảm bảo rằng website đó đang hoạt động, có thể set thông số Priority cho các URL theo ý bạn bằng Notepad.
Bước 1: Bạn vào trang https://www.xml-sitemaps.com/
Lưu ý: Với trang này chỉ miễn phí cho 500 trang còn nếu nhiều hơn bạn sẽ phải trả phí dịch vụ để tạo tài khoản.
Điền tên website của bạn vào thành công cụ.
Bước 2: Đợi cập nhật kết quả sau ít phút và tải sitemap về máy.
Sau khi tải file XML về, bạn sử dụng Notepad và mở file vừa tải lên để thiết lập lại thông số Priority cho các URL theo ý bạn.
Lưu ý: Bạn sẽ cho các URL quan trọng điểm cao hơn, trong đó cao nhất là 1.0 và thấp nhất là 0.10.
Tạo sitemap bằng Rank Math, Yoast SEO
Hiện này hầu hết các quản trị web đều sử dụng nền tảng Wordpress, bạn có thể cài plugin Rank Math hoặc Yoast Seo. Với 2 plugin này sẽ tự động tạo sitemap cho bạn luôn, để kiểm tra sơ đồ trang web của mình bạn truy cập bằng định dạng: tên domain.sitemap_index.xml
Ví dụ với website VietMoz chúng tôi sẽ trả về kết quả như sau:
Lúc này bạn chỉ việc gửi sơ đồ trang web của bạn cho Google Search Console.
Gửi Sitemap lên Google Search Console
Sau khi đã có được file sitemap hoàn chỉnh bạn hãy gửi nó lên Google Search Console.
Bạn truy cập vào Google Search ConSole => Chọn vào mục Sơ đồ trang web => điền sơ đồ trang web như cách mà bạn kiểm tra nó trên google: tên domain.sitemap_index.xml
Nhập URL sơ đồ trang web của bạn như hình dưới đây:
Và bấm “Submit”.
Khi mọi thứ đã thiết lập xong, bạn sẽ nhận thông báo từ màn hình hiển thị là sơ đồ trang web đã gửi:
Như vậy là bạn đã tạo Sitemap thành công cho website của mình!
Lưu ý: Hầu hết các hệ thống quản lý nội dung đều tích hợp tính năng tạo sơ đồ trang XML tự động. Tuy nhiên một số thì không, vì vậy bạn sẽ cần đến một công cụ của bên thứ 3. Như tôi đã đề cập ở trên bạn có thể sử dụng Sitemaps.com.
Một số lưu ý khi làm sơ đồ trang web
Nên chia nhỏ Sitemap trên trang web lớn
Nếu như bạn chưa biết thì sơ đồ trang web có giới hạn 50K URL, đồng nghĩa với việc khi bạn sở hữu một trang web có rất nhiều trang. Google khuyên bạn nên chia sơ đồ trang web thành nhiều sơ đồ trang web nhỏ hơn.
Lý do là việc chia nhỏ Sitemap giúp bạn tăng tốc không riêng gì website mà còn cho chính Google index nhanh hơn.
Vậy như nào là Sitemap đã được chia nhỏ? Điều này phụ thuộc vào bạn, tuy nhiên lời khuyên là hãy chia khoảng 500 link cho mỗi Sitemap trong trường hợp bạn sử dụng plugin tạo Sitemap hoặc chúng có cấu hình chia nhỏ Sitemap.
Ngoài ra, bạn cũng có thể linh hoạt chia nhỏ Sitemap theo từng loại nội dung ví dụ như: sitemap bài viết, sitemap video, sitemap category, sitemap ảnh…
Không dành quá nhiều công sức cho sitemap video
Lý do là Video Schema đã thay thế phần lớn nhu cầu về các sơ đồ trang web dành cho video. Hiểu đơn giản là việc có sơ đồ trang web dành cho video có hay không có thì đều không ản hưởng đến khả năng trang của bạn có được Rich Snippets chi tiết về video.
Duy trì dung lượng file Sitemap dưới 50MB
Trên thực tế, Google và Bing đều cho phép các sơ đồ trang web có dung lượng lên đến 50MB. Như vậy, trang web bạn hoạt động tốt nhất khi luôn ở mức dưới 50 MB.
Sơ đồ trang web HTML
Về cơ bản, sơ đồ trang web HTML tương đương với một sơ đồ trang web XML nhưng dành cho người dùng.
Bạn không nhất thiết phải cung cấp những thứ được cung cấp như ảnh trên của trang web H&M, vì Google và các công cụ tìm kiếm khác đều dựa trên sơ đồ trang XML của bạn. Tuy nhiên, nếu bạn thực sự nghĩ rằng chúng có ích cho người truy cập thì một sơ đồ trang web HTML có thể sẽ không ảnh hưởng đến nỗ lực SEO của bạn ở hiện tại.
Kết luận
Hy vọng thông qua bài viết này bạn đã biết cách để tạo sitemap cũng như khai báo nó với Google Search Console. Đây là một trong những tiến trình quan trọng mà bạn không nên bỏ qua, bởi nó hỗ trợ bạn index nhanh hơn. Chúc các bạn thực hiện thành công!
Nguồn: vietmoz.edu.vn, Backlinko
Bản quyền thuộc về Đào tạo SEO VietMoz
Vui lòng không copy khi chưa được sự đồng ý của tác giả