Faceted Navigation là gì? Chắc hẳn mỗi chúng ta ở đây đều đã từng mua sắm trực tuyến và tôi chắc chắn, bạn đã bắt gặp Faceted Navigation – có thể là bạn chưa nhận ra điều đó hoặc đơn giản là biết nhưng không biết gọi tên nó là gì.
Ở đây, tôi có thể giải thích đơn giản là các cột sắp xếp theo giá, lọc dựa theo kích thước và sắp xếp theo màu sắc, đây là ví dụ minh chứng nhất về Faceted Navigation.
Faceted Navigation là một loại điều hướng được tìm thấy ở trên các danh mục / lưu trữ của các trang liên quan tới nhiều danh sách. Mục đích của nó là giúp người dùng tìm thấy được những gì họ đang tìm kiếm một cách dễ dàng hơn thông qua việc sử dụng nhiều bộ lọc dựa trên các thuộc tính của danh sách.
Nhiều người gọi Faceted Navigation chỉ đơn giản là ‘bộ lọc’.
Faceted Navigation không chỉ xuất hiện ở trên các trang thương mại điện tử, mà nó còn xuất hiện ở trên các trang như:
- Các nhà xuất bản thường sử dụng việc Faceted Navigation, nhằm giúp khách hàng truy cập lọc theo loại nội dung cuốn sách (Ngày, chủ đề,..v..v..)
- Các trang web rao vặt, tìm việc làm đều sử dụng Faceted Navigation khía cạnh giúp người truy cập lọc theo những thứ như vị trí, giá thành, phí vận chuyển,…
- Những trang web lớn thường sử dụng Faceted Navigation. Nhìn chung, nếu như trang web mà càng lớn thì càng có nhiều khả năng sử dụng một số loại điều hướng nhằm cải thiện trải nghiệm của người dùng.
Bạn có thể tìm thấy nhiều ví dụ về tìm kiếm theo từng khía cạnh ở trên hầu hết các website thương mại điện tử lớn (ở đây chúng ta sẽ nói tới Amazon).
Hãy cùng xem giao diện người dùng trên Target. Nếu bạn đang cần mua áo thun nam và truy cập theo trang chủ của Target, bạn có thể tìm theo đường dẫn sau mà không cần phải rời khỏi hệ thống điều hướng chính:
Trang chủ > Nam giới > Quần áo nam > Áo sơ mi > T-Shirt > Basic Tees.
Hành trình điều hướng sẽ kết thúc ở mục Basic Tees, thay vì khiến người dùng bị choáng ngợp bởi quá nhiều các lựa chọn thì nay mọi thứ đã được thu hẹp lại, người dùng có thể dễ dàng đưa ra lựa chọn của bản thân hơn.
Trên các trang áo phông cơ bản, một thiết kế điều hướng rõ ràng sẽ giúp người dùng lọc danh sách các tính chất cơ bản theo các đề mục sau:
Đây là chín thuộc tính bổ sung của áo phông, danh mục thứ mười là bao gồm cả các sản phẩm đã hết hàng. Những kết hợp khác nhau giữa các thuộc tính này dẫn tới việc xuất hiện hàng nghìn hàng nghìn phiên bản khác nhau của trang đơn giản này.
Nói theo cách khác, nếu như bạn lọc theo danh sách các thuộc tính ưa thích của mình tới đây:
Đây là một trong hàng ngàn các kết quả có thể xảy ra. Tất cả trong một danh mục con duy nhất của một danh mục con.
Google nghĩ thế nào?
Với con số đáng kinh ngạc ở trên là lý do khiến Faceted Navigation là lựa chọn thân thiện nhất dành cho khách hàng. Đây cũng là cách thiết thực nhất dành cho các nhóm thương mại điện tử.
Đơn giản có thể thấy rằng, thực sự không có ý nghĩa gì khi mà xây dựng hết các trang này tới trang khác, buộc người dùng phải nhấp hết phần này rồi nhấp phần kia trên một quá trình vô cùng “mệt mỏi”.
Nhưng đối với Google, việc Faceted Navigation như này thường không thân thiện với tìm kiếm, một trong những trường hợp hiếm hoi về trải nghiệm người dùng tốt lại có khả năng gây ra xung đột với SEO.
Nguyên nhân tại sao? Bởi vì các khía cạnh tạo ra quá nhiều phiên bản ở trên cùng một URL.
Điều này gây ra bốn vấn đề chính với SEO:
- Nội dung bị trùng lặp vì có nhiều phiên bản của cùng một trang đang tồn tại trên trang web của bạn. Nhiều khía cạnh không thay đổi nhiều nội dung của trang đó (nếu có). Ví dụ: một tùy chọn để sắp xếp sản phẩm dựa theo giá cả có thể tạo ra rất nhiều trang có các sản phẩm giống nhau ở trên đó, chỉ khác nhau về thứ tự.
- Các liên kết bị loãng (Chỉ mục bị phình to) vì các liên kết nội bộ sẽ được trải rộng ở trên nhiều URL. Thay vì một biến thể của một trang liên kết thì nay có hàng trăm, hàng nghìn. Điều này có thể nói là thật tệ khi thay vì một trang nhận được lợi ích của tất cả các trang khác liên kết tới nó thì nay một số liên kết đó lại trỏ tới các bản sao.
- Lãng phí thu thập thông tin, bởi vì Google sẽ chỉ dành thời gian ở trên các trang trùng lặp và có thể sẽ bỏ lỡ (không có thời gian) để thu thập các thông tin có giá trị trên trang web của bạn.
- Bẫy thu thập thông tin: Trong nhiều trường hợp, việc Faceted Navigation có thể tạo ra sự kết hợp gần như vô tận giữa các URL cốt lõi của bạn. Đây được gọi là bẫy thu thập thông tin, bởi vì các bot thực sự bị “lạc lối” khi đi thu thập các URL này.
Dưới đây là một số ví dụ cụ thể về cách mà những vấn đề này xảy ra và tác động của chúng tới SEO trên trang web của bạn.
Nội dung bị trùng lặp
Nội dung bị trùng lặp, có thể hiểu là nội dung bị giống nhau hoặc tương tự, có thể truy cập được tại nhiều URL. Các bộ lọc rất nổi tiếng với việc tạo ra các URL có nội dung trùng lặp một cách hàng loạt. Sự trùng lặp này chủ yếu là do các trang lọc là các bản sao gần giống so với trang gốc cùng với các danh sách khác nhau.
Mặc dù, nội dung bị trùng lặp không hẳn là một tín hiệu xếp hạng tiêu cực, nhưng nó có thể gây ra các vấn đề như:
- Ăn thịt từ khóa.
- Gây loãng các tín hiệu xếp hạng thành nhiều URL (thay vì hợp nhất trở thành một URL mạnh hơn).
Hãy nhìn trang thương mại điện tử currys.co.uk là một ví dụ. Tôi sẽ bắt đầu trên trang “Màn hình PC HP” của họ. Đây là một bố cục trang thương mại điện tử với tiêu chuẩn hợp lý, tiêu đề, danh sách và tìm kiếm dựa theo từng khía cạnh trong màn hình đầu tiên:
Và phía bên dưới là danh sách sản phẩm, một số nội dung về màn hình HP:
Bây giờ chúng ta sẽ áp dụng một bộ lọc ‘màn hình 4K’.
Bạn sẽ thấy cập nhật danh sách sản phẩm có sự thay đổi từ H1 và URL đi từ:
/hp-computing/pc-monitors/pc-monitors/354_3057_30059_16_xx/xx-criteria.html
Đến:
/hp-4k-monitors/pc-monitors/pc-monitors/354_3057_30059_16_ba00012894-bv00311096/xx-criteria.html
Nhưng nếu bạn cuộn xuống cuối trang, khối nội dung tương tự vẫn tồn tại ở bên dưới danh sách.
Đây chỉ là một ví dụ nhỏ về sự trùng lặp trên website. Khi chia với tỷ lệ như này ở trên mọi bộ lọc có sẵn, bạn sẽ nhanh chóng có hàng triệu trang trùng lặp với nhau để Google thử và hợp nhất lại thành một trang chuẩn.
Chỉ mục bị phình to
Tăng chỉ mục là khi các công cụ tìm kiếm lập chỉ mục các trang trên website của bạn mà không có bất kỳ giá trị tìm kiếm gì.
Google chỉ cho phép lập chỉ mục các trang chất lượng vì việc lập chỉ mục các trang chất lượng thấp có thể ảnh hưởng tới chế độ xem tổng thể của Google trên website của bạn, như John Mueller đã giải thích ở trong video này:
Faceted Navigation có khả năng tạo ra hàng triệu URL có lập chỉ mục mà không có nội dung duy nhất cho chúng. Nó cũng có thể tạo ra các biến thể trên trang không cung cấp giá trị gì cho người dùng sử dụng công cụ tìm kiếm.
Dưới đây là một ví dụ:
AO.com có một trang danh mục dành riêng cho máy giặt đặt riêng:
Người dùng có thể truy cập trang này và quyết định những thứ mà họ muốn lọc:
- Thương hiệu: Samsung
- Tải trọng giặt: Lớn
- Màu sắc: Bạc
- Tải trọng giặt: Lớn
- Các tính năng: Rửa nhanh
- Đánh giá chất lượng: A
Nhờ các bộ lọc mà khách hàng truy cập đưa ra, trang web đã trả lại chính xác chiếc máy giặt phù hợp với nhu cầu sử dụng của người dùng.
Nhưng liệu, một người dùng có bao giờ tìm kiếm trên Google những thứ chính xác như vậy không?
Câu trả lời chắc chắn là không.
Tôi biết được điều này vì theo ước tính, chỉ có 90 lượt tìm kiếm mỗi tháng cho ‘máy giặt đặt tự do’ ở Vương Quốc Anh. Vì vậy, rất ít khả năng sẽ có nhiều (nếu có) tìm kiếm cho một thứ thậm chí còn cụ thể hơn như là ‘máy giặt đặt tự do samsung màu bạc lớn máy có tính năng giặt nhanh và xếp hạng chất lượng A’.
Việc có các trang như thế này được lập chỉ mục sẽ không phục vụ cho nhu cầu tìm kiếm và chất lượng thấp có thể khiến trang web của bạn có nguy cơ bị tác động tiêu cực bởi các thuật toán Google.
Thu thập thông tin lãng phí ngân sách
Bạn có biết, Google chỉ có thể dành một lượng tài nguyên hữu hạn để thu thập thông tin các trang trên website của bạn không? Đây được gọi là ngân sách thu thập thông tin của bạn.
Quản lý ngân sách thu thập thông tin không phải là điều mà Google coi là ưu tiên, trừ khi bạn sở hữu một trang web lớn (hơn 1 triệu trang) hoặc trang web trung bình (hơn 10 nghìn trang) với các nội dung đa dạng, thay đổi nhiều.
Theo lời khuyên đó, nếu bạn chỉ có vài nghìn danh mục và sản phẩm, bạn có thể sẽ nghĩ rằng bạn không cần phải lo lắng về việc quản lý ngân sách thu thập thông tin.
Điều này có thể sẽ rất sai lầm.
Một số triển khai Faceted Navigation sẽ tạo ra một liên kết có thể thu thập thông tin cho từng kết hợp khía cạnh đã có sẵn.
Tạm bỏ qua các vấn đề tiềm ẩn về lập chỉ mục, điều này cũng có nghĩa là bạn có khả năng tạo ra hàng triệu URL để Google thu thập thông tin. Vậy nên, bạn cần phải nhanh chóng thực hiện việc quản lý ngân sách thu thập thông tin.
Bạn có thể tìm thấy ví dụ về điều này trên trang next.co.uk:
Khi bạn kiểm tra HTML của một khía cạnh, bạn sẽ thấy một liên kết bên trong HTML:
Khi bạn đã theo liên kết đó, bạn có thể kiểm tra HTML của một khía cạnh khác như khía cạnh màu xanh lam:
Từ đó, bạn có thể xem cách mà các khía cạnh kết hợp với nhau để tạo ra một URL hoàn toàn mới để được thu thập thông tin.
Bây giờ, hãy xem xét tất cả các kết hợp tiềm năng của các bộ lọc khác nhau. Bạn có thể nhanh chóng thấy được việc thu thập dữ liệu một trang web có vấn đề về khía cạnh sẽ gây ra sự cố dành cho công cụ tìm kiếm là như thế nào.
Gây loãng thứ hạng (PageRank)
Faceted Navigation cũng có thể gây loãng thứ hạng trang được chuyển qua website của bạn.
Điều này là do Xếp hạng trang được chia cho tổng số liên kết trên trang. Điều này thể hiện một vấn đề cố hữu với Faceted Navigation vì chúng tạo ra nhiều liên kết nội bộ.
Vì vậy, thay vì PageRank chuyển tới các trang sản phẩm hoặc danh mục quan trọng, nó sẽ chuyển tới các liên kết được tìm thấy trong bộ lọc của bạn, điều này trong hầu hết các trường hợp sẽ không giúp cải thiện được lưu lượng tìm kiếm.
Hãy cùng phân tích một ví dụ về một trang web thương mại điện tử có ít hơn 200.000 trang sản phẩm.
Khi chúng tôi tiến hành việc thu thập thông tin, tuân theo các quy tắc tương tự như các quy tắc mà trang web này đã đặt ra cho Google trong robot.txt, chúng tôi nhận thấy rằng website này có hơn 500 triệu trang có thể truy cập được.
Xin lưu ý một điều rằng, trang web thương mại điện tử này có ít hơn 200.000 sản phẩm và số lượng trang mà họ có là hơn 500 triệu lượt truy cập với bot công cụ tìm kiếm.
Nguyên nhân tại sao? Faceted Navigation của trang web này đã tạo ra vô số kết hợp trên cùng một URL và thật không may, đây không phải là một trường hợp hiếm gặp.
Nhưng chúng có nghĩa là gì khi “nhiều phiên bản của cùng một URL”?
Giả sử, chúng tôi đang tìm kiếm trên một website thương mại điện tử bán máy tính và đang xem trang danh mục ‘màn hình’.
URL chính của trang khi đó có thể là:
https://example.com/monitors/
Bây giờ, tôi có các bộ lọc dành cho kích thước của màn hình, độ phân giải và kết nối. Tôi chọn xem màn hình 19 inch với độ phân giải 1600 x 900, có cả kết nối HDMI.
Sau khi thực hiện các lựa chọn trên, tôi có một URL nhìn như sau:
https://example.com/monitors/filters?size=19inch&resolution=1600x900pixel&connectivity=hdmi
Đây chính là phiên bản thu hẹp của cùng một trang màn hình mà tôi đã xem trong thời gian vừa rồi. Trang này không có nội dung khác, chỉ là có ít nội dung hơn mà thôi.
Trang đó cũng sẽ cực kỳ giống với các phiên bản thu hẹp khác của trang mà khách hàng truy cập có thể tạo ra, như thế này:
https://example.com/monitors/filters?size=19inch,22inch&resolution=1600x900pixel&connectivity=hdmi,wga
Và còn tùy thuộc vào Hệ thống quản lý nội dung (CMS) và nhà phát triển của bạn, thậm chí có thể có các kết hợp khác nhau trong cùng một URL – về cơ bản, cả hai trang này đều tồn tại và hoàn toàn giống nhau, như:
https://example.com/monitors/filters?size=19inch&connectivity=hdmi
và
https://example.com/monitors/filters?connectivity=hdmi&size=19inch
Sự khác biệt duy nhất giữa hai trang trên là các khía cạnh được liệt kê theo các thứ tự khác nhau, tùy thuộc vào thứ tự mà khách truy cập đã nhấp vào các bộ lọc.
Hiểu được điều này, có lẽ không còn gì đáng ngạc nhiên khi trên một trang web có 200.000 trang sản phẩm mà tồn tại hơn 500 triệu trang.
Ngoài ra, việc người dùng có thể tùy chỉnh tìm kiếm và tìm được các sản phẩm tốt nhất theo nhu cầu của mình, thì chắc chắn các công cụ tìm kiếm sẽ gặp khó khăn trong việc tìm ra trang nào bạn muốn họ lập chỉ mục.
Biết là Google không thu thập thông tin ở trong một nửa số trang trên trang web trung bình của bạn, có thể bạn sẽ đặt ra câu hỏi “họ còn thiếu một nửa nào?”
Họ có đang thiếu các trang bị trùng lặp, có giá trị thấp của bạn hay không? Hay họ đang bỏ lỡ các trang sản phẩm quan trọng, thúc đẩy doanh thu của bạn?
Chúng tôi biết rằng, với tỷ lệ trang được thu thập thông tin thấp, các trang web có ít trang sẽ tạo ra lưu lượng truy cập từ tìm kiếm không phải trả tiền cao hơn và những con số đó chỉ trở nên tệ hơn khi các trang web bị tăng kích thước.
Làm thế nào để biết, liệu Google có tìm thấy các trang quan trọng trên website của bạn hay không?
Để có thể xem liệu các bot của công cụ tìm kiếm (như Google) đang tìm các trang quan trọng của bạn hay là đang lãng phí thời gian trên các trang trùng lặp, bạn có thể xem các tệp nhật ký máy chủ của mình.
Để xem Google đã lập chỉ mục những trang nào trên website của bạn, bạn có thể kiểm tra URL trong Google Search Console (GSC) để xem tất cả các trang được lập chỉ mục.
Để xem trang nào trong số các trang này đang nhập được nhiều nhấp chuột và lượng truy cập, bạn có thể sử dụng Google hoặc Adobe Analytics, GSC để kiểm tra tại chỗ.
Lý tưởng nhất là Googlebot chỉ thu thập thông tin, lập chỉ mục, xếp hạng và hướng lưu lượng truy cập tới trang web của bạn. Bạn sẽ muốn Googlebot tránh xa các trang bị trùng lặp của mình được tạo ra bởi Faceted Navigation và bộ lọc nhằm loại bỏ nguy cơ làm hại hiệu suất trên các trang có giá trị cao.
Luôn có những dấu hiệu rõ ràng về các vấn đề điều hướng; dưới đây là một số bước để khám phá xem bộ lọc của bạn có thể ảnh hưởng tới SEO hay không.
Bắt đầu với tìm kiếm trang web
Một chiến thuật tuyệt vời để kiểm tra xem có dấu hiệu của việc các trang tăng lên một cách nhanh chóng là sử dụng các site: search operator. Mặc dù, đây không phải là cách chính xác nhất, nhưng nó nhanh chóng và dễ thực hiện.
Cách thực hiện rất dễ, bạn chỉ cần thêm ‘site:’ ở phía trước tên miền của bạn, như hình bên dưới.
Ghi lại số lượng kết quả mà Google trả về. Nếu nó có vẻ cao hơn số lượng URL mà bạn biết hiện đang có sẵn trên trang web của mình?
Nếu đúng như vậy, đây là dấu hiệu đầu tiên cho biết bạn đang gặp với đề với chỉ mục phình to.
Xác thực với các báo cáo về phạm vi của Google Search Console (GSC)
Báo cáo mức độ phù hợp của GSC là một cách tuyệt vời khác để phát hiện ra các vấn đề thu thập thông tin và lập chỉ mục một cách nhanh chóng.
Bạn chỉ cần đi tới báo cáo ‘Mức độ phù hợp’ trong GSC và chọn ‘Hợp lệ’ trên biểu đồ để có con số chính xác hơn về số trang mà Google đã lập chỉ mục:
Nếu như điều này có vẻ cao hoặc dạo gần đây bạn đã triển khai tìm kiếm theo từng khía cạnh và hệ quả sau đó là nó tăng vọt, điều này sẽ ảnh hưởng tới các vấn đề về chỉ mục đã được đề cập trước đó.
Nhưng làm thế nào để chúng ta biết được là các bộ lọc đã gây ra nó?
Sơ đồ trang XML chính xác đã giúp chẩn đoán được các vấn đề ở đây. Nếu bạn đã tải những URL đó lên GSC, bảng phía bên dưới biểu đồ sẽ chia các URL được lập chỉ mục thành:
- Đã lập chỉ mục, chưa được gửi trong sơ đồ trang web.
- Đã gửi và lập chỉ mục.
Điều này có nghĩa là chúng ta có thể xem các trang ‘Được lập chỉ mục, không được gửi trong sơ đồ trang web’ để có thể xem các trang bạn không mong muốn mà Google đang lập chỉ mục:
Ví dụ này là trong một trang web cá cược, nó cho phép bạn lọc các địa điểm và giải đấu. Chúng ta có thể thấy rằng, ở đây Google đang lập chỉ mục các URL không mong muốn.
Một cách hữu ích khác để phát hiện các vấn đề tiềm ẩn là lọc các URL ‘Bị loại trừ’:
Việc điều tra các URL ‘Đã thu thập thông tin – hiện chưa được lập chỉ mục’ có thể cung cấp cho bạn thông tin chi tiết về các trang mà Google đang khám phá nhưng đã quyết định không lập chỉ mục.
Google sẽ không lập chỉ mục cho mọi thứ mà họ đã thu thập thông tin. Nếu trang có chất lượng thấp giống như nhiều trang thuộc khía cạnh khác, họ có thể quyết định không lập chỉ mục nó.
Ở trong ví dụ này, chúng tôi biết rằng có 1.000 trang bổ sung mà Google đã phát hiện ra rằng họ có thể lập chỉ mục trong tương lai. Bạn có thể xem bảng URL để xem các URL có khía cạnh bằng cách nhấp vào báo cáo này.
Trên đây là một ví dụ tương đối cơ bản về các vấn đề với Faceted Navigation được đánh dấu trong GSC. Theo thời gian, những vấn đề này có thể mở rộng đến hàng trăm ngàn URL được phát hiện nhưng không được lập chỉ mục (cho thấy các vấn đề tiềm ẩn về thu thập dữ liệu):
Hoặc hàng trăm nghìn URL có khả năng được lập chỉ mục khi chúng không nên được lập chỉ mục:
Thu thập dữ liệu với chuyên gia đánh giá địa điểm
Sử dụng tìm kiếm trên trang web và GSC là một cách nhanh chóng để lấy dữ liệu về một vấn đề, nhưng với việc cả hai URL có thể lập chỉ mục và đã lập chỉ mục đều không hiển thị, khiến cho việc phát hiện xu hướng và hiểu quy mô của toàn bộ vấn đề trở nên khó khăn hơn.
Các công cụ kiểm tra trang web như Kiểm tra trang web của Ahrefs có thể giúp bạn khắc phục được điều đó bằng cách cung cấp cho bạn thông tin chi tiết về các URL được phát hiện từ việc thu thập dữ liệu trang web.
Ví dụ dưới đây là một trang web có các vấn đề về điều hướng, gây lãng phí ngân sách thu thập thông tin và bạn có thể phát hiện ra điều đó dễ dàng chỉ với một vài cú nhấp chuột.
Đầu tiên, hãy chuyển tới báo cáo Khả năng lập chỉ mục ở cột bên trái.
Tiếp theo, hãy xem qua biểu đồ ‘Phân phối khả năng lập chỉ mục’ và bạn sẽ thấy liệu đang có điều gì đó không ổn hay không.
Từ thu thập thông tin một phần, Kiểm tra trang web đã tìm thấy 39 URL không thể lập chỉ mục cho mọi URL có thể lập chỉ mục. Do đây không phải là thu thập thông tin đầy đủ của trang web, chúng tôi nghĩ rằng rằng tỷ lệ URL có thể lập chỉ mục và URL không thể lập chỉ mục có thể sẽ xấu đi khi mà quá trình thu thập thông tin được tiếp tục.
Những điều trên cho thấy được sự lãng phí ngân sách thu thập thông tin rất lớn và đây cũng chính là một ví dụ về bẫy trình thu thập thông tin – nơi các vấn đề kỹ thuật tạo ra gần như vô hạn các URL không liên quan cho tìm kiếm và bot sẽ thu thập thông tin.
Nếu việc Faceted Navigation của bạn đang gây ra tình trạng chỉ mục bị phình to, thì biểu đồ mà bạn sẽ thấy ở phía dưới đây sẽ trông hơi khác một chút. Thay vì là một lượng lớn các URL không thể lập chỉ mục, bạn sẽ thấy được một lượng lớn các URL có thể lập chỉ mục trên biểu đồ như bên dưới.
Để xác định đây là vấn đề Faceted Navigation, hãy chọn phần không thể lập chỉ mục của biểu đồ và quét danh sách. Bây giờ, bạn sẽ thấy một bảng gồm tất cả các trang không thể lập chỉ mục được thu thập thông tin.
Đây là nơi mà bạn sẽ cần phát hiện ra một mẫu.
Điều gì khiến trình thu thập thông tin tìm thấy tất cả các trang không thể lập chỉ mục này?
Nếu phần lớn các URL được trả về trong bảng là các URL có nhiều khía cạnh, thì bạn đã thấy được là mình đang gặp vấn đề về Faceted Navigation.
Như phần trên, bạn đã nắm được cách kiểm tra các sự cố Faceted Navigation và đây là cách để khắc phục chúng.
Khắc phục việc lập chỉ mục bằng thẻ chuẩn
Nếu bạn đang gặp phải vấn đề về lập chỉ mục và không có vấn đề gì về ngân sách thu thập thông tin đáng báo động (hay không có trang web lớn), giải pháp tốt nhất được đưa ra ở đây là sử dụng thẻ chuẩn (thẻ canonical). Nó sẽ giúp bạn hợp nhất các tín hiệu liên kết cho các trang tương tự / trùng lặp vào URL mà bạn chỉ định làm trang chuẩn.
Lợi ích nhận được?
Nếu bạn có các liên kết tới một trang thuộc khía cạnh, sau đó được chuẩn hóa dành cho trang không thuộc khía cạnh đó, thì các tín hiệu liên kết này sẽ không bị mất; công cụ tìm kiếm sẽ chuyển chúng tới trang danh mục, điều này có thể giúp nó có được xếp hạng.
Dưới đây là một ví dụ về cách triển khai điều này
Giả sử, đây là URL trên trang danh mục của bạn:
https://example.com/washing-machines/samsung/
URL thuộc tính hoạt động với các tham số, vậy nên khi ai đó áp dụng một số bộ lọc, URL khi đó sẽ trở thành:
https://example.com/washing-machines/samsung/?drumsize=16kg&color=silver&energyrating=A
Trên URL thuộc tính ở trên, bạn chỉ cần thêm một thẻ chuẩn để trỏ về trang danh mục. Khi ấy, thẻ chuẩn của bạn sẽ trông giống như nhau:
<link rel = “canonical” href = “https://example.com/washing-machines/samsung/” />
Hoặc là như thế này trong tiêu đề HTTP của bạn:
Link: <https://example.com/washing-machines/samsung/>; rel=”canonical”
Mặc dù, đây có vẻ là một cách khắc phục tốt và dễ dàng đối với một vấn đề về SEO nghiêm trọng. Tuy nhiên, chúng vẫn có một số vấn đề tiềm ẩn, nguyên nhân chính ở đây là Google có thể bỏ qua thẻ chuẩn của bạn.
Điều này có thể hiểu đơn giản là bởi vì các thẻ chuẩn là gợi ý dành cho các công cụ tìm kiếm, không phải là dạng chỉ thị. Vậy nên, nếu như Google vì một lý do nào đó, cho rằng bạn đã triển khai thẻ không chính xác, họ có thể quyết định bỏ qua nó.
Các lý do phổ biến khiến Google quyết định bỏ qua các đề xuất thẻ chuẩn của bạn là:
- Các trang không bị trùng lặp: Nếu như các trang thuộc khía cạnh của bạn thay đổi một cách đáng kể từ khi bạn áp dụng bộ lọc, Google có thể sẽ nghĩ rằng chúng không bị trùng lặp với nhau. Ví dụ: nếu như nội dung, tiêu đề và tiêu đề thay đổi, Google có thể sẽ bị nhầm lẫn.
- Bạn liên kết nội bộ tới các trang khía cạnh: Nếu như bạn có nhiều liên kết nội bộ tới một trang thuộc tính chuẩn, Google có thể hiểu sai tầm quan trọng của trang đó và bỏ qua thẻ chuẩn của bạn.
Còn nếu như bạn không thấy số lượng URL hợp lệ trong báo cáo mức độ phù hợp của mình giảm sau khi triển khai thẻ chuẩn, hãy chuyển sang bước hai.
Sử dụng báo cáo Tham số URL trong Search Console
Nếu trong quá trình chuẩn hóa không khắc phục được sự cố lập chỉ mục, thì việc lựa chọn báo cáo tham số URL trong GSC được cho là cách tốt nhất nhằm tối ưu hóa việc thu thập thông tin. Nó sẽ cho phép bạn cho Google được biết cách xử lý các tham số trong URL của bạn và giúp chúng thu thập thông tin hiệu quả hơn.
Nhược điểm là phương pháp này chỉ hoạt động nếu như Faceted Navigation của bạn sử dụng các tham số URL. (Nếu đây không phải là trường hợp của bạn, hãy chuyển ngay sang bước thứ ba).
Sử dụng báo cáo tham số URL khá là đơn giản. Chỉ cần thêm một tham số, sau đó cho Google biết nó ảnh hưởng thế nào tới nội dung của trang và có những ngoại lệ nào đối với quy tắc mà họ đang thu thập thông tin.
Chú thích: Nếu bạn đã chặn chúng thu thập thông tin qua robots.txt, điều này sẽ không tạo ra bất kỳ sự khác biệt nào.
Khắc phục sự cố thu thập thông tin bằng robots.txt
Nếu bạn đang gặp phải các vấn đề về ngân sách thu thập dữ liệu và bạn không cần tín hiệu để hợp nhất, bạn có thể sử dụng robots.txt để chặn việc Google thu thập thông tin trên bất kỳ URL có khía cạnh nào.
Để chặn việc thu thập thông tin URL bằng robots.txt, hãy thêm quy tắc không cho phép như sau:
User-agent: *
Disallow: *size=*
Trong ví dụ trên, tôi đã thêm hai ký tự đại diện (*) xung quanh tham số. Nếu Faceted Navigation của bạn hoạt động bằng cách nối các thư mục lại với nhau, quy tắc của bạn sẽ như sau:
User-agent: *
Disallow: */size/*
Có hai trường hợp khi tệp robots.txt không hoạt động tốt:
- Bạn không có mẫu rõ ràng nào trong URL để không cho phép: Điều này có thể là do mỗi trang được cung cấp các tham số hoặc thư mục duy nhất cho các khía cạnh.
- Bạn muốn cho phép việc thu thập thông tin trên một số mẫu URL và chặn những mẫu khác.
Ví dụ: bạn muốn thu thập thông tin thư mục / màu sắc / cho danh mục áo thun (vì nó cung cấp giá trị cho việc tìm kiếm), nhưng lại muốn nó bị chắn đối với danh mục đồ lót. Mặc dù, bạn có thể lựa chọn giải quyết vấn đề này bằng cách trộn các quy tắc ‘Cho phép’ và ‘Không cho phép’ ở trong robots.txt, nhưng điều này có thể sẽ trở nên khó quản lý ở trên các website có quy mô lớn.
Bạn cũng nên biết rằng, việc chặn thu thập thông tin không hẳn sẽ ngăn được Google lập chỉ mục cho các URL bị chặn. Nói chung, Google sẽ loại bỏ các URL bị chặn khỏi chỉ mục – nhưng với điều kiện chúng không có liên kết ngược hoặc nhiều liên kết nội bộ được theo dõi trỏ đến chúng. Nói cách khác, miễn là không có gì khác đang báo hiệu cho Google rằng những URL đó có giá trị.
Nofollow hoặc xóa các liên kết nội bộ tới các URL có nhiều khía cạnh
Nếu việc chặn thu thập thông tin không loại bỏ hoàn toàn các vấn đề về lập chỉ mục do việc tìm kiếm theo từng khía cạnh gây ra, thì các liên kết nội bộ nofollow tới các URL đó có thể giải quyết được vấn đề này.
Thông thường sẽ có hai nguồn của các liên kết này:
- Liên kết tìm kiếm từng khía cạnh: Tức là, các liên kết trong Faceted Navigation của bạn.
- Liên kết từ những nơi khác trên trang web của bạn. Ví dụ: Từ các bài đăng ở trên blog,.v.v.
Đối với các liên kết tìm kiếm theo từng khía cạnh, việc áp dụng Nofollow là rất dễ dàng với một chút mã hóa cơ bản. Tuy nhiên, đây có lẽ không phải là ý tưởng tốt nhất nếu bạn có các thẻ chuẩn trên các URL có nhiều khía cạnh và các URL có nhiều khía cạnh mà bạn đang muốn Google lập chỉ mục. Lý do ở đây, nếu Google không thu thập dữ liệu các liên kết này vì chúng không được theo dõi, điều đó có thể gây ra những vấn đề liên quan tới các lập chỉ mục khác.
Cách thay thế là chọn và chọn các khía cạnh mà bạn không theo dõi. Điều này sẽ khó thực hiện hơn một chút theo quan điểm từ kỹ thuật, nhưng nó sẽ rất đáng giá nếu bạn muốn nhắm mục tiêu các truy vấn đuôi dài với tìm kiếm theo từng khía cạnh.
Nhược điểm chính của phương pháp này là nó ít hữu ích hơn sau khi Google bắt đầu coi rel=’nofollow’ giống như một gợi ý, có nghĩa là nó không phải là một chỉ thị giống như robots.txt.
Tuy nhiên, Google sẽ sử dụng một nofollow nội bộ để cho biết rằng URL trong thuộc tính href không quan trọng và Google nên tước quyền thu thập dữ liệu đó.
John Mueller đã xác nhận về điều này:
[…] Chúng tôi sẽ tiếp tục sử dụng các liên kết nofollow nội bộ này như một dấu hiệu cho thấy bạn đang nói với chúng tôi:
Những trang này không thú vị bằng.
Google không cần phải thu thập thông tin chúng.
Chúng không cần được sử dụng để xếp hạng, lập chỉ mục.
John Mueller –
Chú thích: Cách tiếp cận này không khắc phục được việc gây loãng của PageRank. PageRank vẫn được phân phối giữa tất cả các liên kết trên trang, ngay cả những liên kết có thuộc tính Nofollow. Nếu như bạn muốn khắc phục điều này, bạn sẽ cần triển khai quá trình chuẩn hóa phù hợp.
Đối với các liên kết tới từ nơi khác trên trang web của bạn, cách tốt nhất là bạn chỉ cần xóa chúng đi.
Bạn có thể tìm thấy các liên kết nội bộ tới các URL có vấn đề bằng cách sử dụng Trình khám phá trang web của Ahrefs:
- Bước 1: Nhập một URL có vấn đề.
- Bước 2: Chuyển tới báo cáo liên kết ngược nội bộ (Internal Link).
- Bước 3: Lọc các liên kết Dofollow.
Sau đó, bạn sẽ chỉ cần tìm kiếm các liên kết nội bộ ‘được theo dõi’ ở những nơi khác trên trang web của mình và xóa chúng.
Sửa lỗi lập chỉ mục bằng thẻ Noindex
Nếu bạn vẫn tiếp tục gặp sự cố lập chỉ mục sau khi đã thực hiện các bước ở trên, thì đây là cách cuối cùng – thẻ noindex.
Lợi ích của thẻ noindex là một cách chắc chắn để ngăn việc lập chỉ mục các trang thuộc tính. Nhược điểm của nó là bạn không hợp nhất được các tín hiệu xếp hạng và theo thời gian, Google có thể ngừng thu thập dữ liệu các liên kết nội bộ trên một trang không được lập chỉ mục, nghĩa là chúng sẽ không có tín hiệu xếp hạng nào.
Tuy nhiên, đây là một cách tốt nhằm loại bỏ các URL có khía cạnh ra khỏi chỉ mục của Google nếu những cách trên không làm được.
Để thực hiện được việc này, bạn chỉ cần thêm thẻ meta robots vào <head> của URL có khía cạnh:
<meta name = “robots” content = “noindex”>
Hoặc tiêu đề X – Robots trong tiêu đề HTTP của một URL có nhiều khía cạnh:
X-Robots-Tag: noindex
Sau đó, bạn cần xóa hoặc điều chỉnh lại bất kỳ khối thu thập thông tin nào cho URL trong robots.txt hay công cụ tham số URL. Nếu không thực hiện được điều này thì Google sẽ không bao giờ thấy lệnh ngăn lập chỉ mục – nghĩa là trang vẫn sẽ được lập chỉ mục.
Từ phần trước, bạn sẽ nhận ra rằng việc khắc phục tất cả các vấn đề tiềm ẩn mà Faceted Navigation tạo ra là không dễ dàng.
Mọi cách tiếp cận nhằm khắc phục cả lập chỉ mục và thu thập thông tin đều có một số nhược điểm và phức tạp khác nhau.
Nhưng có cách tốt hơn.
Giả sử, bạn đang triển khai cấu hình Faceted Navigation mới hay đang tạo cấu hình điều hướng lần đầu tiên. Trong trường hợp này, bạn có thể phá vỡ tất cả các vấn đề trên trong khi vẫn tận dụng tốt lợi ích của UX đem lại.
Dưới đây là cách để thực hiện điều đó.
Sử dụng AJAX và tránh các liên kết nội bộ
Đầu tiên, phải xây dựng Faceted Navigation của bạn với AJAX và không thêm bất kỳ <a href=…> liên kết nội bộ nào.
Bằng cách này, người dùng sẽ có được trải nghiệm tuyệt vời do trang không phải tải lại bất cứ khi nào họ thực hiện việc lọc và Google sẽ không nhìn thấy bất kỳ liên kết nội bộ nào tới các trang thuộc tính, nghĩa là:
- Họ không thu thập lại thông tin.
- Dẫn tới việc Google không lập chỉ mục chúng.
- Loại bỏ bất kỳ sự gây loãng tiềm năng trên PageRank.
Dưới đây là một ví dụ.
Tôi đã triển khai Faceted Navigation với plugin WP Grid Builder WordPress trên một tài nguyên mà tôi đã tạo ra có tên là SEO Toolbelt.
Trông nó như thế này:
Khi bạn nhấp chuột phải và kiểm tra các phần tử trên bất kỳ hộp kiểm nào để áp dụng bộ lọc, bạn sẽ thấy chúng không bao gồm liên kết <a href=…> trên đó, ngăn việc Google thu thập bất kỳ URL bổ sung nào.
Do vậy, tôi đã tránh được việc phải nghĩ về việc lãng phí ngân sách thu thập thông tin từ Faceted Navigation.
Đảm bảo các URL vẫn có thể chia sẻ được
Tiếp theo, chúng ta cần đảm bảo rằng, khi người dùng nhấp vào bộ lọc, URL sẽ thay đổi.
Tôi khuyên bạn nên thực hiện điều này, vì nếu người dùng đánh dấu trang, liên kết đến trang hoặc chia sẻ URL với bạn bè, nội dung của URL sẽ phản ánh các bộ lọc mà họ đã áp dụng khi họ thực hiện đánh dấu / chia sẻ / liên kết trang.
Có hai cách để làm điều này:
- Tham số URL (?)
- Hàm chia URL (#)
Giải pháp tốt nhất là hàm URL, vì Google có xu hướng bỏ qua bất kỳ thứ gì sau khi “chia” trong URL.
WP Grid Builder sử dụng các tham số, vậy nên sau khi áp dụng bộ lọc, URL sẽ thay đổi thành giống như nhau:
https://seotoolbelt.co/tools/auditing/?_tool_type=browser-extension
Nếu bạn truy cập vào URL đó, bạn sẽ thấy lưới công cụ đã lọc được cập nhật, nhằm phản ánh các bộ lọc được áp dụng.
Trong trường hợp này, vì tôi đang sử dụng các tham số URL, nên tôi cũng cần thêm một thẻ chuẩn vào phiên bản URL không có tham số, vì vậy URL này:
https://seotoolbelt.co/tools/auditing/
Do các phiên bản tham số này của URL không được liên kết nội bộ và ít có khả năng nhận được các liên kết bên ngoài từ các trang web khác (đây là cách duy nhất để Google phát hiện ra chúng).
Cung cấp các đường dẫn thu thập thông tin thay thế tới các trang quan trọng để tìm kiếm
Ở trong một số trường hợp, phiên bản được lọc của một trang có thể hữu ích cho việc tìm kiếm.
Ví dụ: có các bộ lọc cho ‘Firefox’ và ‘Chrome’ trên trang tiện ích mở rộng trình duyệt SEO của tôi. Cả hai trang này đều có một số tiềm năng tìm kiếm.
Vì vậy, chúng tôi muốn đảm bảo rằng họ đã tạo URL có thể lập chỉ mục. Cách tốt nhất để làm điều đó là đảm bảo bạn có các đường dẫn thu thập thông tin thay thế đến các trang đó. Tôi đã làm điều đó bằng cách thêm các liên kết điều hướng phụ vào các phiên bản có thể lập chỉ mục trên các trang bộ lọc đó ở đầu trang.
Những tập hợp con đó được tạo nên dựa trên các thuộc tính giống nhau, tạo ra phiên bản nhiều mặt của trang và tôi ‘chọn tham gia’ để tạo chúng.
Việc triển khai này đã đạt được một số điều:
- Tôi đã ngăn chặn lãng phí ngân sách thu thập thông tin, vì tôi không liên kết nội bộ tới các trang thuộc khía cạnh.
- Các trang khía cạnh vẫn có thể chia sẻ được, đó là một UX tích cực.
- Nếu một trang khía cạnh có tiềm năng tìm kiếm, tôi có thể chỉnh sửa cho phép lập chỉ mục trang này.
Như bạn có thể thấy, điều này đơn giản hơn đáng kể để quản lý SEO một cách khôn ngoan và không có bất kỳ nhược điểm nào.
Trước đó, tôi đã định vị Faceted Navigation như một thứ chỉ gây ra các biến chứng, ảnh hưởng tới SEO. Tuy nhiên, bạn cũng có thể sử dụng Faceted Navigation như một cách để nhận được nhiều lưu lượng truy cập hơn bằng cách ghép nối nó với chiến lược từ khóa đuôi dài.
Dữ liệu từ Ahrefs cho thấy 99,84% từ khóa nhận được ít hơn 1.000 lượt tìm kiếm mỗi tháng và chiếm 39,33% tổng nhu cầu tìm kiếm:
URL thuộc tính lý tưởng thu hút được lưu lượng truy cập dài, dựa trên cách các khía cạnh tạo ra các phiên bản cụ thể hơn trên các trang nhắm mục tiêu tới các truy vấn rộng hơn.
Đầu tiên, tôi sẽ hướng dẫn các bạn qua các bước để xác định cơ hội nắm bắt nhiều lưu lượng truy cập dài hơn và điều hướng chúng theo từng khía cạnh; sau đó, tôi sẽ giải thích một số cân nhắc trước khi triển khai.
Xác định các biến thể của từ khóa đuôi dài
Để bắt đầu, bạn cần xác định các cơ hội từ khóa với Ahrefs Keyword Explorer. Để thực hiện điều này cũng vô cùng dễ dàng.
Nhập tên danh mục của bạn đã có trên trang web của mình, ví dụ như ‘quần jean cạp cao’.
Đi tới báo cáo ‘Điều khoản phù hợp’.
Sử dụng thanh bên điều khoản và thay đổi thành ‘Parent topics’.
Bằng cách này, công cụ sẽ nhóm tất cả các từ khóa có SERP tương tự lại với nhau. Sau đó, bạn có thể quét danh sách này và chọn ra các trang khía cạnh tiềm năng đáng để có thể được lập chỉ mục. Dưới đây là một số thứ mà tôi đã phát hiện ra khi kiểm tra ảnh chụp màn hình ở trên:
- quần jean ống đứng cạp cao (1.900 lượt tìm kiếm)
- quần jean bó cạp cao (1.800 lượt tìm kiếm)
- quần jean ống rộng cạp cao (1.300 lượt tìm kiếm)
- quần jean ống đứng (970 lượt tìm kiếm)
- quần jean boyfriend lưng cao (700 lượt tìm kiếm)
- quần jean siêu mỏng cạp cao 380 lượt tìm kiếm)
- quần jean trắng lưng cao (360)
Làm cho các trang đó có thể lập chỉ mục
Tiếp theo, chúng ta cần làm cho các trang này có thể thu thập thông tin và được lập chỉ mục với Google.
Điều này có thể hoạt động theo một số cách khác nhau, tùy thuộc vào loại Faceted Navigation của bạn.
Nếu bạn đã triển khai Faceted Navigation, nhưng đây không phải là thiết lập lý tưởng và có liên kết nội bộ tới từng khía cạnh. Đối với các URL này, bạn sẽ cần đảm bảo rằng:
- Thẻ chuẩn là tự tham chiếu.
- Thẻ noindex bị xóa (nếu có).
- Mọi quy tắc không cho phép có liên quan trong robots.txt đều bị xóa (hoặc bạn đã thêm quy tắc cho phép).
- Mọi thuộc tính nofollow trên liên kết nội bộ đều bị xóa (nếu có).
Chính xác những gì mà bạn cần làm ở trên phụ thuộc vào việc triển khai của bạn, quan trọng là các công cụ tìm kiếm có thể thu thập thông tin và lập chỉ mục các trang này.
Bạn sẽ cần tạo một trang danh mục phụ dành cho thiết lập Faceted Navigation lý tưởng được đề cập trước đó.
Bạn sẽ cần làm điều này vì Faceted Navigation không tạo liên kết nội bộ, vì vậy bạn không thể sử dụng nó để tạo các trang này cho mình.
Hầu hết, các nền tảng thương mại điện tử đều hỗ trợ tạo các danh mục phụ, nhưng lý tưởng nhất là bạn muốn có thêm chức năng nhằm tạo cơ sở cho các sản phẩm thuộc danh mục phụ dựa trên phiên bản đã được lọc của danh mục mẹ, chủ yếu là để tiết kiệm việc bán từng danh mục phụ theo cách thủ công. Bằng cách này, bạn sẽ nhận được những lợi ích của việc nhanh chóng tạo ra các trang giống như Faceted Navigation trong khi vẫn tránh được các biến chứng về SEO.
Ví dụ: Nếu tôi đang tạo danh mục phụ ‘quần jean cạp cao’, chúng tôi muốn sử dụng danh sách sản phẩm ‘quần jean cạp cao’ nhưng chỉ hiển thị các sản phẩm cũng áp dụng thuộc tính ‘skinny’.
Tối ưu hóa các URL cho việc tìm kiếm
Đây là một điều hiển nhiên, nhưng bạn sẽ phải thực hiện các tối ưu hóa SEO cơ bản, chả hạn như:
- URL đơn giản, dễ đọc. Ví dụ: URL lý tưởng của bạn phải là / jeans / high-up / skinny / ,chứ không phải / jeans / high-up /?Fit_variant = skinny.
- Các thẻ tiêu đề, mô tả meta được tối ưu hóa.
- Nội dung bằng văn bản độc đáo.
- Thêm URL vào sơ đồ trang XML.
Các biến chứng chính ở đây đều có xu hướng xảy ra với các cấu trúc, trong đó bạn chọn một trang thuộc tính không tham gia vào các kiểm soát lập chỉ mục và thu thập thông tin mặc định tại chỗ.
Điều này đơn giản là vì xét về mặt kỹ thuật, các trang thuộc tính vốn hay thay đổi và không giống như việc tạo ra một danh mục phụ mới.
Chức năng tùy chỉnh sẽ được yêu cầu nhằm đảm bảo có thể thực hiện các tối ưu hóa quan trọng trên các trang với các URL có nhiều khía cạnh.
Tổng kết
Hy vọng rằng sau bài viết này đã giúp các bạn hiểu hơn về Faceted Navigation, chúng không chỉ có những rủi ro cố hữu với SEO mà còn có thể tạo ra những cơ hội quan trọng giúp bạn nhận được nhiều lưu lượng truy cập hơn.
Nếu có bất kỳ câu hỏi thắc mắc gì? Hãy để lại bình luận cho VietMoz Academy ở phía bên dưới nhé!