Google Panda ra mắt lần đầu tiên vào tháng 2 năm 2011 như một phần trong nhiệm vụ của Google nhằm loại bỏ các chiến thuật SEO mũ đen và website spam.
Vào thời điểm đó, những lời phàn nàn của người dùng về tầm ảnh hưởng ngày càng tăng của “content farms” đã phát triển tràn lan. Buộc Google phải có những hành động cụ thể để đánh giá lại chất lượng các nội dung được tìm kiếm trên Google Search.
Và Google Panda ra đời như một biện pháp ngăn chặn các nội dung kém chất lượng được tìm thấy.
Tua nhanh về hiện tại, bây giờ bạn có thể thấy tầm quan trọng của Google Panda như là bước đầu tiên của Google để tập trung vào chất lượng và trải nghiệm người dùng.
Trong bài viết này VietMoz sẽ giúp bạn hiểu được một trong các thuật toán cốt lõi của Google, ảnh hưởng trực tiếp đến thứ hạng website cũng như trải nghiệm khách hàng của bạn là Google Panda.
Google Panda là gì?
Như những gì đã nói ở trên bản cập nhật thuật toán Google Panda là để thúc đẩy cho các trang web chất lượng cao và giảm bớt sự hiện diện của các trang web chất lượng thấp trong kết quả SERPs. Ban đầu nó còn được gọi là “Farmer.” Theo Google, đợt triển khai đầu tiên của Panda trong vài tháng đầu tiên đã ảnh hưởng đến 12% kết quả tìm kiếm bằng tiếng Anh trong khoản 28 bản cập nhật dữ liệu cho Panda từ năm 2011 đến năm 2015.
Tại sao Google tạo Panda
Năm 2010, chất lượng của các kết quả tìm kiếm trên Google ngày càng giảm và sự trỗi dậy của mô hình “content farms” đã trở thành những chủ đề liên tục gây tranh cãi.
Như Amit Singhal của Google sau đó đã nói với Wired tại TED, bản cập nhật “Caffeine” vào cuối năm 2009, giúp thúc đẩy đáng kể khả năng lập chỉ mục nội dung của Google, cũng đã vô tình đưa “một số nội dung không tốt” vào chỉ mục của họ.
Matt Cutts của Google nói với Wired rằng vấn đề nội dung mới này không thực sự là vấn đề spam, mà là một trong những “Mức tối thiểu mà tôi có thể làm đó không phải là spam?”
“Vào cuối năm [2009], hai trong số các content farms này – Demand Media [của eHow infamy] và Answers.com – đã được xếp hạng trong TOP 20 trang web hàng đầu ở Hoa Kỳ theo đánh giá của comScore.
Demand Media là hình ảnh thu nhỏ của trang trại sản xuất nội dung và cho đến nay là ví dụ lớn nhất về “trang trại” này, xuất bản 7.000 mẩu nội dung mỗi ngày… Công ty hoạt động dựa trên một công thức đơn giản: tạo ra rất nhiều thị trường ngách, hầu hết là nội dung không hấp dẫn nhắm mục tiêu đến các công cụ tìm kiếm, sau đó làm cho nó lan truyền thông qua nền tảng social và kiếm tiền thông qua quảng cáo. ”
ReadWriteWeb chỉ ra
Vào tháng 1/2011, Business Insider đã xuất bản một tiêu đề nói lên tất cả: Google’s Search Algorithm Has Been Ruined, Time To Move Back To Curation — Thuật toán tìm kiếm của Google đã bị hủy bỏ, đã đến lúc quay trở lại để xử lý.
Trong một bài báo khác, họ đã chỉ ra:
“Nhu cầu [Media] đang biến thủ thuật thông minh nhất bằng cách chạy một mức giá chênh lệch khổng lồ của hệ sinh thái Google. Yêu cầu hợp đồng với hàng nghìn dịch giả tự do để sản xuất hàng trăm nghìn phần nội dung chất lượng thấp, các chủ đề được chọn theo giá trị tìm kiếm của họ, hầu hết đều do Google thúc đẩy. Vì thuật toán của Google coi trọng nội dung phong phú và liên tục hơn các nội dung chất lượng, nên thuật toán của Google đặt nội dung nhu cầu cao trên các trang kết quả của công cụ tìm kiếm của họ. ”
Không còn nghi ngờ gì nữa, những tiêu đề như thế này đã ảnh hưởng đáng kể đến Google, và động thái từ Google như ta đã biết, công ty đã phản hồi bằng cách phát triển thuật toán Panda.
Thời điểm Google Panda ra mắt
Google Panda được giới thiệu lần đầu tiên vào ngày 23 tháng 2 năm 2011.
Vào ngày 24 tháng 2, Google đã xuất bản một bài đăng trên blog về bản cập nhật và cho biết rằng họ “đã đưa ra một cải tiến thuật toán khá lớn đối với xếp hạng tìm kiếm – một thay đổi ảnh hưởng đáng kể đến 11,8% các truy vấn.”
Mục đích rõ ràng của bản cập nhật như sau:
“Bản cập nhật này được thiết kế để giảm thứ hạng cho các trang web chất lượng thấp – các trang web có giá trị gia tăng thấp cho người dùng, copy nội dung từ các trang web khác hoặc các trang web không hữu ích lắm. Đồng thời, nó sẽ cung cấp thứ hạng tốt hơn cho các trang chất lượng cao – các trang có nội dung và thông tin gốc như nghiên cứu, báo cáo chuyên sâu, phân tích chu đáo, v.v. ”
Google nói về Panda
Danny Sullivan, người sáng lập Search Engine Land, ban đầu gọi nó là bản cập nhật “Farmer”. Tuy nhiên, Google sau đó đã tiết lộ rằng trong nội bộ nó được gọi là “Panda”, tên của kỹ sư đã đưa ra bước đột phá thuật toán chính.
Các phân tích của SearchMetrics và SISTRIX (trong số những người khác) về “kẻ thắng người thua” cho thấy rằng các trang web bị ảnh hưởng nặng nề nhất đã khá quen thuộc với bất kỳ ai làm trong ngành SEO vào thời điểm đó.
Các trang web này bao gồm Wisdomgeek.com, ezinearticles.com, suite101.com, hubpages.com, buzzle.com, articlebase.com, v.v.
Đáng chú ý, các trang web nội dung eHow và wikiHow đã hoạt động tốt hơn sau bản cập nhật. Các bản cập nhật sau đó cũng sẽ làm tổn hại đến các trang trại nội dung, với việc Demand Media đã lỗ 6,4 triệu đô la trong quý 4 năm 2012.
Sự thay đổi rõ ràng nhất trong ngành SEO là nó ảnh hưởng nặng nề như thế nào đến “tiếp thị bài viết”, trong đó những người làm SEO thường xuất bản các bài viết chất lượng thấp trên các trang web như ezinearticles.com như một hình thức xây dựng liên kết.
Cũng rõ ràng rằng các trang web bị tấn công nhiều nhất có thiết kế kém hấp dẫn, chứa nhiều quảng cáo, spam keyword, tiêu chuẩn biên tập thấp, nghiên cứu thiếu sót và nhìn chung không hữu ích hoặc đáng tin cậy.
Những gì chúng ta biết về thuật toán Panda
Khi Google thảo luận về sự phát triển của thuật toán với Wired, Singhal nói rằng họ đã bắt đầu bằng cách gửi tài liệu thử nghiệm cho những người đánh giá chất lượng là con người, họ được hỏi những câu hỏi như “Bạn có thoải mái khi đưa cho trang web này thẻ tín dụng của mình không? Bạn có cảm thấy thoải mái khi đưa thuốc do trang web này kê cho con bạn không? ”
Cutts cho biết kỹ sư đã phát triển “một bộ câu hỏi nghiêm ngặt, tất cả mọi thứ. ‘Bạn có coi trang web này là có thẩm quyền không? Nó có ổn không nếu cái này là trong một tạp chí? Trang web này có quá nhiều quảng cáo không? ‘”
Theo cuộc phỏng vấn, sau đó họ đã phát triển thuật toán bằng cách so sánh các tín hiệu xếp hạng khác nhau với xếp hạng chất lượng của con người.
Singhal mô tả nó giống như việc tìm thấy một chiếc máy bay trong vùng siêu không gian ngăn cách các trang web tốt và xấu.
Sau đó, Singhal đã đưa ra 23 câu hỏi sau đây dưới dạng các câu hỏi hướng dẫn mà thuật toán Panda dựa trên:
- Bạn có tin tưởng vào nội dung được trình bày trong bài viết này không?
- Tác giả bài viết này có phải là một chuyên gia hoặc người có hiểu biết sâu sắc về chủ đề này không, hay bài viết chỉ có nội dung hời hợt?
- Trang web này có các bài viết trùng lặp, chồng chéo hay dư thừa về các chủ đề giống hệt hoặc tương tự nhau (chỉ có khác biệt nhỏ về từ khoá) không?
- Bạn có yên tâm nếu phải cung cấp thông tin thẻ tín dụng cho trang web này không?
- Bài viết này có lỗi chính tả, lỗi hành văn hay sai dữ kiện không?
- Trang web này có các chủ đề xuất phát từ mối quan tâm thực sự của người đọc hay là chỉ tạo nội dung dựa trên suy đoán rằng nội dung này có thể đạt thứ hạng cao trong công cụ tìm kiếm?
- Bài viết này có cung cấp nội dung hay thông tin nguyên gốc, báo cáo nguyên gốc, nghiên cứu nguyên gốc hay phân tích nguyên gốc không?
- Trang này có đem lại giá trị đáng kể so với các trang khác trong kết quả tìm kiếm không?
- Khâu quản lý chất lượng nội dung chặt chẽ đến mức nào?
- Bài viết này có mô tả cả hai mặt của một vấn đề không?
- Trang web này có phải là nguồn tin có uy tín về chủ đề trên trang không?
- Nội dung có phải được sản xuất hàng loạt hoặc được giao cho nhiều người viết bên ngoài không? Hay nội dung này có dàn trải trên một mạng lưới lớn gồm nhiều trang web, khiến cho mỗi trang/trang web riêng lẻ không được chú ý hay chăm chút cẩn thận không?
- Bài viết này được biên tập cẩn thận hay trông có vẻ như viết vội và cẩu thả?
- Khi tìm kiếm thông tin liên quan đến sức khỏe, liệu bạn có tin tưởng thông tin của trang web này không?
- Bạn có công nhận trang web này là nguồn tin có uy tín khi nhắc đến tên trang web không?
- Bài viết này có trình bày hoàn chỉnh hay toàn diện về chủ đề đang nói đến không?
- Bài viết này có chứa nội dung phân tích chi tiết hay thông tin thú vị ngoài những điều hiển nhiên không?
- Đây có phải là loại trang mà bạn muốn đánh dấu, chia sẻ với bạn bè hay gợi ý cho người khác không?
- Bài viết này có quá nhiều quảng cáo gây mất tập trung hay xen vào nội dung chính không?
- Bạn có nghĩ bài viết này có thể xuất hiện trong một ấn phẩm như tạp chí, sách hay bách khoa toàn thư không?
- Các bài viết có quá ngắn, không có nội dung gì mấy hay thiếu thông tin cụ thể hữu ích không?
- Các trang được tạo ra một cách cẩn thận và tỉ mỉ hay ngược lại?
- Liệu người dùng có phàn nàn khi họ xem các trang trên trang web này không?
Ngoài ra trích dẫn về nội dung chất lượng thấp này rất quan trọng:
Hãy xem xét ví dụ này: Hầu hết học sinh phải viết bài cho trường trung học hoặc đại học. Nhiều sinh viên sử dụng các phím tắt để tiết kiệm thời gian và công sức bằng cách thực hiện một hoặc nhiều thao tác sau:
- Mua bài viết trực tuyến hoặc nhờ người khác viết hộ.
- Viết nhanh chóng, không có bản nháp hoặc chỉnh sửa.
- Làm đầy bản báo cáo bằng những bức tranh lớn hoặc những nội dung gây mất tập trung khác.
- Sao chép toàn bộ báo cáo từ một bách khoa toàn thư hoặc diễn giải nội dung bằng cách thay đổi từ hoặc cấu trúc câu ở đây và ở đó.
- Ví dụ, sử dụng các sự kiện đã được biết đến, “Argentina là một quốc gia. Những người sống ở Argentina. Argentina có biên giới. ”
- Sử dụng nhiều từ để chỉ những ý tưởng hoặc sự kiện cơ bản, chẳng hạn như “Gấu trúc ăn tre. Gấu trúc ăn rất nhiều tre. Tre là thức ăn tốt nhất cho gấu Panda ”.
Vào tháng 3 năm 2011, SEO By The Sea đã xác định Biswanath Panda là kỹ sư có khả năng đứng sau sự phát triển của thuật toán Google Panda.
Trong một bài báo, Biswanath đã giúp tác giả trình bày chi tiết cách các thuật toán máy học có thể được sử dụng để phân loại chính xác về hành vi của người dùng trên các trang đích.
Trong khi bài báo không nói về thuật toán Panda, tác giả chỉ gợi ý rằng Panda cũng là một thuật toán máy học.
Hầu hết trong ngành SEO đều kết luận rằng Panda hoạt động bằng cách sử dụng máy học để đưa ra dự đoán chính xác về cách con người đánh giá chất lượng nội dung. Điều kém rõ ràng hơn là những tín hiệu nào sẽ được kết hợp vào thuật toán Panda để xác định trang web nào có chất lượng cao và trang nào không chất lượng.
9 nguyên nhân khiến website bị dính phạt Panda
Bản cập nhật thuật toán Panda đã giải quyết một số hiện tượng có vấn đề trong Google SERPs, bao gồm:
- Nội dung mỏng – Các trang có rất ít văn bản và tài nguyên có liên quan hoặc nội dung, chẳng hạn như một tập hợp các trang mô tả nhiều tình trạng sức khỏe với chỉ một vài câu xuất hiện trên mỗi trang.
- Nội dung trùng lặp – Nội dung được sao chép xuất hiện trên Internet ở nhiều nơi. Các vấn đề về nội dung trùng lặp cũng có thể xảy ra trên trang web của bạn khi bạn có nhiều trang có cùng một nội dung với ít hoặc không có biến thể. Ví dụ: một công ty sản xuất bánh kẹo 10 trang, mỗi trang cho mỗi thành phố mà doanh nghiệp phục vụ, với nội dung gần giống nhau trên tất cả các trang chỉ có tên thành phố được hoán đổi.
- Nội dung chất lượng thấp – Các trang cung cấp quá ít hoặc không cung cấp giá trị cho người đọc vì thông tin thiếu chuyên sâu.
- Thiếu thẩm quyền / đáng tin cậy – Nội dung được tạo bởi các nguồn không được coi là chính xác hoặc đã được xác minh. Một đại diện của Google tuyên bố rằng các trang web nhằm mục đích tránh tác động của Panda nên hoạt động để được công nhận là cơ quan có thẩm quyền về chủ đề của họ và các tổ chức mà người dùng cảm thấy thoải mái khi cung cấp thông tin thẻ tín dụng của họ.
- Content farming – Số lượng lớn các trang chất lượng thấp, thường được tổng hợp từ các trang web khác. Ví dụ: một trang web content farm có thể là một trang web sử dụng nhiều nhà văn với mức lương thấp để tạo các bài báo ngắn bao gồm nhiều loại truy vấn của công cụ tìm kiếm, tạo ra một phần nội dung thiếu thẩm quyền và giá trị đối với người đọc vì mục đích cốt lõi của nó chỉ đơn giản là để đạt được thứ hạng của công cụ tìm kiếm cho mọi thuật ngữ có thể hình dung được.
- Nội dung chất lượng thấp do người dùng tạo (UGC) – Ví dụ về loại Nội dung do người dùng tạo có giá trị thấp này sẽ là một blog xuất bản các bài đăng trên blog của khách, chúng ngắn, đầy lỗi chính tả, ngữ pháp và thiếu các thông tin có thẩm quyền.
- Tỷ lệ quảng cáo trên nội dung cao – Các trang được đặt quá nhiều quảng cáo ảnh hưởng trải nghiệm đọc của người dùng.
- Trang web bị người dùng chặn – Các trang web mà người dùng đang chặn trực tiếp trong kết quả của công cụ tìm kiếm hoặc bằng cách sử dụng tiện ích mở rộng của trình duyệt để làm như vậy, cho thấy chất lượng web rất thấp.
- Nội dung không khớp với truy vấn tìm kiếm – Các trang “hứa” cung cấp câu trả lời có liên quan nếu được nhấp vào trong kết quả tìm kiếm, nhưng sau đó không thực hiện được. Ví dụ: một trang web có thể có tiêu đề “Phiếu giảm giá cho Whole Foods”, nhưng khi nhấp vào, có thể không có phiếu giảm giá hoặc có thể chỉ có một trang quảng cáo, dẫn đến sự thất vọng.
Google Panda và E-A-T
Vào năm 2014, Google đã đưa ra các nguyên tắc E-A-T trong nguyên tắc về chất lượng tìm kiếm của mình, tập trung vào Chuyên môn, Quyền hạn và Mức độ tin cậy.
Kể từ năm 2018, những nguyên tắc này ngày càng trở thành trọng tâm đối với các nhà tiếp thị.
Giống như Google Panda, các bản cập nhật và các thay đổi thuật toán cốt lõi tập trung vào chất lượng nội dung và trải nghiệm người dùng.
Và giống như Panda, trọng tâm là tránh:
- Nội dung mỏng và không mang tính thông tin.
- Thiếu nguồn có thẩm quyền.
- Nội dung không đáng tin cậy và các liên kết có vấn đề.
Làm thế nào để nhận biết Google Panda
Một dấu hiệu cho thấy khả năng trang web bị Google Panda phạt là lưu lượng truy cập trên trang web của bạn hoặc thứ hạng trên công cụ tìm kiếm giảm đột ngột tương ứng với ngày cập nhật thuật toán đã biết.
Tuy nhiên, điều quan trọng cần lưu ý là vẫn còn nhiều thứ có thể dẫn đến mất thứ hạng và lưu lượng truy cập. Chúng bao gồm sự gia tăng của đối thủ cạnh tranh trong thị trường của bạn, các hình phạt thủ công (kiểm tra Google Search Console để biết các vấn đề được báo cáo), mức độ quan tâm của người tiêu dùng dự kiến giảm theo mùa, hoặc thậm chí là một bản cập nhật hoàn toàn khác của Google (ví dụ: Penguin thay vì Panda).
Nếu bạn tin rằng mình đã tìm thấy mối tương quan giữa các hoạt động không tốt trên website với thuật toán, hãy hành động để khắc phục tình hình.
Bạn vẫn không chắc liệu mình có bị phạt hay không? Kiểm tra lưu đồ tiện lợi này:
Cách khắc phục website khi dính Google Panda
Con đường để phục hồi từ Panda có thể vừa đơn giản mà cũng đầy thử thách.
Vì Panda tăng hiệu suất của các trang web có nội dung mà nó phân loại là có chất lượng cao, nên giải pháp là tăng chất lượng và tính độc đáo cho nội dung của bạn.
Mặc dù nói thì dễ hơn làm, nhưng nó đã được chứng minh nhiều lần rằng đây chính xác là những gì cần thiết để phục hồi.
Alan Bleiweiss đã giúp một trang web phục hồi bằng cách hỗ trợ họ viết lại nội dung trên 100 trang.
WiredSEO đã giúp một trang web phục hồi từ Panda bằng cách thay đổi các nguyên tắc nội dung do người dùng tạo của họ để khuyến khích các bios cụ thể, độc đáo hơn là các bios được sao chép từ các trang khác. Người dùng của trang web trước đây đã sử dụng bios từ các trang web khác của họ. Tuy nhiên, WiredSEO khuyến khích họ thay đổi tiểu sử để đặt các câu hỏi cụ thể, dẫn đến tiểu sử độc đáo không trùng lặp.
Trong ngành công nghiệp SEO, Panda thường được coi là một hình phạt rất khó khôi phục. Tuy nhiên, do thuật toán Panda chủ yếu phụ thuộc vào chất lượng trang web / nội dung, các bước để khôi phục thường quay lại với vấn đề cải thiện chất lượng đó. Các hành động khắc phục hậu quả cần thực hiện bao gồm:
- Từ bỏ các phương thức content farming.
- Thực hiện Audit Content tập trung vào tính hữu ích, mức độ liên quan, độ tin cậy và quyền hạn.
- Sửa đổi tỷ lệ quảng cáo/ nội dung hoặc affiliate/ content để các trang không bị chi phối bởi quảng cáo hoặc liên kết affiliate.
- Đảm bảo rằng nội dung của một trang nhất định phù hợp với truy vấn của người dùng.
- Loại bỏ hoặc audit các nội dung trùng lặp.
- Kiểm tra và chỉnh sửa cẩn thận nội dung do người dùng tạo và đảm bảo rằng nội dung đó là nguyên bản, không có lỗi và hữu ích cho người đọc (nếu có).
- Sử dụng lệnh Robots noindex, nofollow để chặn lập chỉ mục nội dung trang web nội bộ trùng lặp hoặc gần trùng lặp hoặc các yếu tố có vấn đề khác.
Tóm lại, các trang web liên tục xuất bản nội dung nguyên bản, chất lượng cao ít phải lo sợ về thuật toán này, nhưng nếu trang web của bạn có các hoạt động có vấn đề về nội dung, nó có thể đã bị Panda tấn công vào một thời điểm nào đó.
Từ quan điểm kinh doanh, thực tế, hy vọng tốt nhất của bạn để tránh Panda là phát triển một thương hiệu được công nhận rằng có thẩm quyền trong lĩnh vực của nó và xây dựng một trang web trở thành một nguồn đáng tin cậy.
Những lầm tưởng về thuật toán Google Panda
Panda không nói về nội dung trùng lặp
Lầm tưởng phổ biến nhất về Google Panda là nói về nội dung trùng lặp. John Mueller đã làm rõ rằng nội dung trùng lặp là độc lập với Panda. Các nhân viên của Google đã nhấn mạnh rằng Panda khuyến khích nội dung độc đáo , nhưng điều này còn đi sâu hơn là tránh trùng lặp. Những gì Panda đang tìm kiếm là thông tin thực sự độc đáo cung cấp giá trị vượt trội cho người dùng.
Tương tự như vậy, Mueller đã nói với một blogger rằng việc loại bỏ các bản sao kỹ thuật thực sự là một ưu tiên rất thấp và thay vào đó, họ nên “nghĩ về điều gì làm cho trang web của bạn khác biệt so với trang web hàng đầu tuyệt đối trong thị trường ngách của bạn”.
Vào năm 2021, John Mueller của Google giải thích rằng nội dung trùng lặp không phải là một yếu tố xếp hạng tiêu cực.
Bạn có nên xóa nội dung để giải quyết vấn đề của Google Panda không?
Vào năm 2017, Gary Illyes của Google đã nói trên Twitter : “Chúng tôi khuyên bạn không nên xóa nội dung nói chung khi dính Panda, thay vào đó hãy thêm nhiều nội dung HighQ hơn”.
“Nhìn chung, chất lượng của trang web cần được cải thiện đáng kể để chúng tôi có thể tin tưởng vào nội dung. Đôi khi những gì chúng ta thấy với một trang web như vậy sẽ có rất nhiều nội dung mỏng, có thể có nội dung bạn đang tổng hợp từ các nguồn khác, có thể có nội dung do người dùng tạo, nơi mọi người gửi bài viết có chất lượng thấp và đó là tất cả những thứ bạn có thể muốn xem và nói tôi có thể làm gì; mặt khác, nếu tôi muốn giữ những bài báo này, có thể ngăn chúng xuất hiện trong tìm kiếm. Có thể sử dụng thẻ noindex cho những thứ này. ”
John Mueller cũng nói trong video
Phản ứng của Google luôn là ngăn lập chỉ mục hoặc cải thiện nội dung – không bao giờ cắt hoàn toàn trừ khi làm như vậy là một động thái xây dựng thương hiệu.
Nói chung, việc xóa nội dung nên được cân nhắc về mặt thương hiệu tổng thể của trang web của bạn, thay vì một động thái sẽ xóa bỏ hình phạt Panda.
Google Panda & Nội dung do Người dùng Tạo
Google Panda không nhắm mục tiêu cụ thể đến nội dung do người dùng tạo. Mặc dù Panda có thể nhắm mục tiêu đến nội dung do người dùng tạo, nhưng nó có xu hướng ảnh hưởng đến các trang web sản xuất nội dung chất lượng thấp – chẳng hạn như các bài đăng spam của khách hoặc các diễn đàn chứa đầy spam.
Không xóa nội dung do người dùng tạo của bạn, cho dù đó là trên diễn đàn, bình luận blog hoặc ý kiến đóng góp bài viết, đơn giản vì bạn nghe nói rằng nó là “xấu” hoặc được giới thiệu như một giải pháp “Panda proof”. Thay vào đó hãy nhìn nó từ góc độ chất lượng.
Nhiều trang web xếp hạng cao dựa vào nội dung do người dùng tạo – vì vậy nhiều trang web sẽ mất lưu lượng truy cập và xếp hạng đáng kể chỉ vì họ đã xóa loại nội dung đó. Ngay cả những nhận xét được đưa ra trên một bài đăng blog cũng có thể khiến nó được xếp hạng và thậm chí có được một đoạn trích nổi bật.
Số từ không phải là một yếu tố
Số lượng từ là một khía cạnh khác của Panda mà các chuyên gia SEO thường hiểu nhầm. Nhiều trang web mắc sai lầm khi từ chối xuất bản bất kỳ nội dung nào trừ khi nội dung đó vượt quá số từ nhất định, với 250 từ và 350 từ thường được trích dẫn. Thay vào đó, Google khuyên bạn nên suy nghĩ về số lượng từ mà nội dung cần để thành công đối với người dùng.
Ví dụ: Có rất nhiều trang có rất ít nội dung chính, nhưng Google cho rằng trang đó đủ chất lượng để kiếm được đoạn trích nổi bật cho truy vấn. Trong một trường hợp, nội dung chính chỉ vỏn vẹn 63 từ và nhiều người sẽ khó viết về chủ đề này theo cách không spam với độ dài hơn 350 từ. Vì vậy, bạn chỉ cần đủ từ để trả lời truy vấn.
Affiliate links & Quảng cáo không được nhắm mục tiêu trực tiếp
Các trang web Affiliate và các trang web “được tạo cho AdSense” thường bị Google Panda tấn công nhiều hơn các trang web khác, nhưng điều này không phải vì nó nhắm mục tiêu cụ thể đến chúng. Người phát ngôn của Google nói với TheSEMPost rằng
“Một ví dụ điển hình là khi chức năng chính của trang web là đưa người dùng đến các trang web khác thông qua quảng cáo hoặc liên kết affiliate, nội dung có sẵn trên internet hoặc được sản xuất vội vàng và được xây dựng rõ ràng để thu hút khách truy cập từ các công cụ tìm kiếm.”
Mueller nói tiếp :
“Nhưng đồng thời, chúng tôi thấy rất nhiều người làm affiliate về cơ bản chỉ là những người lười biếng sao chép và dán các nguồn cấp dữ liệu mà họ nhận được và xuất bản chúng trên trang web của họ. Và các loại nội dung chất lượng thấp hơn, nội dung mỏng, là thứ thực sự khó để chúng tôi hiển thị trong tìm kiếm. ”
Nói cách khác, những trang web này đang bị tấn công vì những lý do tương tự: chúng không cung cấp nội dung hấp dẫn, độc đáo, hấp dẫn.
Các bản Update Google Panda qua các thời kỳ
Google Panda gần như chắc chắn là thuật toán có hồ sơ công khai rộng rãi nhất về các ngày công khai cho các bản cập nhật liên quan của nó. Một phần lý do của việc này là do Panda được chạy bên ngoài từ thuật toán cốt lõi của Google và kết quả là điểm số nội dung chỉ bị ảnh hưởng vào hoặc gần ngày cập nhật Panda mới.
Điều này tiếp tục cho đến ngày 11 tháng 6 năm 2013, khi Cutts trả lời tại SMX Advanced rằng, mặc dù Panda không được tích hợp trực tiếp vào thuật toán cốt lõi của Google, nhưng dữ liệu của nó được cập nhật hàng tháng và triển khai chậm trong suốt tháng, chứ không tác động đột ngột trên toàn ngành với các bản cập nhật Panda.
Quy ước đánh số hơi khó hiểu.
Người ta mong đợi các bản cập nhật cốt lõi cho thuật toán của Panda sẽ tương ứng với 1.0, 2.0, 3.0 và 4.0, nhưng không có bản cập nhật nào được gọi là 3.0 và 3.1 không phải là bản cập nhật cốt lõi cho thuật toán Panda.
Làm mới dữ liệu, cập nhật kết quả tìm kiếm chứ không phải chính thuật toán Panda, thường được đánh số như bạn mong đợi đối với các bản cập nhật phần mềm (3.2, 3.4, 3.5, v.v.). Tuy nhiên, có quá nhiều lần làm mới dữ liệu cho phiên bản 3 của thuật toán, trong một thời gian, quy ước đặt tên này đã bị bỏ qua và ngành công nghiệp gọi chúng chỉ đơn giản bằng tổng số bản cập nhật Panda (cả bản làm mới và bản cập nhật cốt lõi).
Ngay cả sau khi xử lý được quy ước đặt tên này, vẫn không hoàn toàn rõ ràng liệu tất cả các bản cập nhật Panda nhỏ chỉ là làm mới dữ liệu hay một số trong số chúng cũng kết hợp các tín hiệu mới.
Bất kể, dòng thời gian của các bản cập nhật Panda, ít nhất, cũng được biết đến và như sau:
- 1.0 : Ngày 23 tháng 2 năm 2011. Lần lặp lại đầu tiên của bản cập nhật thuật toán chưa được đặt tên khi đó đã được giới thiệu (12% số truy vấn bị ảnh hưởng), gây sốc cho ngành công nghiệp tối ưu hóa công cụ tìm kiếm, nhiều công ty lớn và kết thúc hiệu quả mô hình kinh doanh “trang trại nội dung” như nó tồn tại vào thời điểm đó.
- 2.0 (# 2) : Ngày 11 tháng 4 năm 2011. Bản cập nhật đầu tiên cho thuật toán Panda lõi. Bản cập nhật này kết hợp các tín hiệu bổ sung, chẳng hạn như các trang web mà người dùng Google đã chặn.
- 2.1 (# 3) : Ngày 9 tháng 5 năm 2011. Đầu tiên trong ngành gọi đây là Panda 3.0, nhưng Google đã làm rõ ràng đó chỉ là một bản làm mới dữ liệu, cũng như các bản cập nhật 2.x sắp tới.
- 2.2 (# 4) : Ngày 21 tháng 6 năm 2011
- 2.3 (# 5) : Ngày 23 tháng 7 năm 2011
- 2.4 (# 6) International: Ngày 12 tháng 8 năm 2011. Panda được triển khai trên toàn thế giới cho tất cả các quốc gia nói tiếng Anh và các quốc gia không nói tiếng Anh, ngoại trừ Nhật Bản, Trung Quốc và Hàn Quốc.
- 2.5 (# 7) và Panda-Related Flux : 28 tháng 9 năm 2011. Sau bản cập nhật này, vào ngày 5 tháng 10 năm 2011, Cutts thông báo “mong đợi một số thông lượng liên quan đến Panda trong vài tuần tới”. Ngày thông lượng được xác nhận là ngày 3 tháng 10 và ngày 13 tháng 10.
- 3.0 (# 8): Ngày 19 tháng 10 năm 2011. Google đã thêm một số tín hiệu mới vào thuật toán Panda và cũng tính toán lại cách thuật toán ảnh hưởng đến các trang web.
- 3.1 (# 9): Ngày 18 tháng 11 năm 2011. Google đã công bố một đợt làm mới nhỏ, tác động đến ít hơn 1 phần trăm tìm kiếm.
- 3.2 (# 10) : Ngày 18 tháng 1 năm 2012. Google xác nhận việc làm mới dữ liệu đã xảy ra vào ngày này.
- 3.3 (# 11) : Ngày 23 tháng 2 năm 2012. Làm mới dữ liệu.
- 3.4 (# 12) : Ngày 23 tháng 3 năm 2012
- 3.5 (# 13) : Ngày 19 tháng 4 năm 2012
- 3.6 (# 14) : Ngày 27 tháng 4 năm 2012
- 3.7 (# 15) : Ngày 8 tháng 6 năm 2012. Việc làm mới dữ liệu mà các công cụ xếp hạng đề xuất là gây ảnh hưởng nặng nề hơn so với các bản cập nhật gần đây khác.
- 3.8 (# 16) : Ngày 25 tháng 6 năm 2012
- 3.9 (# 17) : Ngày 24 tháng 7 năm 2012
- 3.9.1 (# 18) : Ngày 20 tháng 8 năm 2012. Một bản cập nhật tương đối nhỏ đánh dấu sự khởi đầu của quy ước đặt tên mới do ngành chỉ định.
- 3.9.2 (# 19) : 18 tháng 9 năm 2012
- # 20 : Ngày 27 tháng 9 năm 2012. Một bản cập nhật Panda tương đối lớn cũng đánh dấu sự khởi đầu của một quy ước đặt tên khác. Ngành công nghiệp đã nhận ra sự lúng túng của quy ước đặt tên 9.xx và nhận ra rằng các bản cập nhật cho cái mà họ gọi là Panda 3.0 có thể tiếp tục xảy ra trong một thời gian rất dài.
- # 21 : Ngày 5 tháng 11 năm 2012
- # 22 : Ngày 21 tháng 11 năm 2012
- # 23 : Ngày 21 tháng 12 năm 2012. Làm mới dữ liệu có tác động hơn một chút.
- # 24 : Ngày 22 tháng 1 năm 2013
- # 25 : Ngày 14 tháng 3 năm 2013. Bản cập nhật này đã được thông báo trước và các công cụ cho rằng nó xảy ra vào khoảng ngày này. Cutts dường như gợi ý rằng đây sẽ là bản cập nhật cuối cùng trước khi Panda được tích hợp trực tiếp vào thuật toán Google. Tuy nhiên, sau đó rõ ràng rằng đây không phải là những gì đang xảy ra.
- “Dance” : Ngày 11 tháng 6 năm 2013. Đây không phải là ngày cập nhật. Tuy nhiên, ngày Cutts đã làm rõ Panda sẽ không được tích hợp trực tiếp vào thuật toán, mà là nó sẽ cập nhật hàng tháng với các đợt phát hành chậm hơn nhiều, thay vì làm mới dữ liệu đột ngột như trước đây.
- “Phục hồi” : Ngày 18 tháng 7 năm 2013. Bản cập nhật này dường như là một sự điều chỉnh để sửa một số hoạt động quá khắc nghiệt của Panda.
- 4.0 (# 26) : Ngày 19 tháng 5 năm 2014. Một bản cập nhật Panda lớn (tác động đến 7,5 phần trăm truy vấn) đã xảy ra vào ngày này. Hầu hết trong ngành tin rằng đây là một bản cập nhật cho thuật toán Panda, không chỉ là một bản làm mới dữ liệu, đặc biệt là theo tuyên bố của Cutts về việc triển khai chậm.
- 4.1 (# 27) : Ngày 23 tháng 9 năm 2014. Một bản cập nhật lớn khác (tác động từ 3 đến 5 phần trăm các truy vấn) bao gồm một số thay đổi đối với thuật toán Panda. Do quá trình phát hành chậm nên ngày chính xác vẫn chưa rõ ràng, nhưng thông báo được đưa ra vào ngày 25 tháng 9.
- 4.2 (# 28) : Ngày 17 tháng 7 năm 2015. Google đã công bố bản cập nhật Panda sẽ mất vài tháng để triển khai. Do tính chất chậm của quá trình triển khai, không rõ mức độ tác động đáng kể hoặc chính xác thời điểm nó xảy ra. Đây là bản cập nhật Panda cuối cùng được xác nhận.
- Kết hợp thuật toán cốt lõi : Ngày 11 tháng 1 năm 2016. Google xác nhận rằng Panda đã được kết hợp vào thuật toán cốt lõi của Google , rõ ràng là một phần của quá trình triển khai chậm chạp vào ngày 17 tháng 7 năm 2015. Nói cách khác, Panda không còn là một bộ lọc được áp dụng cho thuật toán Google sau khi nó hoạt động mà được kết hợp như một tín hiệu xếp hạng cốt lõi khác của nó. Tuy nhiên, người ta đã làm rõ rằng điều này không có nghĩa là trình phân loại Panda hoạt động trong thời gian thực.
Google Panda 2021
Google Panda hiện đã được kết hợp vào các thuật toán máy học của Google và do đó, các bản cập nhật liên quan đến Panda sẽ không được coi là độc lập.
Với việc Panda trở thành một phần trong thuật toán cốt lõi của Google, chúng ta không còn thấy các bản cập nhật Google Panda riêng biệt nữa. Các cập nhật thuật toán cốt lõi – đặc biệt là những cập nhật tập trung vào chất lượng và nội dung – về mặt lý thuyết sẽ có liên quan đến ‘Panda’.
Công cụ hỗ trợ sửa phạt thuật toán Google Panda
Copy Scape
Copy Scape là công cụ giúp người làm SEO kiểm tra đạo văn, cũng như mức độ trùng lặp nội dung trên internet. Với công cụ này bạn hoàn toàn có thể sử dụng miễn phí. Nhiệm vụ của bạn chỉ cần dán tên trang web bạn muốn check như hình dưới:
Lúc này công cụ sẽ trả cho bạn kết quả những trang đang có nội dung trùng lặp với trang web của bạn. Và bạn tập trung chỉnh sửa lại những nội dung mà trang bạn đang bị copy.
Lưu ý: Để check đầy đủ URL trên 1 trang web nhất định, bạn sẽ cần trả một khoản phí.
Siteliner
Tương tự với những chức năng công cụ Copy Scape, Siteliner cũng giúp bạn tìm nội dung copy dựa trên gốc domain của bạn. Có 1 điểm khác của công cụ này đó là báo cho bạn chỉ số phần trăm giống nhau giữa các bài.
Lời kết
Tại thời điểm hiện tại hay là trong tương lai, bạn nên ghi nhớ những khái niệm cốt lõi của Google Panda. Tránh các chiến thuật SEO mũ đen và liên kết spam và tập trung vào nội dung chất lượng cho người dùng và trải nghiệm của họ.
Tên Google Panda có thể không xuất hiện trong thông báo của các bản cập nhật, nhưng các nguyên tắc của Panda vẫn còn phù hợp cho đến ngày nay và cả sau này.
Tài liệu được sử dụng trong bài:
- Hướng dẫn thêm về việc xây dựng trang web chất lượng cao
- Google Panda
- A Complete Guide to the Google Panda Update: 2011-21
- Google Panda (Moz)
Nguồn: vietmoz.edu.vn
Bản quyền thuộc về Đào tạo SEO VietMoz
Vui lòng không copy khi chưa được sự đồng ý của tác giả