Soft 404 ใน SEO คืออะไร?

เผยแพร่แล้ว: 2022-02-17

Soft 404 ไม่ใช่รหัสสถานะ HTTP อย่างเป็นทางการ แต่เป็นอัลกอริธึมขั้นสูงที่ช่วยให้ Google ตรวจพบว่าหน้านั้นไม่มีอยู่จริง หรือไม่ (หรือมีเนื้อหาเพียงเล็กน้อยหรือไม่มีเลย) แม้ว่ารหัสสถานะ HTTP จะไม่ระบุก็ตาม  

อย่างไรก็ตาม อัลกอริทึมไม่ได้สมบูรณ์แบบ และ Google อาจทำผิดพลาดขณะจัดประเภทหน้า

ไม่ว่าเหตุผลสำหรับ soft 404 จะส่งผลเสียต่อเว็บไซต์ของคุณและลดการมองเห็นของคุณในการค้นหาทั่วไป

จากบทความนี้ คุณจะได้เรียนรู้ว่า soft 404s ส่งผลต่อไซต์ของคุณอย่างไร อะไรเป็นสาเหตุ และสิ่งที่คุณสามารถแก้ไขได้

เนื้อหา ซ่อน
1 ซอฟต์ 404 คืออะไร?
2 Soft 404 ส่งผลต่อเว็บไซต์ของคุณอย่างไร
3 คุณจะตรวจจับ soft 404 ได้อย่างไร?
3.1 การตรวจจับ Soft 404 บนมือถือเทียบกับเดสก์ท็อป
4 สิ่งที่อาจทำให้เกิดซอฟต์ 404 และวิธีแก้ไข
4.1 404 หน้าตอบสนองด้วย 200 รหัสสถานะ HTTP
4.2 การเปลี่ยนเส้นทางที่ไม่เกี่ยวข้อง
4.3 หน้าที่มีเนื้อหาน้อยหรือไม่มีเลย
4.4 หน้าที่มีคำเหมือน 404
4.5 ปัญหาการแสดงผล
5 บทสรุป

ซอฟต์ 404 คืออะไร?

เซิร์ฟเวอร์สื่อสารกับไคลเอนต์ (เช่น เบราว์เซอร์หรือบอทของเครื่องมือค้นหา) ผ่านรหัสสถานะ HTTP

หากคำขอหน้าสำเร็จ เซิร์ฟเวอร์จะส่งคืนรหัสสถานะ HTTP 200 หากหน้าหายไป เซิร์ฟเวอร์ตอบสนองด้วยสถานะ 404 (ไม่พบ)

เมื่อผู้ใช้ร้องขอหน้าที่ไม่มีอยู่ พวกเขาเห็นข้อความในเบราว์เซอร์ที่ระบุว่ามีบางอย่างผิดพลาด อย่างไรก็ตาม ข้อความที่เบราว์เซอร์แสดงไม่สอดคล้องกับรหัสสถานะ HTTP เสมอไป

นั่นคือสิ่งที่ soft 404 เข้ามาเล่น

Soft 404 เป็นป้ายกำกับที่ Google ให้หน้าเว็บเมื่อดูเหมือนว่าไม่มีหน้านั้นอยู่ และในขณะเดียวกันก็ส่งคืนรหัสสถานะ HTTP 200 ที่ประสบความสำเร็จ

หาก Google ตัดสินว่าหน้าใดเป็น Soft 404 จะทำให้การรวบรวมข้อมูลช้าลง

หากเราเห็นว่า [หน้าหนึ่ง] เป็น soft 404 ก็จะเหมือนกับ 404 และเราจะชะลอการรวบรวมข้อมูลของ URL นั้น ๆ เนื่องจากไม่มีอะไรอยู่ที่นี่ – ทำไมเราต้องรวบรวมข้อมูลทุกวัน
ที่มา: John Mueller

การตรวจจับ soft 404 เป็นสิ่งจำเป็นจากมุมมองของเครื่องมือค้นหาด้วยเหตุผลสองประการ:

  1. Google มีทรัพยากรที่จำกัด เว็บมีขนาดใหญ่มาก และไม่สามารถรวบรวมข้อมูลทุกหน้าได้ นั่นเป็นเหตุผลที่ Google จำเป็นต้องจัดลำดับความสำคัญและเลือกว่าหน้าใดควรค่าแก่การรวบรวมข้อมูล การปล่อยซอฟต์ 404 ออกไปทำให้สามารถมุ่งเน้นไปที่หน้าที่มีคุณค่ามากกว่า ซึ่งจะช่วยเพิ่มประสิทธิภาพในการรวบรวมข้อมูล
  2. Google ต้องการนำเสนอหน้าคุณภาพแก่ผู้ใช้ หาก Google สงสัยว่าไม่มีหน้าใดอยู่ แสดงว่าไม่มีใครต้องการพบหน้านั้น และไม่ควรปรากฏในหน้าผลการค้นหา

Soft 404 ส่งผลต่อเว็บไซต์ของคุณอย่างไร

ผลที่ตามมาสำหรับเว็บไซต์ของคุณอาจแตกต่างกันไปขึ้นอยู่กับประเภทของหน้าเว็บที่ Google จัดเป็น soft 404

หาก Google ถูกต้องและไม่มีหน้าเว็บนั้นจริงๆ ผลที่ตามมาก็คือการ สิ้นเปลือง งบประมาณในการรวบรวมข้อมูล ของ คุณ

งบประมาณการรวบรวมข้อมูลของคุณระบุจำนวนหน้าที่ Google สามารถและต้องการรวบรวมข้อมูลบนเว็บไซต์ของคุณ หากคุณมี เช่น 100,000 หน้า และงบประมาณการรวบรวมข้อมูลของคุณอนุญาตให้รวบรวมข้อมูล 50,000 ได้ สิ่งสำคัญคือต้องแน่ใจว่าใช้งบประมาณไปกับหน้าที่มีคุณค่า หาก Google เปลืองงบประมาณในการรวบรวมข้อมูลของคุณในการรวบรวมข้อมูล soft 404 อาจมีไม่เพียงพอสำหรับหน้าที่สำคัญที่สุดสำหรับคุณมากที่สุดและนำการเข้าชมมาให้คุณ

อีกด้านหนึ่งของเหรียญคือเมื่อ Google ทำผิดพลาดขณะกำหนดสถานะและคิดว่าหน้าที่มีคุณค่าคือ soft 404 ในกรณีนี้ หน้าจะไม่ได้รับการจัดทำดัชนี และจะไม่นำการเข้าชมที่เกิดขึ้นเอง

คุณจะตรวจจับ soft 404 ได้อย่างไร?

คุณตรวจสอบได้ว่าหน้าใดที่ Google รายงานว่าเป็น soft 404 ใน Google Search Console ได้ใน รายงานการครอบคลุมของดัชนี

เข้าถึงรายงานโดยคลิกตัวเลือก "ความครอบคลุม" บนแถบด้านข้าง

สกรีนช็อตของรายงานการครอบคลุมดัชนี

หาก Google คิดว่าเพจเป็น soft 404 ก็สามารถกำหนดสถานะหนึ่งในสองสถานะนี้ให้เพจได้:

  • Soft 404 (ยกเว้นหมวดหมู่) หรือ
  • URL ที่ส่งดูเหมือนจะเป็น Soft 404 (หมวดข้อผิดพลาด)

ความแตกต่างเพียงอย่างเดียวระหว่างสถานะเหล่านี้คือวิธีที่ Google ค้นพบ URL

ในกรณีของสถานะ "URL ที่ส่งดูเหมือนจะเป็นสถานะ Soft 404" Google พบมันใน แผนผังไซต์ ของคุณ (ไฟล์ข้อความที่สร้างโดยเจ้าของเว็บไซต์ที่ควรแสดงเฉพาะหน้าที่คุณต้องการสร้างดัชนี) ในขณะเดียวกัน ในกรณีของสถานะ "Soft 404" Google พบ URL นี้ด้วยตัวเอง

คุณสามารถดูรายการ URL แต่ละรายการที่รายงาน soft 404 ได้โดยคลิกที่สถานะใดสถานะหนึ่งเหล่านี้ ข้อมูลนี้สามารถส่งออกได้ แต่จำกัด URL 1,000 รายการ หากคุณต้องการส่งออกจำนวนมากและมีแผนผังเว็บไซต์มากกว่าหนึ่งรายการ คุณสามารถดาวน์โหลด URL สำหรับแต่ละแผนผังเว็บไซต์แยกกันได้

รายงานความครอบคลุมของดัชนีไม่ใช่ที่เดียวที่คุณสามารถดูสถานะของ URL

ใน เครื่องมือตรวจสอบ URL ใน Google Search Console คุณสามารถ ตรวจสอบ URL แต่ละรายการได้อีกครั้ง หากคุณต้องการตรวจสอบ URL มากกว่าหนึ่งรายการ คุณสามารถใช้ URL ตรวจสอบ API และตรวจสอบ URL ได้มากถึง 2,000 รายการในคราวเดียว

หากคุณเห็นความแตกต่างระหว่างสถานะในรายงานความครอบคลุมของดัชนีและเครื่องมือตรวจสอบ URL อาจเป็นเพราะความล่าช้าในรายงานการครอบคลุมดัชนี ในกรณีนี้ ให้เชื่อถือเครื่องมือตรวจสอบ URL เนื่องจากจะแสดงข้อมูลล่าสุด

การตรวจจับ Soft 404 บนมือถือกับเดสก์ท็อป

ในปี 2564 Google ได้อัปเดต วิธีตรวจหา soft 404 บนโทรศัพท์มือถือและอุปกรณ์เดสก์ท็อป

ปรากฎว่าสถานะอาจถูกกำหนดให้แตกต่างไปจากรุ่นมือถือและเดสก์ท็อป อย่างไรก็ตาม เนื่องจาก Google Search Console รายงานสถานะตามรุ่นมือถือ ระบบจะไม่แสดงให้คุณเห็นหากเฉพาะรุ่นเดสก์ท็อปของคุณเท่านั้นที่มีป้ายกำกับว่า soft 404

โดยพื้นฐานแล้ว สิ่งที่เกิดขึ้นคือบางครั้งเราเห็นหน้าที่บนเดสก์ท็อปดูเหมือนหน้า 404 ดังนั้นเราจึงบอกว่านี่คือ soft 404 บนเดสก์ท็อป เราไม่จำเป็นต้องจัดทำดัชนี และบนมือถือ ดูเหมือนหน้าปกติ ดังนั้นเราจะจัดทำดัชนีที่นั่นจริงๆ

[…] ใน Search Console เราแสดง soft 404 แต่เราแสดงสำหรับเวอร์ชันมือถือ ดังนั้น หากในเวอร์ชันมือถือทุกอย่างเรียบร้อยจากด้านข้างของคุณแล้วใน Search Console จะดูเหมือนว่ามีการจัดทำดัชนีตามปกติ […] ในขณะที่สำหรับเดสก์ท็อปหากเราเห็นว่าเป็น soft 404 ที่นั่นคุณจะไม่สามารถ เห็นว่าโดยตรงใน Search Console

ที่มา: John Mueller

สิ่งที่อาจทำให้เกิดซอฟต์ 404 และวิธีแก้ไข

มีเหตุผลสองสามประการที่ Google อาจจัดประเภทเพจเป็น soft 404 ได้แก่:

  • หน้า 404 ตอบสนองด้วยรหัสสถานะ HTTP 200
  • การเปลี่ยนเส้นทางที่ไม่เกี่ยวข้อง
  • หน้าที่มีเนื้อหาน้อยหรือไม่มีเลย
  • หน้าที่มีคำคล้าย 404
  • ปัญหาการแสดงผล

หน้า 404 ตอบสนองด้วยรหัสสถานะ HTTP 200

หากหน้าเว็บนั้นเป็นหน้า 404 แต่ส่งคืนรหัสสถานะ HTTP 200 Google จะจัดประเภทเป็น soft 404

นี่คือสิ่งที่ควรคำนึงถึงเป็นพิเศษหากคุณมี หน้า 404 ที่กำหนดเอง  

หน้า 404 ที่กำหนดเองสามารถเป็นประโยชน์กับผู้ใช้ของคุณ และทำให้พวกเขาสำรวจเว็บไซต์ได้ แม้ว่าหน้าที่พวกเขาพยายามจะเข้าถึงจะไม่มีอยู่ก็ตาม อย่างไรก็ตาม ไม่ใช่เรื่องแปลกที่หน้าเหล่านี้จะส่งคืนรหัสสถานะ HTTP 200

คุณควรหลีกเลี่ยงสถานการณ์นี้เนื่องจาก Google ยังคงรวบรวมข้อมูลหน้าเหล่านี้ต่อไป ซึ่งทำให้เสียงบประมาณในการรวบรวมข้อมูลของคุณ

วิธีแก้ไขปัญหานี้คือการ กำหนดค่าเซิร์ฟเวอร์ของคุณให้ส่งคืนรหัสสถานะที่ถูกต้องสำหรับหน้าที่ไม่มีอยู่ (404 ไม่พบ)  

การเปลี่ยนเส้นทางที่ไม่เกี่ยวข้อง

การเปลี่ยนเส้นทางไปยังหน้าที่ไม่เกี่ยวข้องเป็นแนวทางที่ไม่ดีซึ่งอาจทำให้ผู้ใช้สับสน นั่นเป็นสาเหตุที่หาก Google ตรวจพบว่าการเปลี่ยนเส้นทางชี้ไปที่หน้าที่ไม่เกี่ยวข้อง เครื่องมือค้นหาอาจไม่ติดตามและถือว่าหน้านั้นเป็น soft 404

ในการแก้ไขปัญหา ให้เปลี่ยนเส้นทางไปยังหน้าที่เกี่ยวข้องเสมอ  

ดูเนื้อหาจากมุมมองของผู้ใช้ ตัวอย่างเช่น หากผู้ใช้กำลังมองหาบางสิ่งที่เฉพาะเจาะจง จะสมเหตุสมผลหรือไม่ที่พวกเขาจะไปลงเอยที่หน้าที่คุณกำลังเปลี่ยนเส้นทางไป มันมีความเกี่ยวข้องหรือไม่? หากไม่มี อาจมีหน้าที่ดีกว่าที่สามารถตอบรับความตั้งใจของพวกเขา หรือบางทีคุณควรตั้งค่าหน้า 404 แทนการเปลี่ยนเส้นทาง

หน้าที่มีเนื้อหาน้อยหรือไม่มีเลย

เนื้อหาบนหน้าเพียงเล็กน้อยหรือไม่มีเลยอาจทำให้ Google คิดว่าหน้าว่างเปล่าและจัดประเภทเป็น soft 404

ตัวอย่างอาจเป็นเว็บไซต์อีคอมเมิร์ซที่มีสินค้าเข้าและออกจากสต็อกบ่อยครั้ง ซึ่งนำไป สู่หมวดหมู่สินค้าที่ว่างเปล่า

วิธีแก้ปัญหานี้ไม่ตรงไปตรงมาเหมือนในสองกรณีก่อนหน้านี้

วิธีหนึ่งในการจัดการกับปัญหานั้นคือการบล็อกการจัดทำดัชนีของหน้าว่าง เพราะหากเป็นหน้าว่าง จะไม่เป็นประโยชน์ต่อผู้ใช้ของคุณ และไม่ควรจัดทำดัชนี คุณสามารถทำได้โดยเพิ่ม เมตาแท็ก noindex (แท็ก HTML ที่บอกเครื่องมือค้นหาว่าคุณไม่ต้องการให้มีการจัดทำดัชนีหน้านี้)

นอกจากนี้ คุณควรทบทวนโครงสร้างของเว็บไซต์ทั้งเว็บไซต์ของคุณใหม่

คุณมีหมวดหมู่สินค้าจำนวนมากที่มีเพียงผลิตภัณฑ์เดียวหรือไม่? หากเป็นกรณีนี้ คุณควรพิจารณาใหม่ว่าหมวดหมู่เหล่านี้มีความจำเป็นในเว็บไซต์ของคุณหรือไม่ หน้าเช่นนี้อาจถือว่ามีเนื้อหาน้อย และอาจส่งผลเสียต่อเว็บไซต์ของคุณได้สองวิธี:

  • พวกเขาสามารถเสียงบประมาณการรวบรวมข้อมูลของคุณและ
  • หากคุณมีหน้าเว็บคุณภาพต่ำที่จัดทำดัชนีได้จำนวนมาก Google อาจคิดว่าทั้งเว็บไซต์ของคุณขาดคุณภาพและตัดสินใจที่จะหยุดรวบรวมข้อมูลเว็บไซต์ของคุณบ่อยๆ

หากคุณต้องการเรียนรู้เพิ่มเติมว่าหน้าใดควรและไม่ควรจัดทำดัชนี โปรดอ่าน บทความเกี่ยวกับการสร้างกลยุทธ์การจัดทำดัชนีสำหรับเว็บไซต์ของคุณ

หน้าที่มีคำคล้าย 404

บางครั้งอัลกอริธึมของ Google จะระบุหน้าผิดพลาดหากมีคำที่มักจะปรากฏในหน้า 404 อาจเกิดขึ้นได้ เช่น เว็บไซต์อีคอมเมิร์ซ เมื่อหน้าผลิตภัณฑ์ใช้คำต่างๆ เช่น "สินค้าหมด" "สินค้าไม่พร้อมใช้งาน" หรือ "เราไม่จัดส่งไปยังที่ตั้งของคุณ"

ผู้เขียนโพสต์ด้านบนได้แก้ไขปัญหาโดยเพียงแค่ ลบคำที่ ระบุว่าไม่สามารถจัดส่งได้

ปัญหาการแสดงผล

การแสดงผลเป็นขั้นตอนที่จำเป็นสำหรับ Google ในการดูเนื้อหาของคุณ หากเครื่องมือค้นหาไม่เห็น แสดงว่าอาจคิดว่าหน้านั้นว่างเปล่าและจัดเป็น soft 404

สาเหตุของปัญหาการแสดงผลคือการบล็อกทรัพยากร เช่น CSS หรือ JavaScript ใน robots.txt Robots.txt เป็นไฟล์ที่ให้คุณระบุได้ว่าบอทของเครื่องมือค้นหาหน้าใดสามารถรวบรวมข้อมูลได้และหน้าใดบ้างที่ไม่สามารถทำได้ หาก Google ไม่สามารถเข้าถึงทรัพยากรที่จำเป็นสำหรับการแสดงผล ก็จะไม่เห็นเนื้อหา

หากต้องการทราบว่า Google แสดงเนื้อหาของคุณอย่างถูกต้องหรือไม่ ให้ใช้เครื่องมือตรวจสอบ URL ใน Google Search Console คุณสามารถตรวจสอบ URL แต่ละรายการและดูว่า Google มองเห็นหน้าเว็บของคุณอย่างไร หากเนื้อหาหายไป แสดงว่ามีปัญหาในการแสดงผล

ในการแก้ไขปัญหา ให้ตรวจสอบว่า Google มีสิทธิ์เข้าถึงทรัพยากรที่จำเป็นสำหรับการแสดงผล ตรวจสอบไฟล์ robots.txt และตรวจสอบว่าอนุญาตให้รวบรวมข้อมูลของ CSS และ JavaScript

หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับวิธีการทำงานของการเรนเดอร์ ให้ดูที่ รายการ Rendering SEO ของเรา – เหตุใด JavaScript SEO จึงไม่เพียงพอ

ห่อ

การตรวจสอบ soft 404 เป็นสิ่งสำคัญเพื่อให้แน่ใจว่าจะไม่ส่งผลเสียต่อเว็บไซต์ของคุณโดยสิ้นเปลืองงบประมาณในการรวบรวมข้อมูลหรือละทิ้งหน้าที่มีค่าออกจากดัชนี

ต่อไปนี้คือประเด็นสำคัญจากบทความที่จะช่วยคุณหลีกเลี่ยง soft 404:

  • หากไม่มีเพจ ให้ตรวจสอบว่าหน้านั้นส่งคืนรหัสสถานะ HTTP 404
  • เมื่อสร้างการเปลี่ยนเส้นทาง ต้องแน่ใจว่าคุณกำลังเปลี่ยนเส้นทางไปยังเนื้อหาที่เกี่ยวข้อง
  • อย่าปิดกั้นทรัพยากรที่จำเป็นสำหรับการแสดงผล เช่น ไฟล์ CSS หรือ JavaScript ใน robots.txt ของคุณ
  • หากคุณมีหน้าว่าง ให้เพิ่มเมตาแท็ก noindex หรือลบหน้าเหล่านี้ออกจากไซต์ของคุณ
  • ระวังการใช้วลีที่คล้ายกับ 404 หากคุณสังเกตเห็นหน้าเว็บของคุณ เช่น สินค้าหมด ถูกทำเครื่องหมายเป็น soft 404 ให้ลองลบคำหรือใช้คำอื่น