Robots.txt Easter Eggs – ทำให้ Robots Directives ของคุณสนุกสำหรับมนุษย์!
เผยแพร่แล้ว: 2021-10-28โดยทั่วไปแล้ว ไข่อีสเตอร์จะสัมพันธ์กับสิ่งของที่คุณพบระหว่างการล่า หลังจากใช้เวลามองหาพวกมันในที่ที่ไม่รู้จัก โดยไม่มีคำแนะนำที่ชัดเจนว่าจะมองหาที่ไหน เนื่องจากการค้นหาต้องใช้เวลาและความพยายาม การค้นหาในที่สุดจึงคุ้มค่า
ทั้งหมดนี้เป็นจริงสำหรับไข่อีสเตอร์ที่พบในผลิตภัณฑ์เทคโนโลยี
วันนี้ฉันต้องการดูไข่อีสเตอร์ในไฟล์ robots.txt ฉันจะอธิบายแนวคิดของไฟล์ Easter Egg และไฟล์ robots.txt และสาเหตุที่นักพัฒนาซอฟต์แวร์อาจรวมไข่อีสเตอร์ไว้ด้วย
ฉันยังไปล่าสัตว์ไข่อีสเตอร์ของตัวเองเพื่อกำหนดจำนวนไข่อีสเตอร์ในไฟล์ robots.txt ที่สามารถใช้ได้ ตามที่ปรากฏ – มากมาย!
อ่านและอย่าลืมดูให้จบบทความนี้ – ฉันจะมีงานให้คุณ!
ไข่อีสเตอร์ในเทคโนโลยีคืออะไร?
ไข่อีสเตอร์ในเทคโนโลยีเป็นที่เข้าใจกันว่าเป็นคุณสมบัติที่ไม่มีเอกสารหรือชิ้นส่วนของซอฟต์แวร์ที่ไม่จำเป็นสำหรับผลิตภัณฑ์ในการทำงาน คุณลักษณะเหล่านี้จะไม่เปิดเผยหรือเปิดเผยอย่างเปิดเผยกับผู้ใช้ที่ต้องการค้นหาโดยไม่มีคำแนะนำมากนัก
ไข่อีสเตอร์มักพบในวิดีโอเกม โปรแกรม แอพ ซอฟต์แวร์ และบางส่วนของเว็บไซต์
มาในหลายรูปแบบ เช่น
- โกงรหัสในเกมที่เปิดเผยคุณสมบัติหรือระดับเพิ่มเติม
- การอ้างอิงทางวัฒนธรรมที่ปรากฏบนหน้าที่ซ่อนอยู่หรือเอกสารเว็บอื่น ๆ
- เกมหรือแอพที่อยู่ในซอฟต์แวร์ที่สร้างขึ้นเพื่อวัตถุประสงค์อื่น เช่น การเขียนและแก้ไขเอกสารข้อความ
- ข้อความที่นักพัฒนาทิ้งไว้ข้างหลัง เช่น ข้อความที่ให้เครดิตผู้สร้างผลิตภัณฑ์
รายการดำเนินต่อไป และไม่มีข้อจำกัดว่าไข่อีสเตอร์จะเป็นอะไรได้
แต่มันมีอะไรมากกว่านั้น
สำหรับฉัน ไข่อีสเตอร์เป็นสิ่งที่มนุษย์สัมผัสได้ในสภาพแวดล้อมของเครื่องจักรซึ่งมีตรรกะมากมายและกฎที่เป็นรูปธรรม
ไข่อีสเตอร์แหกกฎที่เข้มงวดเหล่านี้ พวกเขาเป็นวิธีสำหรับผู้สร้างในการเพิ่มองค์ประกอบที่เป็นเอกลักษณ์ด้วยใบหน้ามนุษย์ในผลิตภัณฑ์เทคโนโลยีของพวกเขา การรวมไข่อีสเตอร์ทำให้ประสบการณ์ทั้งหมดในการใช้ผลิตภัณฑ์เทคโนโลยีที่ให้มานั้นสนุกยิ่งขึ้น และอาจเป็นประโยชน์สำหรับแฟนๆ ตัวยง ขึ้นอยู่กับผลิตภัณฑ์นั้นๆ
ไปที่ไข่อีสเตอร์ที่เราพบได้ในไฟล์ robots.txt ของเว็บไซต์
ไฟล์ไข่อีสเตอร์และ robots.txt
การค้นหาไข่อีสเตอร์ในไฟล์ robots.txt นั้นซับซ้อนน้อยกว่าในกรณีอื่นๆ คุณเพียงแค่เข้าถึง robots.txt ของเว็บไซต์
มีตัวอย่างมากมายของไข่อีสเตอร์ในไฟล์ robots.txt ไฟล์เหล่านี้มีไว้เพื่อให้อ่านและตามด้วยโรบ็อต ดังนั้นควรเพิ่มไข่อีสเตอร์ในลักษณะที่มนุษย์เข้าใจได้เท่านั้น
เรามาชี้แจงว่าไฟล์ robots.txt คืออะไร และหากการเพิ่มไข่อีสเตอร์จะไม่ส่งผลต่อวิธีที่โรบ็อตอ่านไฟล์
ไฟล์ robots.txt คืออะไร
ไฟล์ robots.txt อยู่ที่รากของโดเมนของคุณ และมีชุดคำสั่งสำหรับโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหา ซึ่งจะบอกวิธีการรวบรวมข้อมูลหน้าต่างๆ ในเว็บไซต์
แต่ละ directive บล็อกหรืออนุญาตการเข้าถึงสำหรับโปรแกรมรวบรวมข้อมูลเฉพาะไปยังเส้นทางไฟล์บนไซต์ เว้นแต่จะระบุไว้เป็นอย่างอื่นใน robots.txt โรบ็อตสามารถรวบรวมข้อมูลไฟล์ทั้งหมดบนเว็บไซต์ได้
คำสั่งในไฟล์ robots.txt เป็นวิธีการเพิ่มงบประมาณการรวบรวมข้อมูลของคุณให้สูงสุด ดังนั้น Googlebot จะไม่เสียเวลาไปกับหน้าที่ไม่เกี่ยวข้องในเว็บไซต์ของคุณ
การเพิ่มไข่อีสเตอร์ทำร้ายไฟล์ robots.txt ของคุณได้ไหม
ไฟล์ Robots.txt มีรูปแบบเฉพาะ ซึ่งคุณสามารถอ่านเพิ่มเติมได้ใน หลักเกณฑ์ของ Google ในการเพิ่มกฎของ robots.txt
เสิร์ชเอ็นจิ้นไม่สนใจสัญลักษณ์หรือคำสั่งใดๆ ที่ปรากฏในไฟล์ robots.txt หลังแฮชแท็ก ดังนั้นการรวมไข่อีสเตอร์ที่นำหน้าด้วยแฮชแท็กจะไม่ส่งผลต่อวิธีที่โรบ็อตเข้าใจไฟล์เหล่านี้
ไข่อีสเตอร์มักจะถูกวางไว้ในเอกสารหรือสถานที่ที่ผู้ใช้ไม่สามารถเข้าถึงได้ง่าย และนั่นก็เป็นความจริงสำหรับไฟล์ robots.txt โดยทั่วไปจะไม่เชื่อมโยงจากหน้าอื่น ๆ และผู้ใช้ไม่สามารถนำทางไปยังหน้าเหล่านี้ได้โดยคลิกที่ปุ่มบนเว็บไซต์
ทำไมคุณควรเพิ่มไข่อีสเตอร์ลงในไฟล์ robots.txt ของคุณ
เนื่องจากคุณสามารถเพิ่มข้อความลงในไฟล์ robots.txt ที่สามารถอ่านได้สำหรับมนุษย์เท่านั้น เหตุใดจึงไม่ใช้โอกาสนี้เพื่อสร้างเนื้อหาพิเศษเฉพาะเพื่อเสริมความพยายามทางการตลาดของคุณ
คุณสามารถเพิ่มไข่อีสเตอร์ลงในไฟล์ robots.txt ได้ด้วยเหตุผลหลายประการนอกเหนือจากการให้ความบันเทิงแก่ผู้ใช้
ตัวอย่างเช่น เนื้อหาของ robots.txt ยังสามารถ:
- เพิ่มการรับรู้แบรนด์ของคุณ
- แสดงแบรนด์นายจ้างของคุณ
สามารถทำได้หลายวิธี คุณสามารถ:
- ใช้ตราสินค้าของคุณเอง เช่น ใส่โลโก้หรือสโลแกนของคุณ
- อ้างถึงบริการหรือผลิตภัณฑ์ที่คุณนำเสนอหรือบริษัทของคุณเป็นสภาพแวดล้อมในการทำงาน
- ส่งเสริมให้ผู้เยี่ยมชมสมัครเข้าร่วมข้อเสนองานของคุณ ด้วยวิธีนี้ คุณจะกำหนดเป้าหมายเฉพาะกลุ่มคนที่เข้าชม robots.txt ของคุณเท่านั้น คุณสามารถทำได้โดยเฉพาะเพื่อเชิญผู้มีความรู้ให้เข้าร่วมทีม dev หรือ SEO ของคุณ!
- สร้างเนื้อหาที่เกี่ยวข้องและเป็นต้นฉบับ มันสามารถตรงกับวัตถุประสงค์ของไฟล์ robots.txt ได้ตรงใจ เช่น พูดกับโรบ็อต รวมถึงการอ้างอิงที่ตลกขบขันถึงพวกเขา เครื่องมือค้นหา หรือหัวข้ออื่นๆ เช่น วัฒนธรรมป๊อป การรวมเนื้อหาที่เป็นกันเองจะทำให้แบรนด์ของคุณดูเข้าถึงได้ง่ายและมุ่งเน้นผู้ใช้มากขึ้น
เลือกแนวทางที่จะแสดงแบรนด์ของคุณในแง่ดีที่สุดและเป็นทรัพย์สินที่ไม่ซ้ำใครในการที่ผู้ใช้รับรู้แบรนด์ของคุณ
ตัวอย่างไข่อีสเตอร์ใน robots.txt
มาดูตัวอย่างของไข่อีสเตอร์ในไฟล์ robots.txt และดูข้อความประเภทต่างๆ ที่เราพบในไฟล์เหล่านั้น
killer-robots.txt ของ Google
ไฟล์ killer-robots.txt ของ Google เป็นไข่อีสเตอร์ที่น่าจดจำซึ่งสร้างขึ้นเพื่อ ฉลองครบรอบ 20 ปี ของคำสั่ง robots.txt ที่มีให้สำหรับผู้ดูแลเว็บ มันถูกลบไปแล้ว แต่ยังคงเป็นหนึ่งในตัวอย่างที่มีชื่อเสียงที่สุดของไข่อีสเตอร์ในไฟล์ robots.txt
นี่คือข้อความที่ Google รวมไว้:

ตัวแทนผู้ใช้: T-1000
ตัวแทนผู้ใช้: T-800
ไม่อนุญาต: /+LarryPage
ไม่อนุญาต: /+SergeyBrin
T-800 เป็นเทอร์มิเนเตอร์ที่แสดงโดย Arnold Schwarzenegger ในภาพยนตร์ที่มีชื่อเสียง T-1000 คือหุ่นยนต์นักฆ่าจากภาพยนตร์เรื่อง Terminator 2 คำสั่งที่รวมอยู่ในไฟล์นี้ป้องกันไม่ให้ T-800 และ T-1000 ฆ่า Larry Page และ Sergey Brin ผู้ก่อตั้ง Google
Nike
Nike รวมการสร้างแบรนด์ไว้ในไฟล์ robots.txt โดยใส่ข้อความตลกๆ ลงในสโลแกนของแบรนด์ รวมกับการอ้างอิงถึงเครื่องมือค้นหา:

Nike ยกระดับคุณลักษณะของแบรนด์เหล่านี้ให้ดียิ่งขึ้นด้วยการผสมผสานโลโก้ของพวกเขา:

คลาวด์แฟลร์
Cloudflare กล่าวถึงหุ่นยนต์เป็นการส่วนตัว มันเริ่มต้นเช่นนี้:

และจบลงด้วยหุ่นยนต์ตอบรับคำขอและตกลงที่จะปฏิบัติตาม:

Youtube
Youtube อ้างถึงหุ่นยนต์และหมายถึงอนาคต dystopian ที่พวกมันมีอำนาจเหนือกว่า:

ประตูแก้ว
Glassdoor เป็นเว็บไซต์ที่ให้พนักงานตรวจสอบบริษัท ดูเงินเดือนที่พวกเขาเสนอ ค้นหางานบนแพลตฟอร์ม และอื่นๆ อีกมากมาย ไฟล์ robots.txt ตามธีม งาน คำสั่งในไฟล์สนับสนุน SEO geek ที่เสี่ยงภัยในไฟล์ robots.txt เพื่อสมัครตำแหน่งใดตำแหน่งหนึ่ง:

Etsy
ข้อความของ Etsy ดูเหมือนจะเป็นภาษาอิตาลีเพื่อ "เห็นแก่ความดี!" และรวมถึงภาพธรรมดาๆ ที่มีรูปร่างเหมือน … หุ่นยนต์ แน่นอน:

Yelp
Yelp อ้างคำพูดของนักเขียนนิยายวิทยาศาสตร์ชื่อดัง Isaac Asimov และ กฎสามข้อของวิทยาการหุ่นยนต์ของ เขา อาซิมอฟแนะนำกฎหมายเหล่านี้ในเรื่องสั้นปี 1942 และต่อมาใช้เป็นพื้นฐานสำหรับนิยายของเขา
กฎหมายเป็นระบบที่มีจริยธรรมสำหรับมนุษย์และโรบ็อต และไฟล์ robots.txt อาจถูกมองว่าเป็นแนวทางที่ถูกต้องสำหรับมนุษย์และโรบ็อตในการโต้ตอบและได้รับประโยชน์ร่วมกันจาก:

Tripadvisor
เช่นเดียวกับ Glassdoor Tripadvisor ให้ความสำคัญกับความอยากรู้อยากเห็นของผู้คน และขอให้นักล่าไข่อีสเตอร์สมัครและเป็นสมาชิกของทีม SEO ของพวกเขา:

วิกิพีเดีย
ไฟล์ robots.txt ของ Wikipedia มีข้อความหลายข้อความ – นี่เป็นเพียงบางส่วนเท่านั้น:



คำสั่งเหล่านี้ให้ความเห็นเกี่ยวกับพฤติกรรมของหุ่นยนต์ เนื่องจากมีเพียงมนุษย์เท่านั้นที่สามารถอ่านมันได้ มันจึงเป็นวิธีล้อเลียนเกี่ยวกับหุ่นยนต์ มันแสดงให้เห็นด้านที่สนุกสนานและร่าเริงของวิกิพีเดีย ซึ่งตรงกันข้ามกับสิ่งที่เราคาดหวังจากวิกิพีเดีย นั่นคือบทความที่ตรวจสอบข้อเท็จจริงอย่างจริงจัง
Merriam Webster
Merriam Webster เตือนทุกคนที่เข้าถึงไฟล์ให้ "แก้ไขด้วยความระมัดระวัง":

นี่เป็นการเตือนซ้ำสองว่าคำสั่งใดๆ ที่รวมอยู่ในไฟล์ robots.txt ควรมีการวางแผนและวางไว้ในไฟล์อย่างรอบคอบ ท้ายที่สุด ข้อผิดพลาดสามารถป้องกันไม่ให้โรบ็อตรวบรวมข้อมูลไซต์ได้อย่างถูกต้อง
กรีดร้องกบ
Screaming Frog รวมคำสั่งตลกที่เกี่ยวข้องกับชื่อบริษัท:

แต่มันมีอะไรมากกว่าแค่การอ้างอิงที่ตลกขบขัน การรวมคำสั่งเหล่านี้ช่วยสร้างการรับรู้ถึงแบรนด์ การกล่าวถึง “การป้องกันทีมกบ” อาจถือได้ว่าเป็นตัวอย่างของการสร้างแบรนด์นายจ้าง
นอกจากนี้ ในไฟล์ robots.txt เราสามารถค้นหาคำเชิญให้เข้าร่วมทีม SEO ของบริษัทได้:

ที่ดินเครื่องมือค้นหา
Search Engine Land กล่าวถึงผู้ที่สามารถอ่านข้อความต่อไปนี้ได้ เนื่องจากโรบ็อตไม่สามารถรับรู้ได้ว่ามีผู้ที่ไม่ใช่โรบ็อตที่เข้าชมไฟล์ robots.txt ของตน นอกจากนี้ยังมีการอ้างอิงถึง Battlestar Galactica:

Humans.txt
อินเทอร์เน็ตควรเกี่ยวกับมนุษย์ ไม่ใช่แค่หุ่นยนต์
หากมีไฟล์ robots.txt สำหรับโรบ็อต ก็ควรมีไฟล์สำหรับมนุษย์ด้วยเช่นกัน
นี่คือแนวคิดเบื้องหลัง มนุษย์. txt ซึ่งสร้างขึ้นเพื่อต่อต้านความคิดริเริ่มของไฟล์ robots.txt ตามที่เราอ่านบนเว็บไซต์อย่างเป็นทางการ:
“มันเป็นความคิดริเริ่มในการรู้จักผู้ที่อยู่เบื้องหลังเว็บไซต์ เป็นไฟล์ TXT ที่มีข้อมูลเกี่ยวกับบุคคลต่างๆ ที่มีส่วนร่วมในการสร้างเว็บไซต์”
ไฟล์ .txt จะไม่รบกวนโค้ด และเป็นวิธีที่ง่ายในการพิสูจน์ความเป็นผู้สร้างเว็บไซต์
นี่คือข้อความที่ ไฟล์ human.txt ของ Google มี:
“Google สร้างขึ้นโดยทีมวิศวกร นักออกแบบ นักวิจัย หุ่นยนต์ และอื่นๆ จำนวนมากในไซต์ต่างๆ ทั่วโลก มีการอัปเดตอย่างต่อเนื่องและสร้างขึ้นด้วยเครื่องมือและเทคโนโลยีมากกว่าที่เราจะทำได้ หากคุณต้องการช่วยเหลือเรา โปรดดูที่ careers.google.com”
เว็บไซต์อื่นๆ ก็ใช้เช่นกันและมักจะมีความคิดสร้างสรรค์มากขึ้น – ดู ไฟล์ human.txt ของ Netflix และ Medium
ขั้นตอนถัดไป
ตอนนี้คุณได้เห็นตัวอย่างไข่อีสเตอร์ที่พบในไฟล์ robots.txt แล้ว คุณรู้สึกมีแรงบันดาลใจที่จะทิ้งไข่อีสเตอร์ไว้ให้ผู้ใช้ไหม
เราทำ!
