Jam Kerja SEO, 3 Juni 2022

Diterbitkan: 2022-07-04

Ini adalah rangkuman pertanyaan dan jawaban paling menarik dari Google SEO Office Hours bersama John Mueller pada 3 Juni 2022.

Isi sembunyikan
1 Dapatkah saya menggunakan dua kode hasil HTTP pada satu halaman?
2 Apakah menggunakan CDN meningkatkan peringkat jika situs saya sudah cepat di negara utama saya?
3 Haruskah saya melarang permintaan API untuk mengurangi perayapan?
4 Haruskah saya menggunakan rel="nofollow" pada tautan internal?
5 Apakah ada cara untuk memaksa tautan situs muncul?
6 Situs kami menyematkan PDF dengan iframe, haruskah kami meng-OCR teksnya?
7 Apakah Google merayapi URL dalam markup data terstruktur?

Bisakah saya menggunakan dua kode hasil HTTP pada satu halaman?

1:22 “[…] Secara teoritis mungkin untuk memiliki dua kode hasil HTTP yang berbeda pada sebuah halaman, tetapi apa yang akan dilakukan Google dengan kedua kode tersebut? Apakah Google akan melihatnya? Dan jika ya, apa yang akan dilakukan Google? Misalnya, 503 ditambah 302.”

Tanggapan John adalah: “[…] Dengan kode hasil HTTP, Anda dapat memasukkan banyak hal yang berbeda. Google akan melihat kode hasil HTTP pertama dan pada dasarnya memprosesnya.

Dan Anda secara teoritis masih dapat memiliki dua kode hasil HTTP atau lebih di sana jika itu adalah pengalihan yang mengarah ke beberapa halaman akhir. Jadi misalnya, Anda bisa memiliki pengalihan dari satu halaman ke halaman lain. Itu salah satu kode hasil. Dan kemudian di halaman lain itu, Anda dapat menyajikan kode hasil yang berbeda. Jadi itu bisa menjadi 301 redirect ke halaman 404 […]. Dan dari sudut pandang kami, dalam situasi rantai di mana kami dapat mengikuti pengalihan untuk mendapatkan hasil akhir, kami pada dasarnya hanya akan fokus pada hasil akhir itu.

Dan jika hasil akhir itu memiliki konten, maka itu adalah sesuatu yang mungkin bisa kita gunakan untuk kanonikalisasi. Jika hasil akhir itu adalah halaman kesalahan, maka itu adalah halaman kesalahan. Dan itu baik untuk kita juga.”

Apakah menggunakan CDN meningkatkan peringkat jika situs saya sudah cepat di negara utama saya?

2:50 “[…] Kami mendapatkan sebagian besar lalu lintas kami dari negara tertentu. Kami meng-host situs web kami di server yang berlokasi di negara itu. Apakah Anda menyarankan untuk menempatkan seluruh situs web kami di belakang CDN untuk meningkatkan kecepatan halaman bagi pengguna secara global, atau apakah itu tidak diperlukan dalam kasus kami?”

John menjawab: “ Saya tidak berpikir itu akan berdampak besar pada Google sama sekali dalam kaitannya dengan SEO.

Satu-satunya efek di mana saya dapat membayangkan bahwa sesuatu mungkin terjadi adalah apa yang akhirnya dilihat pengguna. […] Jika sebagian besar pengguna Anda sudah melihat situs web yang sangat cepat karena server Anda terletak di sana, maka Anda […] melakukan hal yang benar. Tapi tentu saja, jika pengguna di lokasi lain melihat hasil yang sangat lambat, karena mungkin koneksi ke negara Anda tidak terlalu bagus, maka itu adalah sesuatu di mana Anda mungkin memiliki beberapa peluang untuk meningkatkannya.

[…] Jika ada sesuatu yang dapat Anda lakukan untuk meningkatkan hal-hal secara global untuk situs web Anda, saya pikir itu ide yang bagus. Saya tidak berpikir itu penting […]. Tapi itu adalah sesuatu yang dapat Anda lakukan untuk […] mengembangkan situs web Anda hanya dari negara Anda saat ini.

Mungkin satu hal yang harus saya klarifikasi, jika crawling Google benar-benar lambat, maka tentu saja itu dapat mempengaruhi seberapa banyak kita dapat meng-crawl dan mengindeks dari website […]. Saya belum benar-benar melihat ini sebagai masalah sehubungan dengan situs web mana pun yang tidak berukuran jutaan dan jutaan halaman […].

Anda dapat memeriksa ulang seberapa cepat Google merayapi di Search Console, dan statistik perayapan. Dan jika itu terlihat masuk akal, bahkan jika itu tidak super cepat, maka saya tidak akan terlalu khawatir tentang itu.”

Haruskah saya melarang permintaan API untuk mengurangi perayapan?

5:20 “[…] Situs kami saat ini menghabiskan sekitar 20% anggaran perayapan untuk subdomain API, 20% lainnya untuk gambar mini gambar video. Tak satu pun dari subdomain ini memiliki konten yang merupakan bagian dari strategi SEO kami. Haruskah kita melarang subdomain ini untuk dirayapi, atau bagaimana titik akhir API ditemukan atau digunakan?”

Seperti yang dikatakan John, “[…] Dalam banyak kasus, titik akhir API akhirnya digunakan oleh JavaScript di situs web , dan kami akan merender halaman Anda. Dan jika mereka mengakses API yang ada di situs web Anda, kami akan mencoba memuat konten dari API itu dan menggunakannya untuk merender halaman.

Dan bergantung pada bagaimana API Anda disiapkan dan bagaimana JavaScript Anda disetel, mungkin sulit bagi kami untuk men-cache hasil API tersebut, yang berarti bahwa mungkin kami merayapi banyak permintaan API ini untuk mencoba mendapatkan versi yang dirender halaman Anda sehingga kami dapat menggunakannya untuk pengindeksan. Jadi itu biasanya tempat di mana ini ditemukan. Dan itu adalah sesuatu yang dapat Anda bantu dengan memastikan bahwa hasil API dapat di-cache, bahwa Anda tidak memasukkan stempel waktu apa pun ke dalam URL […] saat Anda menggunakan JavaScript untuk API […].

Jika Anda tidak peduli dengan konten yang dikembalikan dengan titik akhir API ini, tentu saja Anda dapat memblokir seluruh subdomain ini agar tidak dirayapi dengan file robots.txt. Dan itu pada dasarnya akan memblokir semua permintaan API tersebut agar tidak terjadi.

[…] Pertama-tama Anda harus mencari tahu, apakah hasil API ini […] bagian dari […] konten penting yang ingin saya indeks dari Google? Dan jika demikian, maka mungkin Anda tidak boleh memblokir perayapan. Namun jika […] itu […] menghasilkan sesuatu […] yang tidak penting untuk laman Anda […], mungkin ada baiknya untuk memeriksa ulang seperti apa tampilannya saat diblokir.

Dan salah satu cara Anda dapat memeriksa ulang ini adalah jika Anda dapat membuat halaman pengujian terpisah yang tidak memanggil API atau yang menggunakan URL yang rusak untuk titik akhir API. […] Anda dapat melihat bagaimana halaman ini benar-benar dirender di browser saya? Bagaimana itu dirender untuk Google?”

Haruskah saya menggunakan rel="nofollow" pada tautan internal?

8:05 “Apakah pantas menggunakan atribut nofollow pada tautan internal untuk menghindari permintaan perayap yang tidak perlu ke URL yang tidak ingin kami jelajahi atau indeks?”

Begini tanggapan John: “[…] Saya pikir, sebagian besar, sangat tidak masuk akal untuk menggunakan nofollow pada tautan internal. Tetapi jika itu adalah sesuatu yang ingin Anda lakukan, lakukanlah.

Dalam kebanyakan kasus, saya akan mencoba melakukan sesuatu seperti menggunakan rel=canonical untuk menunjuk ke URL yang ingin Anda indeks atau menggunakan robots.txt untuk hal-hal yang sebenarnya tidak ingin Anda jelajahi.

Coba cari tahu, apakah ini lebih seperti hal yang halus […] yang Anda sukai untuk diindeks dan kemudian gunakan rel=canonical untuk itu? Atau apakah itu sesuatu yang Anda katakan– sebenarnya, ketika Googlebot mengakses URL ini, itu menyebabkan masalah untuk server saya. Ini menyebabkan beban yang besar. Itu membuat semuanya sangat lambat. Itu mahal atau apa yang Anda miliki.

Dan untuk kasus tersebut, saya hanya akan melarang perayapan URL tersebut. […] Dengan rel=canonical, tentu saja, pertama-tama kita harus merayapi halaman itu untuk melihat rel=canonical. Namun seiring waktu, kami akan fokus pada kanonik yang telah Anda tetapkan. Dan kami akan menggunakannya terutama untuk perayapan dan pengindeksan.”

Apakah ada cara untuk memaksa tautan situs muncul?

16:02 “Apakah ada strategi agar halaman yang diinginkan dapat muncul sebagai tautan situs di hasil Google Penelusuran?”

John mengklarifikasi bahwa “[…] Tidak ada tag meta atau data terstruktur yang dapat Anda gunakan untuk menerapkan tautan situs agar ditampilkan .

[…] Sistem kami mencoba mencari tahu apa yang […] terkait atau relevan bagi pengguna saat mereka melihat halaman web yang satu ini […]? […] Rekomendasi kami pada dasarnya adalah memiliki struktur situs web yang baik, memiliki tautan internal yang jelas sehingga mudah bagi kami untuk mengenali halaman mana yang terkait dengan halaman tersebut, dan memiliki judul yang jelas yang dapat kami gunakan dan [...] sebuah tautan situs.

[…] Bukannya ada jaminan bahwa semua ini akan ditampilkan seperti itu. Tapi itu agak membantu kita untuk mencari tahu apa yang terkait. Dan jika menurut kami masuk akal untuk menampilkan tautan situs, maka akan jauh lebih mudah bagi kami untuk benar-benar memilih satu berdasarkan informasi itu.”

Situs kami menyematkan PDF dengan iframe, haruskah kami meng-OCR teksnya?

17:14 “Situs web kami menggunakan iframe dan skrip untuk menyematkan file PDF ke halaman dan situs web kami. Apakah ada keuntungan untuk mengambil teks OCR dari PDF dan menempelkannya di suatu tempat ke dalam HTML dokumen untuk tujuan SEO, atau akankah Google hanya mengurai konten PDF dengan bobot dan relevansi yang sama untuk mengindeks konten?”

John menjawab: “[…] Sepertinya Anda ingin mengambil teks PDF dan […] menyembunyikannya di HTML untuk tujuan SEO. Dan itu adalah sesuatu yang saya pasti tidak akan merekomendasikan melakukan. Jika Anda ingin kontennya dapat diindeks, buat itu terlihat di halaman.

[…] Kami mencoba mengeluarkan teks dari PDF dan mengindeksnya untuk PDF itu sendiri. Dari sudut pandang praktis, apa yang terjadi dengan PDF adalah sebagai salah satu langkah pertama, kami mengubahnya menjadi halaman HTML dan kami mencoba mengindeksnya seperti halaman HTML. […] Apa yang Anda lakukan adalah […] membingkai halaman HTML tidak langsung. Dan ketika berbicara tentang iframe, kita dapat mempertimbangkan konten itu untuk pengindeksan di dalam halaman utama. Tetapi juga dapat terjadi bahwa kami mengindeks PDF secara terpisah. […] Saya akan membalikkan pertanyaan dan membingkainya sebagai apa yang Anda inginkan terjadi?

Dan jika Anda ingin halaman web normal Anda diindeks dengan konten file PDF, maka buatlah agar konten tersebut langsung terlihat di halaman HTML. Jadi, alih-alih menyematkan PDF sebagai konten utama, jadikan konten HTML sebagai bagian utama dan tautkan ke file PDF.

Dan kemudian ada pertanyaan apakah Anda ingin PDF tersebut diindeks secara terpisah atau tidak? Terkadang Anda ingin PDF diindeks secara terpisah. Dan jika Anda ingin mereka diindeks secara terpisah, maka menautkannya sangat bagus.

Jika Anda tidak ingin mereka diindeks secara terpisah, maka menggunakan robots.txt untuk memblokir pengindeksan mereka juga baik-baik saja. Anda juga dapat menggunakan noindex [? x-robot ?] Header HTTP. Ini sedikit lebih rumit karena Anda harus menyajikannya sebagai header untuk file PDF jika Anda ingin file PDF tersebut tersedia di iframe, tetapi tidak benar-benar diindeks.”

Apakah Google merayapi URL dalam markup data terstruktur?

23:24 “Apakah Google merayapi URL yang terletak di markup data terstruktur atau apakah Google hanya menyimpan datanya?”

John menjelaskan bahwa “Sebagian besar, ketika kami melihat halaman HTML, jika kami melihat sesuatu yang terlihat seperti tautan, kami mungkin akan membuka dan mencoba URL itu juga. […] Jika kami menemukan URL dalam JavaScript, kami dapat mencoba mengambilnya dan mencoba menggunakannya. Jika kami menemukan tautan dalam file teks di sebuah situs, kami dapat mencoba merayapinya dan menggunakannya. Tapi itu bukan tautan biasa.

[…] Jika Anda ingin Google keluar dan merayapi URL itu, pastikan bahwa ada tautan HTML alami ke URL itu , dengan teks jangkar yang jelas juga, yang Anda berikan beberapa informasi tentang laman tujuan.

Jika Anda tidak ingin Google merayapi URL tertentu itu, maka mungkin blokir dengan robots.txt atau di laman itu, gunakan rel=canonical yang menunjuk ke versi pilihan Anda, apa pun seperti itu. […] Saya tidak akan secara membabi buta berasumsi bahwa hanya karena itu dalam data terstruktur itu tidak akan ditemukan, saya juga tidak akan secara membabi buta berasumsi bahwa hanya karena itu dalam data terstruktur itu akan ditemukan.

[…] Saya malah akan fokus pada apa yang Anda inginkan terjadi di sana. Jika Anda ingin melihatnya sebagai tautan, buatlah itu sebagai tautan. Jika Anda tidak ingin dirayapi atau diindeks, maka blokir perayapan atau pengindeksan […].”