Was der Yandex-Quellcode-Leak über Suchmaschinen enthüllt hat
Veröffentlicht: 2023-02-17Haben Sie sich jemals gefragt, was hinter den Suchmaschinengiganten wie Google, Bing und Yahoo steckt?
Am 27. Januar 2023 geriet die viertgrößte Suchmaschine der Welt, Yandex, nach einem massiven (um genau zu sein 44 GB) Datenleck in die Schlagzeilen.
„So erlitt die beliebteste Suchmaschine in Russland einen Verstoß. Inwiefern ist es für mich relevant?“ Sie können fragen.
Was viele Nachrichtensender als böswillige Handlung gegen die Unternehmens- und Kundendatensicherheit abtaten, werteten Digitalexperten als seltenen Einblick in die Funktionsweise von Suchmaschinen.
Und was noch wichtiger ist, welche Inhalte priorisieren sie und warum.
Das Datenleck machte öffentlich, was wir ursprünglich für 1.922 Ranking-Faktoren hielten, aber dank Ben Wills wurde die Zahl auf 17.853 korrigiert. Massiv, oder?

Wir haben alle 1.992 durchlaufen.
Lesen Sie weiter, um zu sehen, was wir am interessantesten fanden.
Kann ich die Erkenntnisse aus dem Yandex-Leck nutzen, um bei Google einen höheren Rang zu erreichen?
Es versteht sich von selbst, dass Yandex nicht Google ist.
Aber mehrere bemerkenswerte Faktoren machen dieses Leck außerhalb Russlands und innerhalb Ihrer Suchranking-Experimente relevant (und lehrreich):
- Es gibt ~70 % Übereinstimmung zwischen den Suchergebnissen von Yandex und Google
- Yandex verwendet PageRank (fast identisch mit dem von Google)
- Yandex beschäftigt viele Ex-Googler, und viele spekulieren, dass es auf ähnliche Weise entwickelt wurde
- Yandex folgt ähnlichen Best Practices für den Informationsabruf wie Google, wie dem invertierenden Index oder Einbettungen
- Genau wie die Suchmaschinen Google und Bing verwendet Yandex die Ranking-Funktion Okapi BM25, um die Relevanz von Dokumenten für eine bestimmte Suchanfrage einzuschätzen

Davon abgesehen hilft uns das, was der Yandex-Quellcode-Leck enthüllt, zum ersten Mal besser zwischen der Annahme und dem Wissen, wie Suchrankings funktionieren, zu unterscheiden.
Im Inneren des Yandex-Codelecks: 11 Erkenntnisse über die Funktionsweise von Suchmaschinen
Generell lassen sich die Yandex-Ranking-Faktoren in drei Kategorien einteilen:
- Statische Faktoren wie eingehende Backlinks, eingehende interne Links, Header, Anzeigenverhältnis usw. Diese beziehen sich auf Ihre Website.
- Dynamische Faktoren wie Textrelevanz, Keyword-Inklusionen etc. Diese beziehen sich sowohl auf Ihre Website als auch auf die Suchanfrage.
- Auf die Benutzersuche bezogene Faktoren wie Standort des Benutzers, Abfragesprache, Absichtsmodifikatoren usw. Diese beziehen sich direkt auf die Benutzerabfrage.
Die größten Gewichtungsfaktoren, die in den statistischen Modellen verwendet werden, sind:

1. Onpage-Werbung
Werbung auf einer Seite wird als negativer Faktor angesehen. Tatsächlich ist es der Faktor mit dem höchsten negativen Ranking-Gewicht:

Mehrere werbebezogene Faktoren, wie die Anzahl der Anzeigenplatzierungen auf der Seite und ob der Hintergrund anklickbar ist, deuten darauf hin, dass Yandex Seiten mit einem hohen Verhältnis von Anzeigen zum sichtbaren Bildschirm nicht mag.
2. Faktoren auf URL-Ebene
Der Aufbau der URL ist ein weiterer Faktor, den Yandex berücksichtigt. Und genauer gesagt:
- Das Vorhandensein von Zahlen in der URL.
- Die Anzahl der abschließenden Schrägstriche („/“) in der URL
- Die Anzahl der Großbuchstaben in der URL
Um auf das Argument zurückzukommen, dass Yandex nicht Google ist und dieses Leck keinen Wert haben wird, nun, diese URL-Faktoren ähneln stark denen aus den URL-Strukturrichtlinien von Google.
3. Faktoren auf Seitenebene
Hier gibt es viel zu entfalten. Wie sich herausstellt, hat Yandex zahlreiche Faktoren auf Seitenebene, die beim Aufbau der SERP eine Rolle spielen. Einige der bemerkenswertesten sind:
- Seitenaktualität – insbesondere für Blog-Inhalte und News-Websites. Es ist ein negativer Rankingfaktor, wenn eine Inhaltsseite älter als 10 Jahre ist. Aktualisieren Sie Ihre Inhalte daher regelmäßig.
- Letztes Ziel – Yandex belohnt Seiten, die die Suchreise des Benutzers beenden, was bedeutet, dass er gefunden hat, wonach er sucht.
- Gesundes Traffic-Quellenverhältnis – Yandex mag keine Seiten, die Traffic aus einer einzigen Quelle erhalten (z. B. organische Suche). Damit eine Seite einen hohen Rang einnimmt, muss sie Traffic aus allen möglichen Quellen erhalten – organisch, bezahlt, direkt usw.
- Inhaltsqualität - Es ist wichtig, dass Ihr Text originell und nicht mit Schlüsselwörtern vollgestopft ist. Es ist ein Ranking-Boost, wenn Ihr Text in externen Domains zitiert/verlinkt wurde. Außerdem wird durch Inhalte von schlechter Qualität die Rangfähigkeit der Inhalte von guter Qualität verringert.
4. Faktoren auf Website-Ebene
Aufbauend auf dem Frischefaktor der Seite wäre die ultimative Kombination eine gut etablierte Website, die seit langem aktiv ist und ihre Inhalte häufig aktualisiert.
Außerdem beurteilt Yandex die Gesamtqualität einer Website anhand ihrer Klickbarkeitsperspektive. Mit anderen Worten, wie oft klicken Benutzer auf die URL für die Suche?
Ein weiterer positiver Rankingfaktor ist der Domainname. Yandex verbessert das Ranking von .COM-Domains.
5. Seitenqualität
Wir haben bereits über die Inhaltsqualität gesprochen, aber was ist mit der allgemeinen Seitenqualität? Nun, Yandex bewertet die Qualität einer Seite anhand mehrerer Faktoren:

- Anzahl der Besuche
- Anzahl eindeutiger Besucher
- Auf einer Seite verbrachte Zeit
- Anzahl der auf einer Seite durchgeführten Aktionen
6. Benutzerverhalten und Engagement
Es gab mehrere interessante Erkenntnisse zum Benutzerverhalten aus dem Leak, die wir besprechen müssen.
Ein Schlüsselfaktor ist die Anzahl der Klicks und Impressionen, die ein Host insgesamt erhält. Yandex berücksichtigt auch, ob eine Seite für Mobilgeräte optimiert ist, und analysiert das Benutzerverhalten auf Mobilgeräten, einschließlich der Sitzungsdauer und der auf der Seite verbrachten Zeit. Auch wenn Besucher innerhalb desselben Monats auf eine Website zurückkehren, ist dies ein positiver Rankingfaktor.
Aber das Faszinierendste ist wohl das:
Seiten mit Benutzerbewertungen werden in den Suchergebnissen bevorzugt.
7. Host-Rang und Standort
Yandex legt großen Wert auf die Priorisierung von Inhalten, die geografisch nah am Benutzer sind. Wenn also zwei Domainnamen um dieselbe Suchanfrage kämpfen, erhält derjenige, der näher am Benutzer ist, einen Ranking-Boost.
In Bezug auf technische Ranking-Faktoren bringt Sie die Reduzierung der Anzahl von 400 Client-Fehlern und 500 Server-Fehlern in den SERPs nach vorne. Darüber hinaus achtet Yandex sehr auf die Crawling-Tiefe. Achten Sie deshalb darauf, dass keine wichtige Seite mehr als zwei Klicks von Ihrer Startseite entfernt ist.
8. Qualität der Backlinks
Yandex wendet verschiedene Maßnahmen an, um die Erstellung von Empfehlungsketten zu bestrafen, die die Popularität einer Website künstlich aufblähen.
Eine solche Maßnahme ist die Analyse des Prozentsatzes von verlinktem Text, da eine übermäßige Verlinkung auf manipulatives Verhalten hindeuten kann. Es berücksichtigt auch die Qualität der Links, die auf eine Website verweisen, und bestraft Websites mit einer großen Anzahl bezahlter oder minderwertiger Links.
Apropos Linkqualität: Faktoren, die direkt zur Linkqualität beitragen, sind die Anzahl der Weiterleitungen und die Art und Weise, wie die Links aufgebaut sind.
9. Auswirkungen auf den Suchverkehr
Ähnlich wie bei Google schneiden Websites mit guten SEO-Praktiken besser ab als solche, die dies nicht tun. Leicht auffindbar zu sein, ist ein todsicherer Weg, um ein höheres Ranking bei Yandex zu erreichen.
Wenig überraschend sind Seiten, die der Suchabsicht dienen können, führend bei der jeweiligen Suchanfrage. Seiten mit der exakten Suchanfrage im Titel-Tag und Fließtext sind im Vorteil. Auch die Verwendung von Synonymen ist ein weiteres positives Signal, das zu einem Ranking-Boost führen kann.
10. Wikipedia-Boost
Ein weiteres starkes Signal für eine qualitativ hochwertige Seite ist, wenn sie von Wikipedia verlinkt wird. Yandex bevorzugt Seiten, die von Wikipedia aus verlinkt sind, und ordnet sie höher ein.
11. Videoinhalte
Websites mit Videoinhalten werden priorisiert. Aber es gibt einen Haken, Yandex rankt höhere Seiten mit Videos, die von Yandex gehostet werden (duh).
In Bezug auf die Bewertung des Videoinhalts einer Seite gelten die Standardmaße – was die durchschnittliche Wiedergabezeit im Vergleich zur Gesamtlänge des Videos ist.
Und während all diese 11 Ergebnisse einige großartige Erkenntnisse lieferten, gab es in der SEO-Welt einige Debatten darüber, ob die durchgesickerten Daten wertvoll sind oder nicht.
Reaktionen auf die geleakten Ranking-Faktoren in der SEO-Welt
Von der völligen Ablehnung bis hin zur eingehenden Analyse äußerten SEOs gemischte Meinungen zum Yandex-Leck.
Kevin Indig fasste die häufigsten Einwände zusammen und lieferte einen tollen Input zur Bedeutung der Ranking-Faktoren.

Ausschnitt aus dem Artikel „SEOs are underestimating The Yandex Leak“ von Kevin Indig
Bemerkenswerte Namen im SEO-Bereich, wie Ben Wills, Alex Buraks und Mic King, krempelten ihre Ärmel hoch und tauchten tief ein, um die durchgesickerten Daten zu entschlüsseln.
Ben Wills gehört zu den ersten Experten, die den Quellcode verstehen und uns helfen, die Bedeutung des Ereignisses zu verstehen (obwohl er den Twitter-Thread etwas später eröffnet hat).

Etwa zur gleichen Zeit teilte Rob Ousbey eine Alpha-Version eines Explorer-Tools für den Yandex-Code:

Mic King teilte seine ersten Eindrücke live mit, während er den Quellcode durchging, und sagte uns: „Schlafen Sie nicht über diesen Code.“

SEO-Foren in Russland waren nicht weniger überfüllt, und Webmaster hatten einen ähnlichen Einblick wie die westliche SEO-Welt. Es wurde jedoch auch viel darüber gesprochen, dass Yandex seine Produkte und Dienstleistungen bevorzugt, wie der russische SEO-Experte Dan Taylor berichtet.
Abschluss
Wird das Leck im Quellcode von Yandex Ihre SEO-Maßnahmen verändern?
Wahrscheinlich nicht.
Aber es wäre ein großer Fehler, es als unwichtig zu kennzeichnen und darüber hinwegzuscrollen.
Anscheinend gibt es viele Ähnlichkeiten zwischen Yandex und Google. Daher kann dieses Leck als guter Ausgangspunkt für weitere Experimente dienen und Sie dazu bringen, sich noch mehr auf die Benutzererfahrung und qualitativ hochwertige Inhalte zu konzentrieren.
Also reinhauen und testen.
