Warum Google oft übers Ziel hinausschiesst

Google liefert häufig Tref­fer, in denen die gesuch­ten Be­griffe gar nicht ent­hal­ten sind. Das lässt sich mit An­füh­rungs­zeichen ent­schärfen, aber auch nur zu einem gewissen Grad: Woher dieses Pro­blem kommt und was man da­ge­gen tun kann.

Auch wenn ich immer mal wieder alternative Suchmaschinen teste und verwende, führe ich den Hauptharst meiner Webrecherchen mit Google durch. Einerseits aus Gewohnheit. Und andererseits, weil unter den Konkurrenten keiner wirklich heraussticht.

Doch obwohl Google den Zweck nach wie vor ausgezeichnet erfüllt, ist mein Eindruck, dass der Suchmaschinenkonzern sein Hauptgeschäft vernachlässigt. Ich mache regelmässig die Erfahrung, dass mir Google nicht die optimalen Resultate liefert.

Beispielsweise zeigt Google oft Resultate, die gar nicht alle eingegebenen Begriffe beinhalten. Bei manchen Suchläufen scheint die Suchmaschine der Ansicht zu sein, besser zu wissen, wonach der Nutzer sucht, als der Nutzer selbst: Ich habe das schon vor zwei Jahren angeprangert und damals empfohlen, die Suchbegriffe in Anführungszeichen zu setzen. Wenn man das tut, sollten alle eingegebenen Suchbegriffe auch in den aufgeführten Seiten enthalten sein, die die Trefferliste liefert.

Wenn Google Treffer anzeigt, in denen gar nicht alle Suchbegriffe enthalten sind, ist das meistens nutzlos. Das hier ist eines der seltenen Gegenbeispiele.

Verschwendet Google meine Zeit mit Absicht?

Nur leider sind sie das nicht. Ich stosse andauernd auf Beispiele, in denen einzelne Suchbegriffe fehlen, obwohl ich sie in Anführungszeichen gesetzt habe. Ich kann mich in solchen Fällen des Eindrucks nicht erwehren, dass Google mich nicht ernst nimmt und mit voller Absicht meine Zeit verschwendet.

Nun habe ich neulich einen Blogpost gefunden, in dem einer der Softwareentwickler zu diesem Problem Stellung nimmt. Yonghao Jin beschreibt in diesem Beitrag hauptsächlich eine Verbesserung bei den Snippets. Das ist der kurze inhaltliche Ausschnitt, der bei einem Treffer unterhalb des verlinkten Titels steht. Diese Snippets würden nun um die Stellen herum gebildet, an denen ein zitiertes Wort oder Satz im zitierten Webdokument vorkomme.

Im Abschnitt «Things to keep in mind about quoted searches» («Was Sie bei der Suche nach Zitaten beachten sollten») findet sich eine Erklärung dafür, weshalb manche Treffer nicht wirklich zur Suchanfrage passen: «Manchmal finden zitierte Suchanfragen Inhalte auf einer Webseite, die nicht ohne Weiteres sichtbar sind, sodass der Eindruck entsteht, der Inhalt sei nicht auf der Seite, obwohl er tatsächlich vorhanden ist», schreibt Yonghao Jin.

So wird zum Beispiel der Inhalt eines Meta-Beschreibungs-Tags nach Übereinstimmungen durchsucht, auch wenn dieser Inhalt auf der Webseite selbst nicht sichtbar ist. ALT-Text, der Bilder beschreibt, wird ebenso berücksichtigt wie der Text innerhalb der URL einer Seite. Material, das über Inline-Frames (iframes) eingebracht wird, wird ebenfalls abgeglichen.

Google kann auch Inhalte erkennen, die zunächst nicht auf einer Seite geladen werden, wenn Sie diese aufrufen, z. B. durch JavaScript gerenderte Inhalte, die nur erscheinen, wenn Sie darauf klicken, damit sie angezeigt werden.

Er gibt den Tipp, in solchen Fällen im Chrome-Browser mithilfe der Entwicklerwerkzeuge über alle geladenen Ressourcen zu suchen. Dazu klickt man im Menü auf Weitere Tools und Entwicklertools. In der rechten oberen Ecke der Leiste mit den Entwicklertools findet sich ein Menü, das den Befehl Weitere Tools > Suche bereithält. Das zeigt nun Treffer auch im Quellcode sämtlicher beteiligten Dateien an.

Gründe, die zu Google-Versagen führen

Es gibt drei weitere Gründe, weswegen Wörter, die vorhanden sein müssten, fehlen:

  • Die Seite hat sich seit der letzten Indexierung geändert.
  • Der zitierte Begriffe erscheint nur in Titellinks und URLs.
  • Die Interpunktion ist schuld. Der Google-Algorithmus betrachtet offenbar einige Satzzeichen als Leerzeichen. Das Beispiel im Blogpost: «Eine Suche nach "don't doesn't" bedeutet zum Beispiel, dass nach Buchstaben in dieser Reihenfolge gesucht würde: don t doesn t

Das ist ein interessanter Einblick, finde ich – wenngleich ich mich frage, ob es der falsche Ansatz ist, die Indizierung auf alle verknüpften Ressourcen auszuweiten. Müsste man sie nicht im Gegenteil auf den eigentliche Nutz-Inhalt beschränken – also insbesondere auch die Navigation und das Drumherum weglassen?

Man muss kein Webdesign-Guru sein, um zu erkennen, dass das Drumherum für eine inhaltliche Recherche nicht relevant ist. Ein Stichwort in einem Teaser steht nicht mit den Aussagen in Zusammenhang, die im Hauptteil aufgeführt sind und für die sich die Besucherin interessieren dürfte. Das stelle ich fest, wenn ich mit Google nach Inhalten in meinem eigenen Blog suche und mir Treffer geliefert werden, in denen Stichwörter aus der Seitenleiste oder dem Fussbereich berücksichtigt werden.

Den Suchfrust mit den richtigen Operatoren bekämpfen

Es gibt die Möglichkeit, Google dazu zu bringen, Treffer nur im eigentlichen Text zu berücksichtigen. Dazu verwendet man die beiden Operatoren intext und allintext.

Der erste Operator sorgt dafür, dass der nachfolgende Suchtreffern nur im Text der Seite gefunden wird:

intext:bananen

Der zweite führt dazu, dass alle nachfolgenden Begriffe im Text vorhanden sein müssen:

allintext:bananen birchermüesli

Standardmässig im Nutzinhalt suchen

Die beiden Operatoren funktionieren in Abgrenzung zur Suche im Titel (intitle und allintitle) und zur Suche in URLs (inurl und allinurl). Es bleibt aber natürlich die Frage, wie in diesem Kontext Text definiert ist und ob die Navigation z.B. dazuzählt oder nicht. Ich habe das bislang nicht abschliessend klären können.

Wie auch immer: Es wäre sinnvoll, wenn Text strikt auf den Nutzinhalt einer Seite beschränkt wäre – d.h. auf das, was man zu sehen bekommt, wenn man die Leseansicht einer Seite anzeigen lässt. Und ich fände es praktisch, wenn man den Parameter allintext standardmässig aktivieren könnte, sodass die Suchen grundsätzlich damit ausgeführt werden, solange man das nicht anders definiert.

Beitragsbild: Der Pfeil landet dann irgendwo im Wald dahinter (Annie Spratt, Unsplash-Lizenz).

Autor: Matthias

Computerjournalist, Familienvater, Radiomensch und Podcaster, Nerd, Blogger und Skeptiker. Überzeugungstäter, was das Bloggen angeht – und Verfechter eines freien, offenen Internets, in dem nicht alle interessanten Inhalte in den Datensilos von ein paar grossen Internetkonzernen verschwinden. Wenn euch das Blog hier gefällt, dürft ihr mir gerne ein Bier oder einen Tee spendieren: paypal.me/schuessler

4 Gedanken zu „Warum Google oft übers Ziel hinausschiesst“

  1. Interessant, dass das so häufig vorkommt. Denn eigentlich sagen Google und jeder SEO-Ratgeber, dass nur der Inhalt zähle und da auch nur der sichtbare Teil davon. Wörter nur in den Meta-Tags und nicht in der Seite vorkommen zu lassen, werde ignoriert bzw. führe zu einer schlechten Einstufung. Ebenso der früher bekannte „Trick“, allerhand Stichwörter in winzigem grauem Text unten auf der Seite einzufügen.

    Evtl. passiert das meist bei Anfragen, bei denen die exakten Wörter nicht genügen Resultate liefern?

    1. Mein Eindruck ist, dass Google die Regeln gelockert hat – ein Anzeichen sind die Suchresultate, bei denen unterhalb die Bemerkung «Es fehlt [Wort x]. Muss Folgendes enthalten: [Wort x]». Über die Gründe kann ich nur spekulieren – ich würde vermuten, dass irgendwelche neuen Algorithmen zum Einsatz kommen, dank denen Google glaubt, den eigentlichen Sinn der Suchanfrage zu erfassen, der nicht mehr exakt vom Wortlaut abhängig ist. Denkbar, dass das in Englisch einigermassen funktioniert. In Deutsch funktioniert es nicht.

  2. Als Informationsspezialist kann ich in keiner Art und Weise der Meinung zustimmen, dass Guugel die beste Suchmaschine sei. Ich erhalte mit den Suchmaschinen qwant.com, duckduckgo.com, aber auch swisscows.com definitiv eine bessere recall & precision, als mit Guugel. Und diese Suchmaschinen erlauben nicht nur die Anführungszeichen sondern auch noch das Pluszeichen vor dem Suchbegriff, sprich sie erlauben eine Boole’sche Recherche, die für den professionellen Bereich unerlässlich ist.

    Kurz: ich lebe bestens, ohne mich je um Guugel zu kümmern (höchstens mal Guugel Maps).

Kommentar verfassen