Wie Sie verhindern, dass Bots Ihre Website crawlen

 Wie Sie verhindern, dass Bots Ihre Website crawlen
Wenn Sie Probleme mit Bots haben, die Ihre Website crawlen und Ihre SEO-Strategie beeinträchtigen, sollten Sie sich unbedingt mit effektiven Methoden vertraut machen, wie Sie verhindern können, dass Bots Ihre Website crawlen.


Am Ende dieser Lektüre werden Sie in der Lage sein, die Sicherheit und Leistung Ihrer Website erheblich zu verbessern.

Was ist ein Bot?

Ein Bot, kurz für "Roboter", ist eine Softwareanwendung, die für die Ausführung bestimmter Aufgaben programmiert ist. Bots simulieren oft menschliche Aufgaben und arbeiten über eine Internetverbindung.

Sie sind für die Ausführung komplexer und sich wiederholender Aufgaben unerlässlich. So helfen Suchmaschinen-Bots beispielsweise bei der Indexierung von Informationen und verbessern so den Datenabruf im World Wide Web.

Doch nicht alle Bots sind nützlich. Es gibt böswillige Bots, die Ihre Website crawlen, Ihren Inhalt auslesen und die Leistung Ihrer Website ohne jegliche Berechtigung verlangsamen. Sie können auch Ihre Webanalyse in die Irre führen und Ihren SEO-Bemühungen Schaden zufügen.

Wie können Sie das Verhalten von Bots erkennen?

Bots interagieren mit Ihrer Website nicht wie ein Mensch. Sie klicken vielleicht nicht auf Schaltflächen, füllen keine Formulare aus oder spielen keine Videos ab. Sie sind in der Regel daran interessiert, sich durch den HTML-Code Ihrer Website zu wühlen.

Sie neigen dazu, mit einer ungewöhnlich hohen Geschwindigkeit durch die Seiten zu navigieren, viel schneller als Menschen. Wenn Sie eine unnatürliche Geschwindigkeit beim Wechseln zwischen den Seiten bemerken, insbesondere wenn dies in Millisekunden geschieht, ist wahrscheinlich ein Bot am Werk.

Auch wenn Sie feststellen, dass Besucher auf Ihre Website kommen, ohne dass sie auf eine bestimmte Website verwiesen werden, handelt es sich möglicherweise um einen Bot. Während ein menschlicher Besucher über eine Suchmaschine oder einen Link von einer anderen Website auf Ihre Website gelangen kann (was als Weiterleitung vermerkt wird), umgehen Bots oft diese üblichen Wege und erscheinen auf Ihrer Website ohne einen eindeutigen Einstiegspunkt.

Wenn Sie diese Merkmale verstehen, können Sie Bot-Traffic auf Ihrer Website leichter erkennen. Sobald Sie diesen Verkehr erkannt haben, können Sie geeignete Maßnahmen ergreifen, um diese Bots einzuschränken und Ihre Website zu schützen.

crawler bot illustration


🎯 Lesen Sie unseren Blogbeitrag: Wie oft crawlt Google eine Website? -Faktoren und Wege zum Lernen

Warum sollten Sie Bots blockieren?

Bots sind nicht immer die Ursache für jede Fehlfunktion einer Website. Nicht alle Bots sind schädlich. Nicht alle Verlangsamungen der Website oder Sicherheitsverletzungen sind auf Bots zurückzuführen, sondern können durch andere technische Probleme oder Cyber-Bedrohungen verursacht werden.

Es gibt freundliche Bots wie den Googlebot, die für die Indizierung Ihrer Website wichtig sind.

Die wichtigste Lösung besteht darin, schädliche Bots zu blockieren, während nützliche Bots wie Suchmaschinen-Crawler weiterhin zugelassen werden. Dieser alternative Ansatz ist die ultimative Strategie, um Ihre SEO-Bemühungen zu bewahren und eine sichere und leistungsstarke Website zu gewährleisten.

Bösartige Bots weisen in der Regel einige bestimmte Merkmale auf. Wenn Sie diese Merkmale erkennen, können Sie ihnen besser zuvorkommen, sie identifizieren und auf unseren Websites effektiv mit ihnen umgehen.

Im Folgenden finden Sie einige Merkmale von Bad Bots und Gründe, warum Sie sie blockieren sollten:

⌛ Beeinträchtigung der Leistung Ihrer Website

Bösartige Bots sind dafür bekannt, dass sie erhebliche Serverressourcen verbrauchen, was zu langsamen Seitenladezeiten führt. Bots sind in der Lage, Ihre Website rund um die Uhr unermüdlich zu durchforsten. Im Gegensatz zu Menschen, die Ihre Website während der normalen Besuchszeiten besuchen, durchforsten diese Bots Ihre Website unermüdlich, was zu einer Überlastung des Servers und einer Verlangsamung Ihrer Website führt.

Eine langsame Website kann ungeduldige Besucher abschrecken, was sich negativ auf die Konversionsraten und die Gesamtleistung der Website auswirkt. Außerdem kann sich der Bandbreitenverbrauch durch diese Bots schnell auftürmen, so dass Sie eine hohe Rechnung zu begleichen haben.

📉 Verzerrung Ihrer Analysedaten

Wenn Sie die Daten Ihrer Website gründlich analysieren, haben Sie vielleicht scheinbar irrelevanten Datenverkehr aus undefinierten Quellen festgestellt. In den meisten Fällen sind diese Traffic-Spitzen auf Bot-Aktivitäten zurückzuführen, die sie aufblähen und eine falsche Wahrnehmung echter Nutzerbesuche erzeugen, so dass Sie Ihre strategischen Maßnahmen auf verzerrte Daten stützen müssen.

Diese plötzlichen Spitzen können auch zu einem plötzlichen Abfall der Ladegeschwindigkeit führen und sogar einen Absturz Ihrer Website verursachen.

🎯 Lesen Sie unseren Blogbeitrag: Direkter Traffic vs. Organischer Traffic: Alles was man wissen muss

📑 Scraping von Inhalten

Bösartige Bots sind berüchtigt für das Scraping von Inhalten von Websites, was zu einer schwerwiegenden Verletzung der Rechte an geistigem Eigentum führt. Sie können Ihre hochwertigen Inhalte auf anderen Websites reproduzieren, was zu Problemen mit doppelten Inhalten führt und Ihre SEO-Rankings beeinträchtigen kann.

Diese Art von Bot-Verhalten ist nicht nur unethisch, sondern kann auch dazu führen, dass Ihre Server-Ressourcen erschöpft werden, da die Hotlinking-Site bei jedem Zugriff auf diesen Inhalt Ihren Server erreichen muss.

⛏️ Competitive Data Mining

Bots können für konkurrierendes Data Mining eingesetzt werden - eine Praxis, bei der Konkurrenten Ihre Website-Informationen wie Preise, Produktbeschreibungen und Kundenrezensionen auslesen. Diese gestohlenen Informationen helfen ihnen, wettbewerbsfähig zu bleiben, indem sie Ihre Strategien vorhersehen und zu ihrem Vorteil nutzen.

📩 Exposition gegenüber Spam

Einige Bots sind dafür verantwortlich, dass der Kommentarbereich oder die Kontaktformulare Ihrer Website mit Spam gefüllt werden, was zu einer schlechten Nutzererfahrung führt und den Ruf Ihrer Website schädigt.

6 Möglichkeiten, Bots am Crawlen einer Website zu hindern

eine Illustration, die zeigt, wie man eine Website vor Bots schützt


Bei der Errichtung starker Barrieren gegen Bots geht es nicht nur darum, Mauern zu errichten. Dazu gehört ein akribischer Prozess der Identifizierung, Qualifizierung und Entschärfung des Bot-Verkehrs.

So wie ein Immunsystem fremde Eindringlinge in unserem Körper identifiziert und neutralisiert, sollte auch Ihr Bot-Blockierungssystem funktionieren. Dies ist entscheidend, um sicherzustellen, dass Sie die nützlichen Bots behalten und die schädlichen eliminieren.

Im Folgenden finden Sie gängige Methoden, um die Verteidigung Ihrer Website gegen Bot-Invasoren aufzubauen:

1) Verwendung von Robots.txt

Eine robots.txt-Datei ist eine einfache Textdatei, die Webmaster erstellen, um Webroboter anzuweisen, wie sie die Seiten einer Website crawlen sollen. Mit dieser rudimentären Bot-Management-Methode können Sie kontrollieren, auf welche Seiten Ihrer Website Sie keinen Zugriff durch Crawler wünschen, sei es ein Suchmaschinen-Roboter oder eine andere Art von Bot.

Obwohl die Verwendung der robots.txt-Datei nicht garantiert, dass alle Bots die Anweisungen befolgen, werden die meisten seriösen Bots diese Befehle immer befolgen, was sie zu einem ausgezeichneten Schritt für die erste Bot-Blocking-Abwehr macht.

Die Verwendung von robots.txt ist zwar ein einfacher Weg, um Bots zu blockieren, aber einige häufige Fehler können Ihre Bemühungen zunichte machen. Wenn Sie z. B. einen Schrägstrich (/) verwenden, wird jeder Bot daran gehindert, alle Teile Ihrer Website zu crawlen. Stellen Sie sicher, dass der Schrägstrich nur dann verwendet wird, wenn Sie allen Bots den Zugriff auf Ihre gesamte Website verwehren wollen.

🎯 Um robots.txt effizient zu nutzen, lesen Sie am besten unseren Robots.txt-Leitfaden.

Wenn Sie sich nicht sicher sind, ob Ihre Website eine ordnungsgemäße robots.txt-Datei verwendet, können Sie den Robots.txt-Tester von SEOmator verwenden, um den Inhalt der robots.txt-Datei Ihrer Website zu prüfen und zu verifizieren.

Das kostenlose robots.txt-Tool von SEOmator


2) CAPTCHAs implementieren

Ich bin mir ziemlich sicher, dass Sie beim Ausfüllen eines Webformulars oder bei der Anmeldung auf einer Website schon einmal auf CAPTCHAs gestoßen sind. Dabei handelt es sich um automatisierte Tests, die Menschen bestehen können, aber aktuelle Computerprogramme nicht.

CAPTCHA ist ein großartiges Instrument, um Menschen von Bots zu unterscheiden, und wenn es richtig implementiert ist, kann es den Bot-Verkehr auf Ihrer Website erheblich reduzieren. CAPTCHAs werden üblicherweise in Form von verzerrten Textbildern, Kästchen zum Ankreuzen oder einfachen mathematischen Gleichungen eingesetzt.

captcha box beispiel


Obwohl CAPTCHA gegen die meisten Spam-Bots wirksam ist, sollten Sie darauf achten, dass Ihre Website-Besucher keine unangenehme Erfahrung machen. Einige CAPTCHAs sind dafür bekannt, dass sie übermäßig zweideutig sind, was bei potenziellen Kunden zu Frustration führt.

3) Verwendung der HTTP-Authentifizierung

Die HTTP-Authentifizierung ist eine weitere Schutzmaßnahme, die Bots abwehren kann. Diese serverseitige Methode ermöglicht nur authentifizierten Benutzern einen eingeschränkten Zugriff auf bestimmte Webseiten oder Verzeichnisse.

Einfach ausgedrückt: Ohne den richtigen Benutzernamen und das richtige Kennwort lässt der Server eine Anfrage zum Zugriff auf eine Seite oder ein Verzeichnis nicht zu. Die HTTP-Authentifizierung kann für technisch nicht versierte Benutzer kompliziert sein, bietet aber einen starken Schutz gegen bösartige Bots.

4) Verwendung von Referrer-Spam-Blockern

Referrer-Spam tritt auf, wenn ein Spamming-Bot einen Website-Referrer nachahmt und so den Anschein erweckt, dass Klicks von einer legitimen Quelle auf die Seiten Ihrer Website umgeleitet wurden. Referrer-Spam kann Ihre Analysedaten verfälschen und zu einer schlechten Website-Leistung führen.

Zum Glück gibt es verschiedene spezialisierte Tools, die oft als Referrer-Spam-Blocker bekannt sind und solche Spams erkennen und blockieren können, damit sie Ihre Website nicht beeinträchtigen.

5) Verwendung von Hypertext-Zugangsdateien

Eine Hypertext-Zugangsdatei, allgemein bekannt als .htaccess, ist eine Konfigurationsdatei, die von Apache-basierten Webservern verwendet wird und Ihnen die Möglichkeit gibt, das Verhalten des Servers pro Verzeichnis zu kontrollieren und anzupassen. Aufgrund der Möglichkeiten, die die .htaccess-Datei bietet, spielt sie eine Schlüsselrolle im Bot-Management.

Mit der .htaccess-Datei kann man jeden Bot in Schach halten, der die robots.txt-Datei ignoriert oder nicht erkennt. Die .htaccess-Datei ist oft in den Stammdateien Ihrer Website versteckt und kann über den Dateimanager Ihrer Website oder über FTP (File Transfer Protocol) aufgerufen werden.

Zugriff auf den Dateimanager über cpanel


Wenn Sie z. B. Googlebot blockieren möchten, melden Sie sich per FTP bei Ihrem Server an und suchen Sie das Stammverzeichnis. Die .htaccess-Datei befindet sich normalerweise hier.

Bearbeiten Sie die .htaccess-Datei mit einem beliebigen Texteditor. Fügen Sie die folgenden Codezeilen in die .htaccess-Datei ein:

RewriteEngine Ein
RewriteCond %{HTTP_USER_AGENT} Googlebot [NC]
RewriteRule .* - [R=403,L]

Im obigen Kontext kann "Googlebot" durch den User-Agent eines beliebigen Bots ersetzt werden, den Sie blockieren möchten.

Wenn der Bot, den Sie blockieren möchten, von einer bestimmten IP-Adresse oder einem bestimmten Adressbereich stammt, verwenden Sie diesen Code:

allow,deny bestellen
verweigern von 123.456.789
allow from all

Ersetzen Sie auch hier "123.456.789" durch die tatsächliche IP-Adresse, die Sie blockieren möchten. Die Anweisung 'deny from' blockiert den Zugriff von dieser bestimmten IP-Adresse, während die Anweisung 'allow from all' allen anderen Verkehr auf Ihre Website zulässt.

Speichern Sie die Änderungen und laden Sie die Datei zurück auf den Server.

6) Verwendung einer Bot-Management-Lösung

Wenn Sie sich mit der manuellen Verwaltung von Bots überfordert fühlen, sollten Sie eine umfassende Bot-Management-Lösung verwenden. Diese Tools verfügen über Algorithmen zur Identifizierung und Unterscheidung zwischen guten und schlechten Bots und helfen dabei, schädlichen Bot-Verkehr vom Zugriff auf Ihre Website abzuhalten oder zu begrenzen.

Bot-Management-Lösungen nutzen verhaltensbasierte Bot-Erkennungstechniken und maschinelles Lernen, um typische Nutzerverhaltensmuster zu verstehen und sie von Bot-Mustern zu unterscheiden.

Diese robusten Lösungen bieten Echtzeit-Updates und Einblicke in die Art der Bot-Aktivitäten auf Ihrer Website und ermöglichen es Ihnen, Reaktionen wie das Blockieren, Begrenzen oder Umleiten von Bot-Traffic anzupassen.

Es gibt mehrere seriöse Anbieter von Bot-Management-Diensten; die Wahl hängt von Ihren spezifischen Anforderungen und Ihrem Budget ab.

Abschließende Überlegungen

Die Verhinderung des Crawlings Ihrer Website durch Bots zielt nicht nur darauf ab, Suchmaschinen-Crawler zu umgehen, sondern vor allem darauf, schädliche Bots daran zu hindern, auf die sicheren Bereiche Ihrer Website zuzugreifen.

Schädliche Bots können eine Reihe von schädlichen Verhaltensweisen an den Tag legen, z. B. sich rund um die Uhr auf unseren Websites herumtreiben, mit übertriebenem Traffic einen falschen Eindruck von Popularität erwecken, unsere Kommentarabschnitte mit Spam füllen, exklusive Inhalte stehlen oder die Leistung und Bandbreite unserer Website manipulieren.

Beim Umgang mit Bot-Befall ist es wichtig, das schlechte Bot-Verhalten zu verstehen und zu lernen, wie man es kontrollieren kann, ohne die angenehmen Bot-Varianten, die für unsere Websites nützlich sind, zu beeinträchtigen.

Die in unserem Leitfaden aufgeführten Methoden werden Ihre Website vielleicht nicht vollständig von allen Bots befreien, aber Sie können sicher sein, dass Sie große Fortschritte auf dem Weg zu einer sicheren und gesunden Website machen.

Es ist wichtig, dass Sie diese Abwehrmechanismen frühzeitig anwenden und nicht warten, bis Ihre Website angegriffen oder beschädigt wurde!


🎯 Verwandte Artikel:

-Wie man Spam-Backlinks findet und wie man sie loswird

-Was ist Link-Popularität? - Die Rolle der Link-Popularität in SEO

-Google VS Bing: Vergleich der beiden großen Suchmaschinen