Was ist Robots.txt?
Die robots.txt-Datei steuert, welche Bereiche einer Website von Suchmaschinen gecrawlt werden dürfen. Erfahren Sie, wie Sie robots.txt richtig konfigurieren.
Inhaltsverzeichnis
Die robots.txt ist eine Textdatei im Stammverzeichnis einer Website, die Suchmaschinen-Crawlern Anweisungen gibt, welche Bereiche der Website sie crawlen dürfen und welche nicht. Sie folgt dem Robots Exclusion Protocol.
Aufbau einer robots.txt
Die robots.txt besteht aus einfachen Regeln:
- User-agent: Gibt an, für welchen Crawler die Regel gilt (* = alle)
- Disallow: Pfade, die nicht gecrawlt werden sollen
- Allow: Pfade, die explizit erlaubt sind (überschreibt Disallow)
- Sitemap: Verweis auf die XML-Sitemap
Häufige Anwendungsfälle
- Admin-Bereiche und Login-Seiten vom Crawling ausschließen
- Duplicate Content vermeiden (z.B. Druckversionen, Parameter-URLs)
- Crawl-Budget effizient nutzen
- Suchmaschinen auf die Sitemap hinweisen
Wichtige Hinweise
- Die robots.txt verhindert nicht die Indexierung — sie verhindert nur das Crawling
- Verwenden Sie den Meta-Tag „noindex“, um Seiten aus dem Index zu entfernen
- Sensible Daten sollten durch Authentifizierung geschützt werden, nicht durch robots.txt
- Testen Sie Ihre robots.txt mit dem Google-Tool für die robots.txt-Prüfung
robots.txt und SEO
Eine korrekt konfigurierte robots.txt hilft Suchmaschinen, das Crawl-Budget effizient zu nutzen. Fehler in der robots.txt können dazu führen, dass wichtige Seiten nicht gecrawlt und somit nicht indexiert werden.
Zusammenfassung
Die robots.txt ist ein einfaches, aber mächtiges Werkzeug zur Steuerung des Suchmaschinen-Crawlings. Eine sorgfältige Konfiguration ist essentiell für eine erfolgreiche SEO.
Brauchen Sie Unterstützung?
Unsere Experten helfen Ihnen, die richtigen SEO- und Digitalstrategien für Ihr Unternehmen umzusetzen.
Kostenlos beraten lassenWeitere Artikel im Wiki-Lexikon
Was sind HTTP-Statuscodes?
HTTP-Statuscodes sind dreistellige Zahlen, die den Status einer HTTP-Anfrage anzeigen. Erfahren Sie die wichtigsten Codes: 200, 301, 404, 500 und ihre SEO-Relev
Was ist ein Backlink?
Ein Backlink ist ein eingehender Link von einer anderen Website. Erfahren Sie, warum Backlinks der wichtigste Off-Page-SEO-Faktor sind und wie Sie sie aufbauen.
Was ist ein Dofollow-Link?
Ein Dofollow-Link ist ein Hyperlink, der Linkautorität (Link-Juice) an die verlinkte Seite weitergibt. Erfahren Sie den Unterschied zwischen Dofollow und Nofoll
Was ist Earned Media?
Earned Media ist die kostenlose Berichterstattung über Ihre Marke durch Dritte. Erfahren Sie den Unterschied zu Paid und Owned Media und wie Sie Earned Media ge