Robotstxt-Generator

Erstellen Sie eine einsatzbereite robots.txt-Datei für Suchmaschinen und validieren Sie die Direktiven vor der Veröffentlichung. Generieren Sie globale und bot-spezifische Regeln, fügen Sie Sitemap- und Crawl-Hinweise hinzu und finden Sie häufige Fehler wie fehlende User-Agent-Gruppen, ungültige Sitemap-URLs oder zu weit gefasste Disallow-Muster.

Robotstxt-Generator

▦ Schnellbeispiele

Laden Sie eine vollständige Vorlage, um eine praktische robots.txt-Datei für eine Live-Seite zu erstellen, testen Sie eine strengere E-Commerce-Crawl-Policy oder fügen Sie eine vorhandene Datei ein und prüfen Sie diese vor dem Deployment.

Modus

Workflow wählen

Aktion Erstellen Sie eine neue robots.txt-Datei aus strukturierten Feldern oder validieren Sie eine bereits vorhandene Datei.

Grundlagen

Website-Kontext definieren

Website-URL Wird verwendet, um Sitemap-Pfade in absolute URLs wie `https://example.com/sitemap.xml` umzuwandeln.

Primärer User-Agent Verwenden Sie `*` für alle Crawler oder zielen Sie auf einen spezifischen Bot wie `Googlebot` ab.

Header-Kommentar Optionale Kommentarzeile für den Anfang der generierten Datei. Halten Sie sie funktional und kurz.

Regeln

Globale Allow- und Disallow-Pfade festlegen

Allow-Direktiven Ein Pfad pro Zeile. Beispiel: `/` oder `/wp-admin/admin-ajax.php`.

Disallow-Direktiven Blockieren Sie minderwertige Bereiche wie `/cart/`, `/checkout/`, `/search` oder `/admin/`, falls angemessen.

Bots

Sitemap und bot-spezifische Abschnitte hinzufügen

Sitemap-URLs Eine Sitemap pro Zeile. Relative Pfade werden gegen die Website-URL konvertiert.

Zusätzliche User-Agent-Blöcke Fügen Sie hier rohe `User-agent:`-Gruppen für Bild-Bots, Anzeigen-Bots oder Staging-Regeln ein.

Crawl-delay Optional. Diese Direktive wird nicht von allen Suchmaschinen einheitlich unterstützt.

Host Optional. Normalerweise ein reiner Hostname wie `example.com`.

Clean-param-Direktiven Optionale suchmaschinenspezifische Parameter-Bereinigungsregeln, eine Direktive pro Zeile.

Validierung

Zu prüfende Datei einfügen

Inhalt der robots.txt Fügen Sie die vorhandene Datei genau so ein, wie sie erscheint, einschließlich Kommentaren und mehrerer Crawler-Gruppen.

Leitfaden

Was dieses Tool prüft

Der Bericht sucht nach strukturellen Problemen wie fehlenden `User-agent`-Gruppen, nicht-absoluten Sitemap-URLs, nicht-numerischen `Crawl-delay`-Werten und Mustern, die wichtige Ressourcen oder die gesamte Website blockieren könnten.

Nutzen Sie die robots.txt für das Crawl-Management, nicht als Sicherheitsbarriere für sensible Inhalte.
Interne Suche, Warenkorb, Checkout und Admin-Pfade sind häufige Kandidaten für `Disallow`.
Blockieren Sie nicht leichtfertig CSS, JavaScript oder geteilte Assets, die Suchmaschinen beim Rendern der Seite helfen.
Veröffentlichen Sie die endgültige Datei im Root-Verzeichnis der Domain, sodass die Live-URL `https://example.com/robots.txt` lautet.

User-agent Allow / Disallow Sitemap Crawl-delay

Der Ergebnisbereich enthält die endgültige Datei, eine Crawl-Zusammenfassung und eine Reihe von Warnungen oder Hinweisen, die Sie vor dem Deployment prüfen können.

Embed Robotstxt-Generator Widget

Robotstxt-Generator

Eine robots.txt-Datei teilt Crawlern mit, welche Teile einer Website sie abrufen dürfen, welche Pfade nicht in die Crawl-Warteschlange gehören und wo sich die XML-Sitemap befindet. Für die SEO- und GEO-Sichtbarkeit ist es nicht das Ziel, alles Risikoreiche standardmäßig zu blockieren. Das Ziel ist es, minderwertige Crawl-Pfade zu schützen, das Crawl-Budget für kanonische Seiten zu schonen und die Datei an dem auszurichten, was auf der Domain tatsächlich öffentlich ist. Eine nützliche robots.txt-Policy nennt in der Regel konkrete Abschnitte wie Admin-Ordner, Checkout-Prozesse, interne Such-URLs, facettierte Filter oder reine Staging-Blöcke anstelle vager „SEO-Einstellungen“.

Anwendung

Modus wählen. Nutzen Sie 'robots.txt generieren', um eine neue Datei aus strukturierten Eingaben zu erstellen, oder wechseln Sie zu 'Bestehende robots.txt validieren', wenn Sie bereits einen Entwurf oder eine Live-Datei haben.
Crawl-Regeln und Sitemap-Details eingeben. Fügen Sie die öffentliche Website-URL, Ihren Haupt-`User-agent`, einen Allow- oder Disallow-Pfad pro Zeile und alle benötigten bot-spezifischen Abschnitte oder Sitemap-URLs hinzu.
Bericht erstellen. Führen Sie das Tool aus, um die endgültige Datei zu erstellen, die geparsten Crawler-Gruppen zu überprüfen und Warnungen auf riskante Muster wie blockierte Assets oder fehlende absolute Sitemap-URLs zu untersuchen.
Erst nach Überprüfung veröffentlichen. Kopieren Sie die Ausgabe, wenn die Regeln Ihre tatsächliche Crawl-Absicht widerspiegeln, platzieren Sie die Datei dann unter `/robots.txt` auf dem Live-Hostnamen und testen Sie die bereitgestellte URL.

Direktiven-Strategie und häufige Fehler

Direktive oder Muster	Wann es hilft	Was oft schiefgeht
`User-agent: *`	Erstellt ein globales Regelwerk für die meisten Bots, wenn keine spezielle Behandlung erforderlich ist.	Benutzer fügen `Allow`- und `Disallow`-Zeilen hinzu, bevor sie eine User-Agent-Gruppe definieren, was die Parser-Klarheit schwächt.
`Disallow: /search`	Nützlich zum Blockieren interner Suchseiten, die dünne, duplizierte URL-Kombinationen erzeugen.	Versehentliches Blockieren öffentlicher Kategorie- oder Produktseiten, weil das Pfadmuster breiter als beabsichtigt ist.
`Sitemap: https://example.com/sitemap.xml`	Hilft Crawlern, kanonische URLs und neue Inhalte schneller zu entdecken.	Verwendung eines relativen Pfads oder einer veralteten Staging-Sitemap-URL in der Produktion.
`Crawl-delay`	Wird manchmal für Crawler hinzugefügt, die eine Drosselung von Anfragen unterstützen.	Die Annahme, dass Google dies befolgt. Google ignoriert `Crawl-delay`, daher ist es kein universeller Mechanismus zur Ratensteuerung.
`Disallow: /assets/js/`	Wird auf einer normalen öffentlichen Website selten benötigt.	Blockieren von Render-Ressourcen, die Suchmaschinen benötigen, um Layout, Funktionalität und Seitenqualität zu verstehen.

Praktische Anwendungsfälle

Auf einer WordPress-Seite ist es eine gängige Regel, `/wp-admin/` zu verbieten, während `/wp-admin/admin-ajax.php` erlaubt wird, da dies die meisten Admin-Bildschirme aus den Crawl-Pfaden heraushält, ohne einen häufig benötigten Endpunkt zu blockieren. Auf einer E-Commerce-Website wird robots.txt oft verwendet, um Crawl-Verluste durch Warenkorbseiten, Kontobereiche, Checkout-Prozesse, facettierte Navigation oder interne Ergebnisseiten zu begrenzen, die durch Sortier- und Filterparameter generiert werden. Auf einer Staging-Site kann ein vorübergehendes seitenweites Disallow sinnvoll sein, sollte aber vor dem Start entfernt und nach DNS- oder Deployment-Änderungen erneut geprüft werden.

Der Validator ist auch nützlich, wenn man eine Datei von einem anderen Team übernimmt. Er kann subtile Probleme erkennen, wie eine nicht-absolute Sitemap-Zeile, eine fehlerhafte `Host`-Direktive oder einen `Crawl-delay`-Wert, der als Text statt als Zahl geschrieben wurde. Diese Details sind wichtig, denn eine robots.txt-Datei ist einfach, aber Produktionsfehler sind es oft auch.

Was Robots.txt NICHT tut

Robots.txt ist eine Datei für das Crawl-Management, kein Zugangskontrollsystem und kein garantierter Schalter für die Deindexierung. Wenn eine URL blockiert, aber von anderer Stelle verlinkt ist, können Suchmaschinen diese URL dennoch in den Suchergebnissen anzeigen, ohne ihren vollständigen Inhalt zu crawlen. Sensible Dokumente, Admin-Tools und private Umgebungen sollten durch Authentifizierung, Netzwerkbeschränkungen oder explizite Noindex-Strategien auf crawlbaren Seiten geschützt werden. Diese Unterscheidung ist eines der häufigsten Missverständnisse in technischen SEO-Diskussionen.

FAQ

Was sollte eine robots.txt-Datei für eine normale öffentliche Website enthalten?

Eine vernünftige Produktionsdatei beginnt in der Regel mit einer User-agent-Gruppe, blockiert nur minderwertige oder private Crawl-Pfade wie Admin-Bereiche, interne Suchseiten, Warenkorb-Prozesse oder Kontobildschirme und enthält eine Sitemap-URL mit vollständigem Protokoll und Hostnamen. Die meisten öffentlichen Seiten sollten CSS, JavaScript oder ihre Hauptinhaltsordner nicht blockieren.

Verhindert robots.txt, dass eine Seite indexiert wird?

Nein, nicht von sich aus. Robots.txt teilt Crawlern mit, was sie nicht abrufen sollen, aber eine blockierte URL kann dennoch basierend auf externen Links oder zuvor entdeckten Signalen indexiert werden. Wenn Ihr eigentliches Ziel die Indexsteuerung ist, benötigen Sie eine dafür vorgesehene Methode, wie noindex auf crawlbaren Seiten oder eine Authentifizierung für private Ressourcen.

Sollte ich eine Sitemap-Zeile in die robots.txt einfügen?

Normalerweise ja. Eine Sitemap:-Direktive ist ein starker betrieblicher Hinweis für Crawler und eine gute Gewohnheit für große, mehrsprachige oder häufig aktualisierte Seiten. Verwenden Sie eine absolute URL anstelle eines relativen Pfads, damit das Signal eindeutig ist.

Warum wird Crawl-delay im Bericht markiert?

Crawl-delay wird nicht von allen großen Suchmaschinen einheitlich unterstützt. Einige Crawler erkennen es an, Google jedoch nicht. Das Tool markiert es, damit Sie es als gezielte Direktive und nicht als universelle Einstellung für die Crawl-Rate behandeln.

Zitieren Sie diesen Inhalt, diese Seite oder dieses Tool als:

"Robotstxt-Generator" unter https://MiniWebtool.com/de/robotstxt-generator/ von MiniWebtool, https://MiniWebtool.com/

vom miniwebtool-Team. Aktualisiert: 09.03.2026

Andere verwandte Tools:

Domain-AltersprüferNeu

Hreflang Tag GeneratorNeu

Htaccess-Weiterleitungs-GeneratorNeu

HTML-VerschönererNeu

Metatag Generator

Open Graph PrüferNeu

Weiterleitungs-CheckerNeu

Schema Markup GeneratorNeu

WHOIS-AbfrageNeu

XML Sitemap GeneratorNeu

Robotstxt-Generator

Workflow wählen

Website-Kontext definieren

Globale Allow- und Disallow-Pfade festlegen

Sitemap und bot-spezifische Abschnitte hinzufügen

Zu prüfende Datei einfügen

Robotstxt-Generator

Anwendung

Direktiven-Strategie und häufige Fehler

Praktische Anwendungsfälle

Was Robots.txt NICHT tut

FAQ

Was sollte eine robots.txt-Datei für eine normale öffentliche Website enthalten?

Verhindert robots.txt, dass eine Seite indexiert wird?

Sollte ich eine Sitemap-Zeile in die robots.txt einfügen?

Warum wird Crawl-delay im Bericht markiert?

Andere verwandte Tools:

Webmaster-Tools:

Ausgewählte Werkzeuge: