Robots.txt Generator
Bygg en robots.txt-fil med en visuell editor.
# robots.txt generated by raatools.net User-agent: * Allow: / Disallow: /admin/ Disallow: /private/ Disallow: /api/ Sitemap: https://example.com/sitemap.xml
Hva er robots.txt?
Robots.txt er en tekstfil plassert i roten av et nettsted (example.com/robots.txt) som forteller søkemotorenes crawlere hvilke sider eller seksjoner de har lov eller ikke lov til å crawle. Den er en del av Robots Exclusion Protocol, en frivillig standard som veloppdragne crawlere (som Googlebot og Bingbot) følger for å respektere nettstedeierens crawlepreferanser.
En robots.txt-fil består av regler som spesifiserer User-agent (hvilken crawler regelen gjelder for) og Disallow- eller Allow-direktiver (hvilke stier som skal blokkeres eller tillates). Du kan også spesifisere plasseringen til XML-sitemapet ditt. Selv om robots.txt ikke kan forhindre bestemte skrapere fra å få tilgang til innholdet ditt, respekterer alle store søkemotorer den.
Robots.txt-syntaks
- User-agent: * — gjelder alle crawlere. Bruk spesifikke navn som Googlebot for målrettede regler.
- Disallow: /admin/ — blokkerer crawling av /admin/-katalogen og alt i den.
- Allow: /admin/public/ — overstyrer en bredere Disallow for å tillate spesifikke stier.
- Sitemap: https://example.com/sitemap.xml — forteller crawlere hvor de finner sitemapet ditt.
Slik bruker du dette verktøyet
Velg ønskede innstillinger — hvilke crawlere du vil målrette, hvilke kataloger du vil blokkere, og om du vil inkludere en sitemapreferanse. Verktøyet genererer en gyldig robots.txt-fil som du kan laste ned eller kopiere. Det validerer også eksisterende robots.txt-filer for syntaksfeil og motstridende regler.
Vanlige brukstilfeller
Blokker administrasjonspaneler og påloggingssider fra indeksering. Forhindre crawling av duplikatinnhold eller tynne sider. Blokker spesifikke roboter (som AI-treningscrawlere). Forhindre indeksering av staging- eller utviklingssider. Skjul private kataloger som ikke bør vises i søkeresultater. Begrens hastigheten til aggressive crawlere med Crawl-delay-direktiver.
Ofte stilte spørsmål
Beskytter robots.txt privat innhold?
Nei. Robots.txt er et forslag, ikke et sikkerhetstiltak. Enhver person eller robot kan lese robots.txt-filen din og bevisst ignorere den. Faktisk sjekker ondsinnede roboter ofte robots.txt for å finne interessante kataloger å angripe. For virkelig privat innhold, bruk autentisering (passord), tilgangskontroller på serversiden, eller noindex-metataggen.
Hva skjer hvis jeg ikke har en robots.txt-fil?
Uten en robots.txt-fil antar crawlere at de har tilgang til alt på nettstedet ditt. Dette er greit for de fleste nettsteder. Hvis en crawler ber om robots.txt og får en 404 (ikke funnet), behandler den dette som tillatelse til å crawle alt. Opprett bare en robots.txt hvis du trenger å begrense crawling av bestemte seksjoner.