Robots.txt Generator

Bygg en robots.txt-fil med en visuell editor.

Sitemap URL

Crawl Delay (seconds, 0 = none)

User-agent:

Allow

Disallow

robots.txt

# robots.txt generated by raatools.net

User-agent: *
Allow: /
Disallow: /admin/
Disallow: /private/
Disallow: /api/

Sitemap: https://example.com/sitemap.xml

Hva er robots.txt?

Robots.txt er en tekstfil plassert i roten av et nettsted (example.com/robots.txt) som forteller søkemotorenes crawlere hvilke sider eller seksjoner de har lov eller ikke lov til å crawle. Den er en del av Robots Exclusion Protocol, en frivillig standard som veloppdragne crawlere (som Googlebot og Bingbot) følger for å respektere nettstedeierens crawlepreferanser.

En robots.txt-fil består av regler som spesifiserer User-agent (hvilken crawler regelen gjelder for) og Disallow- eller Allow-direktiver (hvilke stier som skal blokkeres eller tillates). Du kan også spesifisere plasseringen til XML-sitemapet ditt. Selv om robots.txt ikke kan forhindre bestemte skrapere fra å få tilgang til innholdet ditt, respekterer alle store søkemotorer den.

Robots.txt-syntaks

User-agent: * — gjelder alle crawlere. Bruk spesifikke navn som Googlebot for målrettede regler.
Disallow: /admin/ — blokkerer crawling av /admin/-katalogen og alt i den.
Allow: /admin/public/ — overstyrer en bredere Disallow for å tillate spesifikke stier.
Sitemap: https://example.com/sitemap.xml — forteller crawlere hvor de finner sitemapet ditt.

Slik bruker du dette verktøyet

Velg ønskede innstillinger — hvilke crawlere du vil målrette, hvilke kataloger du vil blokkere, og om du vil inkludere en sitemapreferanse. Verktøyet genererer en gyldig robots.txt-fil som du kan laste ned eller kopiere. Det validerer også eksisterende robots.txt-filer for syntaksfeil og motstridende regler.

Vanlige brukstilfeller

Blokker administrasjonspaneler og påloggingssider fra indeksering. Forhindre crawling av duplikatinnhold eller tynne sider. Blokker spesifikke roboter (som AI-treningscrawlere). Forhindre indeksering av staging- eller utviklingssider. Skjul private kataloger som ikke bør vises i søkeresultater. Begrens hastigheten til aggressive crawlere med Crawl-delay-direktiver.

Eksempel i praksis

Anta at du vil at Google skal indeksere alt bortsett fra staging-mappen og interne søkeresultater. Legg til én gruppe med User-agent: *, en Allow: /-linje og to Disallow-linjer for /staging/ og /search. Legg til Sitemap: https://example.com/sitemap.xml. Den genererte filen forteller hver robot at den kan hente hele nettstedet bortsett fra disse to sti-prefiksene, og peker den til nettstedskartet for effektiv oppdagelse.

Vanlige feil

En vanlig feil er å bruke robots.txt til å skjule sensitive sider. Disallow stopper bare crawling, ikke indeksering — en blokkert URL kan fortsatt dukke opp i resultatene hvis andre nettsteder lenker til den, så bruk heller en noindex-metatagg eller autentisering. En annen felle er å blokkere /css/ eller /js/; Google trenger disse ressursene for å gjengi og vurdere sidene dine. Til slutt: samsvaret skiller mellom store og små bokstaver, så Disallow: /Admin blokkerer ikke /admin.

Ofte stilte spørsmål

Beskytter robots.txt privat innhold?

Nei. Robots.txt er et forslag, ikke et sikkerhetstiltak. Enhver person eller robot kan lese robots.txt-filen din og bevisst ignorere den. Faktisk sjekker ondsinnede roboter ofte robots.txt for å finne interessante kataloger å angripe. For virkelig privat innhold, bruk autentisering (passord), tilgangskontroller på serversiden, eller noindex-metataggen.

Hva skjer hvis jeg ikke har en robots.txt-fil?

Uten en robots.txt-fil antar crawlere at de har tilgang til alt på nettstedet ditt. Dette er greit for de fleste nettsteder. Hvis en crawler ber om robots.txt og får en 404 (ikke funnet), behandler den dette som tillatelse til å crawle alt. Opprett bare en robots.txt hvis du trenger å begrense crawling av bestemte seksjoner.

Garanterer robots.txt at en side holdes utenfor Google?

Nei. Den ber bare regeltro roboter om å hoppe over å hente URL-en. For å holde en side utenfor søkeresultatene på en pålitelig måte, tillat crawling og legg til et noindex-direktiv, eller beskytt den bak innlogging. Ondsinnede roboter ignorerer robots.txt fullstendig.