Robots.txt Mozektevidi.net - Píše Olda Šálek.

Robots.txt

Něco málo o robots.txt, možnost zneužití. V robots.txt se můžou nacházet tajné informace.

image of Robots.txt

Robots.txt zneužití

Nic není jak vypadá

Tedy jenom krátce:
Na většině webů je soubor robots.txt, ten může vypadat takto:

User-agent: * 
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /help/
Disallow: /images/
Disallow: /includes/
Disallow: /language/
Disallow: /mambots/
Disallow: /media/
Disallow: /modules/
Disallow: /templates/
Disallow: /installation/

Co z toho vyplývá? Třeba administrační sekce nebo i tajné složky a seznam redaktorů

Odhalené struktury webů

Podle jednoho txt souboru se dá odhalit i struktura webu. Např:

User-agent: *
Disallow: /stats/
# uzivateluv robots.txt nasleduje:

User-agent: *
Disallow: /Photos/
Disallow: /Anketa/
Disallow: /Design/
Disallow: /Screens/
Disallow: /Soubory/
Disallow: /stats/

vypadá vstkutku zajímavě 8-), proto si dávejte pozor, jaké informace prostřednictvím robots.txt sdělíte široké veřejnosti.


autor článku Oldřich Šálek | datum publikování 27.listopad.2006 19:12 | články o IT bezpečnosti a obraně proti hackingu IT bezpečnost |

Kometáře


Komentáře a diskuze ke článku tady
diskuze ke článku