Home arrow Internet arrow Homepage arrow Unerwünschte Bots ausperren

Werbung

Login Form






Passwort vergessen?

Info

Der Winhilfe.info Rss-Feed ist RSS 2.0 kompatibel

[Valid RSS]

This rss feed is compatible

Was ist Rss? 

Werbung


Unerwünschte Bots ausperren PDF 
Geschrieben von Ste   
So nutzen zum Beispiel Spammer auch solche Programme um das Internet zu durchsuchen um nach E-Mail Adressen zu suchen. Außerdem gibt es auch noch Programme die Ihre komplette Website runterladen können um zum Beispiel alle Ihre selbst erstellten Wallpapers zu haben, und diese dann auf der eigenen Page anzubieten. Ein Beispiel für diese Art von Programmen sind GetRight oder webzip, die die ganze Struktur einer Seite runterladen können.

Um so was zu vermeiden reicht es folgendes zu machen.

Die datei txt.htccess runterladen << Stand 6 Dez 2005

Nun starten wir das FTP Programm und achten dabei darauf, dass unsichtbare Dateien sichtbar sind.

Dann laden wir die Datei in das Hauptverzeichnis unserer Seite und bennen sie in .htaccess um.

FERTIG


Natürlich könnt ihr diese Liste bis ins unendliche fortführen, am besten die Log Dateien angucken und nach auffälligen Sachen Ausschau halten.

Wenn ihr eine neue Kennung in euren Logs erkennt öffnet ihr einfach die und fügt unter
RewriteCond %{HTTP_USER_AGENT} ^Zeus [OR], RewriteCond %{HTTP_USER_AGENT} ^NEUEKENNUNG [OR] ein.

Kein Bot mit den oben aufgelisteten Namen kann unsere Seite betreten. Da sich die Browserkennungen ändern muss man manchmal auch über die IP sperren.

ACHTUNG!: Wenn Ihr eine IP
sperrt, bedenkt immer das es sich um eine dynamische IP (wird bei jeder neu Einwahl, neu vergeben) handeln könnte und ihr somit später einem unschuldigen den Zutritt auf Eure Homepage verwehren könnt.


<Limit GET>
order allow,deny
deny from 172.0.0.1
allow from all
</Limit>


ROBOTS.TXT




Robots.txt dient dazu um den Suchmaschinen Bots zu sagen was sie dürfen, das
ganze ist keine Regel, sondern nur eine Richtlinie, darum halten sich auch
böswillige Bots nicht daran. Eine Robots.txt sollte aber trotzdem auf jeder Seite
vorhanden sein.



die Robots.txt sieht so aus wenn ihr alles erlauben wollt.




User-agent: *



Disallow:




Da es ja eigentlich nicht wirklich schützt erkläre ich auch nicht wie was man
eintragen muss um die Bots zu blocken, wer es trotzdem wissen will sollte
hier schauen



http://de.selfhtml.org/diverses/robots.htm


Diskussion zum Thema: Böse bots ausperren
Letzte Aktualisierung ( Wednesday, 07 December 2005 )
 
< zurück

 


Bei Fragen oder Unklarheiten, benutzen Sie bitte das Winhilfe.ch Forum
Google
 
Web www.winhilfe.info
www.winhilfe.ch
BlueBusiness by luka@kujawa.biz