phpbar.de logo

Mailinglisten-Archive

AW: [php] Offline Reader aussperren?

AW: [php] Offline Reader aussperren?

Boris Penck php_(at)_phpcenter.de
Tue, 3 Jul 2001 14:27:38 +0200


> Hi Liste,
>
> in letzter Zeit haeuft es sich bei uns, dass immer oefter jemand mit
> einem Offline Reader unsere komplette Site downloaded. Bei ca. 90%
> aller Versuche wird auch der User Agent nicht veraendert, so dass ich
> immer wieder folgende Eintraege finde:
>
> HTTrack 2.0x; Windows 98
> HTTrack 3.0x; Windows 98
> Teleport Pro/1.29.1590
> WebStripper/1.42
> WebZIP/3.80 (http://www.spidersoft.com) WebWasher 3.0
> WebZIP/3.80 (http://www.spidersoft.com)
>
> Nur wenige sind momentan so schlau, dass Sie den User Agent anpassen.
>
> Hat jemand schon einmal mit PHP versucht, diese Grabscher Tools
> auszuschliessen? Meine Idee waere, auf jeder Seite den User Agent zu
> pruefen und, wenn er in einer Liste von definierten Offline Readern
> gefunden wird, dann auf eine Seite ohne jegliche Links umzuleiten.
> Zusaetzlich koennte man natuerlich den Zugriffsversuch mitloggen und
> irgend eine Fehlermeldung ausgeben.
>
> Ich weiss, dass man damit natuerlich nicht diejenigen Experten
> ausschliessen kann, die in der Lage sind, ihren User Agent zu aendern,
> und dass man damit eventuell die Zahl derer erhoeht, die dann eventuell
> erst auf die Idee kommen, den User Agent zu aendern. Aber dies wuerde
> zumindest einen kleinen Schutz bieten.
>
> Was meint ihr? Bin fuer jede Idee / jeden Vorschlag dazu dankbar.

Ich hatte das ahnlich schon mal bei nervigen Suchmaschinen, die sinnlos
und ewigkeiten meinen Server mit anfragen bombardiert haben.

Man rufe auf jeder seite auf:

$deny = array(
"HTTrack 2.0x; Windows 98",
"HTTrack 3.0x; Windows 98",
"Teleport Pro/1.29.1590",
"WebStripper/1.42",
"WebZIP/3.80 (http://www.spidersoft.com) WebWasher 3.0",
"WebZIP/3.80 (http://www.spidersoft.com)"
);

if(in_array($HTTP_USER_AGENT,$deny)) {
	Header("Location: http://www.mcrosoft.com");
}

Bin mir jetzt mir dem $HTTP_USER_AGENT nicht ganz sicher. Aber so werden
diese Grabber schon auf Microsoft.com weitergeleitet und haben sicherlich
genug Links zum grabben ;)

Sollte es sich um eine sinnlose Suchmaschine handeln, ist es auch ganz
proktisch
auf deren eigene Seite weiterzuleiten.

-boris



php::bar PHP Wiki   -   Listenarchive