phpbar.de logo

Mailinglisten-Archive

[php] Robot-Erkennung

[php] Robot-Erkennung

TomH php_(at)_phpcenter.de
Fri, 13 Apr 2001 00:36:36 +0200


Hallo an alle.

Ich leg die dumps morgen zum download bereit. Hab aber schon wieder nen
Fehler drin gefunden. Hatte die neuen opera nicht beachtet. Vielleicht
hab ich den ja bis dahin raus.

Ein Teil der TB fuer msie:

CREATE TABLE browser_msie (
   ID varchar(200) NOT NULL,
   VERSION varchar(6) NOT NULL,
   OS varchar(20) DEFAULT 'unknown' NOT NULL,
   ID_SHORT varchar(10) NOT NULL,
   INC_FILE varchar(10) NOT NULL,
   SPECIALS varchar(200),
   HITS bigint(20) DEFAULT '0' NOT NULL,
   UNIQUE ID (ID, ID_SHORT),
   PRIMARY KEY (ID)
);

#
# Dumping data for table 'browser_msie'
#

INSERT INTO browser_msie VALUES ( 'mozilla/3.0 (msie2.0;)', '',
'unknown', 'i1', 'msie', NULL, '0');
INSERT INTO browser_msie VALUES ( 'mozilla/1.22 (msie2.0;)', '',
'unknown', 'i2', 'msie', NULL, '0');
INSERT INTO browser_msie VALUES ( 'mozilla/1.22 (msie1.5;windowsnt;)',
'', 'unknown', 'i3', 'msie', NULL, '0');
INSERT INTO browser_msie VALUES ( 'mozilla/1.22 (msie1.5;windows95;)',
'', 'unknown', 'i4', 'msie', NULL, '0');


Wenn das soweit laeuft, gibts die DB auch als oeffentliche Version.
Allerdings unterscheide ich nur die wirklich verbreiteten browser
wirklich sicher. An den Eintraegen oben kann man hoffentlich sehen, was
gemacht wird. Beim ie werden z.b. solche Sachen wie Hotbar 2.0 aus dem
$HTTP_USER_AGENT rausgeschmissen. 
Beim nn sinds die lang-Angaben. Das muss natuerlich auch wieder gemacht
werden, wenn ein browser anfragt. Browser, die viele von uns
wahrscheinlich nicht mal kennen, kommen unbearbeitet in die DB. Solche
browser sind dann, wenn sie variable Daten im $HTTP_USER_AGENT
verwenden, nicht sicher zu erkennen, ausser man traegt jede Moeglichkeit
in die DB ein.
Derzeit hab ich die DB in Tabellen fuer IE, NN, Opera, AOL-browser und
Andere unterteilt.


Einige Spalten sind noch nicht gefuellt!!


Danke fuer die vielen Aufrufe:))


Bis morgen,

TomH


php::bar PHP Wiki   -   Listenarchive