phpbar.de logo

Mailinglisten-Archive

[php] =?iso-8859-1?Q?Re:_=5Bphp=5D_Such-Funktion_f=FCr_HTML-Seiten?=

[php] =?iso-8859-1?Q?Re:_=5Bphp=5D_Such-Funktion_f=FCr_HTML-Seiten?=

Alexander Ott A.Ott_(at)_bau-igel.de
Fri, 1 Sep 2000 11:45:01 +0100


Justine schrieb:
>Könnte mir jemand theoretisch ein Such-Programm für die eigenen Webseiten
>erklären, ich meine womit fange ich an (und natürlich folgende Schritte)
und
>welche PHP-Befehle mir da Hilfreich sein können.
>
Falls Du nicht über eine Datenbank verfügst, kann ich Dir nur empfehlen,
einen Dienst wie zum Beispiel: http://www.freefind.com in Anspruch
zu nehmen (ist zwar nicht php, sorry, aber dafür ziemlich gut gemacht)

Ansonsten ists ein bisschen schwierig das so theoretisch zu erklären, aber :
Um die Seiten zu indizieren, als erstes die ganze HTML-Seite in eine einzige
Variable einlesen.dann kannst Du mit:

$a=strpos(strtolower($htmldatei), "<titel>");
$b=strpos(strtolower($htmldatei), "</titel>");
$titel=substr($htmldatei, 7+$a, $b-$a-7);

zum Beispiel den Titel der Seite auslesen. Anschliessend mit:

$htmldatei=strip_tags($htmldatei);

die HTML-Tags entfernen, und so hast Du ja schon mal den Inhalt und
den Titel der Seite. Nach den Verweisen zu graben ist ein Bisschen
komplizierter, aber im prinzip sucht man auf ähnliche Weise nach "<a href="
und schreibt sie dann in eine Datei hinein, nach vorherigem überprüfen, ob
der
Link da nicht schon vorhanden ist.

Das alles ist aber ja nur quasi der "robot"-Teil der Suchmaschine, die
eigentliche
Suchfunktion ist allerdings vergleichsweise einfach.

soweit mal zum theoretischen Grundgerüst (zumindest hab ich das mal
irgendwann so gemacht)

Der absolut bessere Weg ist allerdings, Deine Website in einer
MySql-Datenbank abzuspeicherm Dann musst Du dann nicht jedesmal wenn
Du etwas an Deiner Seite geändert hast, Deine Suchdatenbank auch
updaten, da diese ja dann die Website selber ist.

Schöne Grüsse, Alexander



php::bar PHP Wiki   -   Listenarchive