phpbar.de logo

Mailinglisten-Archive

[php] =?iso-8859-1?B?QW50d29ydDogW3BocF0gUmU6IFtwaHBdIFN1Y2gtRnVua3Rpb24gZvxy?= =?iso-8859-1?B?IEhUTUwtU2VpdGVu?= =?iso-8859-1?B?IEhUTUwtU2VpdGVu?=

[php] =?iso-8859-1?B?QW50d29ydDogW3BocF0gUmU6IFtwaHBdIFN1Y2gtRnVua3Rpb24gZvxy?= =?iso-8859-1?B?IEhUTUwtU2VpdGVu?= =?iso-8859-1?B?IEhUTUwtU2VpdGVu?=

shr_(at)_tro.net shr_(at)_tro.net
Fri, 1 Sep 2000 16:29:54 +0200


Hi,

wir machen es mit "glimpse" (nicht "webglimpse") und einerselbstbauloesung 
mit perl.
schnell einfach und 100%ig.
Exclude Funktionen etc.

ist imho am einfachsten.

wenn du alle seiten aus einer DB generierst, ist natuerlich der weg ueber 
eine volltextsuche via DB recht einfach.


Mit freundlichem Gruß,

      Stephan Hermann
      Application Software Developer
      Tel.: +49-2241-8729-73
      eMal: shr_(at)_tro.net

-- 
tro:net GmbH & tro:media GmbH
Network & New Media Solutions
Klevstraße 4
D-53840 Troisdorf
Tel.: +49-2241-8729-0
Fax: +49-2241-8729-12




"Alexander Ott" <A.Ott_(at)_bau-igel.de>
Gesendet von: php-admin_(at)_php-center.de
01.09.00 12:45
Bitte antworten an php

 
        An:     <php_(at)_php-center.de>
        Kopie: 
        Thema:  [php] Re: [php] Such-Funktion für HTML-Seiten
Justine schrieb:
>Könnte mir jemand theoretisch ein Such-Programm für die eigenen Webseiten
>erklären, ich meine womit fange ich an (und natürlich folgende Schritte)
und
>welche PHP-Befehle mir da Hilfreich sein können.
>
Falls Du nicht über eine Datenbank verfügst, kann ich Dir nur empfehlen,
einen Dienst wie zum Beispiel: http://www.freefind.com in Anspruch
zu nehmen (ist zwar nicht php, sorry, aber dafür ziemlich gut gemacht)

Ansonsten ists ein bisschen schwierig das so theoretisch zu erklären, aber 
:
Um die Seiten zu indizieren, als erstes die ganze HTML-Seite in eine 
einzige
Variable einlesen.dann kannst Du mit:

$a=strpos(strtolower($htmldatei), "<titel>");
$b=strpos(strtolower($htmldatei), "</titel>");
$titel=substr($htmldatei, 7+$a, $b-$a-7);

zum Beispiel den Titel der Seite auslesen. Anschliessend mit:

$htmldatei=strip_tags($htmldatei);

die HTML-Tags entfernen, und so hast Du ja schon mal den Inhalt und
den Titel der Seite. Nach den Verweisen zu graben ist ein Bisschen
komplizierter, aber im prinzip sucht man auf ähnliche Weise nach "<a 
href="
und schreibt sie dann in eine Datei hinein, nach vorherigem überprüfen, ob
der
Link da nicht schon vorhanden ist.

Das alles ist aber ja nur quasi der "robot"-Teil der Suchmaschine, die
eigentliche
Suchfunktion ist allerdings vergleichsweise einfach.

soweit mal zum theoretischen Grundgerüst (zumindest hab ich das mal
irgendwann so gemacht)

Der absolut bessere Weg ist allerdings, Deine Website in einer
MySql-Datenbank abzuspeicherm Dann musst Du dann nicht jedesmal wenn
Du etwas an Deiner Seite geändert hast, Deine Suchdatenbank auch
updaten, da diese ja dann die Website selber ist.

Schöne Grüsse, Alexander


-- 
** Durchgehend geöffnet: http://www.php-center.de **
Die PHP-Liste: mailto:php_(at)_php-center.de
http://infosoc.uni-koeln.de/mailman/listinfo/php






php::bar PHP Wiki   -   Listenarchive