phpbar.de logo

Mailinglisten-Archive

[PHP] Suchen

[PHP] Suchen

A.Ott Ott_(at)_infocanarias.com
Thu, 18 Nov 1999 16:46:47 -0000


Nachtrag zum Suchscript:
das Script hat den Namen: filemaker.php3, da es mit

echo ("<meta http-equiv=\"refresh\" content=\"5;
>URL=filemaker.php3$scan\">");

sich selbst immer wieder aufruft. (Zeile 25/26) es fehlte
allerdings das Semilokon;

mit freundlichen Grüssen
Alexander Ott

------------------------------------------------------------------------
http://www.bau-igel.de | Architektur- u. Ingenieurbüro
Tel/Fax: +34 928 / 52 95 74 | Ott_(at)_infocanarias.com



-----Ursprüngliche Nachricht-----
Von: A.Ott <Ott_(at)_infocanarias.com>
An: php_(at)_solix.wiso.Uni-Koeln.DE <php_(at)_solix.wiso.Uni-Koeln.DE>
Datum: Donnerstag, 18. November 1999 16:35
Betreff: Re: [PHP] Suchen


>Auf die Gefahr hin das die ganzen php3-Profis jetzt über
>mein Anfägerscript herfallen schicke ich es jetzt trotzdem
>in die Liste, da es jetzt schon drei Leute haben wollen.
>
>Siehe unten, Verbesserungen erwünscht.
>
>mit freundlichen Grüssen
>Alexander Ott
>
>------------------------------------------------------------------------
>http://www.bau-igel.de | Architektur- u. Ingenieurbüro
>Tel/Fax: +34 928 / 52 95 74 | Ott_(at)_infocanarias.com
>
>
>Erläuterung:
>
>folgendes Script erwartet eine Datei namens: "links.txt"
>in der Zeile für Zeile alle zu durchsuchenden URL`s aufge-
>listet sind.
>Es gibt alle gefundenen Suchbegriffe, abzüglich Duplikate
>und Stoppwörter (und, oder etc...) in kleinschrift in die Datei
>"search.txt" aus. Die mitgelieferte Datei "stoppwort.txt" ist
>dazu allerdings erforderlich.
>
>Die beiden Tags:
><!-- FreeFind Begin No Index -->
><!-- FreeFind End No Index -->
>jeweils alleine in einer Zeile der html-Seite schalten die
>Scan-Funktion aus bzw. an.
>
>
><?php
>header("Expires: Mon, 26 Jul 1997 05:00:00 GMT");
>header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");
>header("Cache-Control: no-cache, must-revalidate");
>header("Pragma: no-cache");
>
>echo ("<html><head><title>Website scannen</title>");
>
>if (empty($scan)) {
>   $scan = 1;
>}
>
>$herdamit = fopen("links.txt","r");
>while (!feof($herdamit)) {
>$zeile = fgets($herdamit,1000);
>$zeile = trim($zeile);
>$scanner[] = $zeile;
>}
>fclose($herdamit);
>
>$scandatei = $scanner[$scan];
>$scan = $scan + 1;
>$scan = "?scan=".$scan;
>
>echo ("<meta http-equiv=\"refresh\" content=\"5;
>URL=filemaker.php3$scan\">")
>echo ("</head><body><b>".$scandatei."</b><br>");
>
>$sucher = fopen("$scandatei","r");
>$aktzeil = 0;
>$stoppsjetzt = 0;
>while (!feof($sucher)) {
>$zeile = fgets($sucher,1000);
>$aktzeil = $aktzeil + 1;
>$zeile = trim($zeile);
>if ($zeile == "<!-- FreeFind Begin No Index -->") {
>  $scanornot = 0;
>}
>if ($zeile == "<!-- FreeFind End No Index -->") {
>  $scanornot = 1;
>}
>if ($zeile == "<?php") {
>  $scanornot = 0;
>}
>if ($zeile == "?>") {
>  $scanornot = 1;
>}
>$zeile = strip_tags($zeile);
>$zeile = trim($zeile);
>$zeile = strtolower($zeile);
>if ($scanornot = 1) {
>  $pieces = explode(" ", $zeile);
>  $sortierer = 0;
>  while ($pieces[$sortierer] != "") {
>   $pieces[$sortierer] = str_replace("&quot;", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("&auml;", "ä", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("&ouml;", "ö", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("&uuml;", "ü", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("&Auml;", "Ä", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("&Ouml;", "Ö", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("&Uuml;", "Ü", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("?", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("!", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace(",", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace(";", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace(".", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace(":", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("-", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("+", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("*", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("/", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("(", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace(")", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("=", "", $pieces[$sortierer]);
>   $pieces[$sortierer] = str_replace("\"", "", $pieces[$sortierer]);
>   if (strstr($pieces[$sortierer], "$")) {
>    $pieces[$sortierer] = "";
>   }
>   if (strlen($pieces[$sortierer]) == 1) {
>    $pieces[$sortierer] = "";
>   }
>   $pieces[$sortierer] = trim($pieces[$sortierer]);
>   $stopper = fopen("stoppwort.txt","r");
>   while (!feof($stopper)) {
>    $stopp = fgets($stopper,1000);
>    $stopp = trim($stopp);
>    if ($pieces[$sortierer] == $stopp) {
>     $stoppsjetzt =1;
>     break;
>    }
>   }
>   if (($pieces[$sortierer] != "") && ($stoppsjetzt == 0)) {
>    $keyworte[] = $pieces[$sortierer];
>   }
>   $stoppsjetzt = 0;
>   fclose($stopper);
>   $sortierer = $sortierer + 1;
>  }
>}
>}
>fclose($sucher);
>
>$hochzael = 0;
>while ($keyworte[$hochzael] != "") {
>$zuzael = $hochzael + 1;
>
>while ($keyworte[$zuzael] != "") {
>  if ($keyworte[$hochzael] == $keyworte[$zuzael]) {
>   $keyworte[$zuzael] = "nopassarnada";
>  }
>  $zuzael = $zuzael + 1;
>}
>
>$hochzael = $hochzael + 1;
>}
>
>
>$schreibsjetzt = fopen("search.txt","a");
>fwrite($schreibsjetzt, "URL:\r\n");
>fwrite($schreibsjetzt, "$scandatei\r\n");
>$hochzael = 0;
>while ($keyworte[$hochzael] != "") {
>if ($keyworte[$hochzael] != "nopassarnada") {
>  echo ($keyworte[$hochzael] ."&nbsp;&nbsp; ");
>  fwrite($schreibsjetzt, "$keyworte[$hochzael]\r\n");
>}
>$hochzael = $hochzael + 1;
>}
>fclose($schreibsjetzt);
>
>echo ("<b>erfolgreich gescannt!</b></body></html>");
>
>?>
>
>
>
>
>



php::bar PHP Wiki   -   Listenarchive