phpbar.de logo

Mailinglisten-Archive

[php] php http spider

[php] php http spider

Dennis Sterzenbach lists at darknoise.de
Mon Nov 3 16:17:17 CET 2003


Schmitt Joachim wrote:

Einen neuen Thread öffnet man durch NEUE MAIL VERFASSEN
und _nicht_ durch antworten! (zum X-ten Male)

> schreibe gerade an einem script das alle links und files(bilder, css, js 
Guckstu hier für RegExp Beispiele:
http://www.phpbar.de/hilfen/faq/index.php?ch=regexp
Änder das halt entsprechend auf Deine Wünsche ab.

 > von einer html datei extrahiert. und am besten das ganze noch rekursiv.

Was meinst Du mit rekursiv? Für alle Dateien in einem Unterverzeichnis?
Versuch das hier mal:

function load($dirname)
{
	$dir = dir($dirname);
	if (!is_object($dir)) {
		return false;
	}
	while (false !== ($entry = $dir->read())) {
		if (substr($entry, 0, 1) != '.') {
			if (is_file($dirname . $entry) && substr($entry, strrpos($entry, '.') 
== '.html') {
				// Datei einlesen und validieren
			} elseif (is_dir($dirname . $entry)) {
				load($dirname . $entry);
			}
		}
	}
}

-- 
   Dennis Sterzenbach



php::bar PHP Wiki   -   Listenarchive