phpbar.de logo

Mailinglisten-Archive

[php] inhalt einer html-datei mittels reg-expr parsen

[php] inhalt einer html-datei mittels reg-expr parsen

psycho php_(at)_phpcenter.de
Tue, 20 Nov 2001 16:14:59 +0100


  hi

ich habe als newbie folgendes problem:

eine html-datei soll so geparst werden sodass alle texte zwischen bel. 
geschachtelten html-tags vorliegen

bsp:

<tag1>text1 text2 <tag2><tag3>text3</tag3></tag1>

das ergebnis soll nun sein

text1
text2
text3

meine idee war folgender code ( html-datei ist einzeilig ):

<?php
$source = fopen ("test.html", "r");
if ( !$source )
{
   echo "Unable to open remote file.\n";
   exit;
}
 
$line = fgets ( $source, 60000 ); // 60000 = max. groesse von test.html
preg_match_all ( "|<[^>]+>[^<>]+<[^>]+>|U", $line, $out, 
PREG_PATTERN_ORDER );

print $out[0][0].", ".$out[0][1]."\n";
print $out[1][0].", ".$out[1][1]."\n";

fclose ( $source );
?>

die zugehoerige test.html:

<h1>string1</h1><h2><br><h3>string3</h3></h2>

kann mir einer von euch meine(n) fehler nennen und evtl. sogar ne 
loesung anbieten

cu

heiko



php::bar PHP Wiki   -   Listenarchive