Mailinglisten-Archive |
Sebastian Bergmann wrote: > ich suche nach einer einfachen Möglichkeit aus einer HTML Datei > bestimmte Textfragmente zu extrahieren, die jedoch immer an anderen > Positionen in der Datei stehen werden. ... > Die "nähere Umgebung" der zu extrahierenden Textfragmente ist natürlich > immer gleich. Naja, nehme ich zumindest an :) Nur unter der Bedingung, daß Du das smiley verwirfst, dem Kunden klar machst, daß ein Parser immer nur für ein bestimmtes Format gilt, hast Du eine Chance den Auftrag erfolgreich abzuschließen. Kunden sind leider sehr ungehalten, wenn der Programmierer von Kommaritis oder Zeichensatzwahn befallen ist. Definiere deshalb zunächst die das Format genau ist. Anschließend kannst Du mit den Stringfunktionen, insbesonders der preg_* Gruppe die Datei bearbeiten und einzelne Informationen isolieren. Was ein regulärer Ausdruck, den die preg_* Funktionen benutzen ist, mußt Du lernen. Eine Einführung gibt das Manual unter: http://www.php.net/manual/pcre.pattern.syntax.php3 http://www.php.net/manual/pcre.pattern.modifiers.php3 Diese Dinge muß man einfach in den Grundzügen beherrschen, um einen Parser zu schreiben. Es wird auch nicht viel bringen hier zu posten, bevor man es gelesen hat. Bei Detailproblemen kann Dir die Liste wieder weiterhelfen. Ulf -- Ulf Wendel NetUSE Kommunikationstechnologie GmbH Siemenswall, D-24107 Kiel, Germany Fon: +49 431 386435 00 -- Fax: +49 431 386435 99
php::bar PHP Wiki - Listenarchive