Mailinglisten-Archive |
Hallo Alexander, > Gibt es eine Möglichkeit, eine Word-Datei im doc-Format mit allen > Formatierungen in eine HTML-Datei umzuwandeln. Ich möchte ermöglichen, dass Jein. Word bietet zumindest die Funktion, eine Seite als HTML-abzuspeichern. Diese von Word erzeugte HTML-Datei könntest Du auf den Server laden. Allerdings schreibt MS Word ziemlichen Mist in so eine Datei. Und diesen Mist sollte man besser entfernen. Zunächst einmal kannst Du das Dokument mit strip_tags() bearbeiten und nur die Tags zulassen, die Du erlauben möchtest. Also zum Beispiel HTML, DIV, P, STRONG, UL, ... so hast Du den gröbsten Mist von Word schon einmal entfernt. Die restlichen "Sauereien" versuchst Du dann mit regulären Ausdrücken auszumerzen. Viele Grüße, Lars Brinkmann
php::bar PHP Wiki - Listenarchive