XML Inhalt mit Regex auslesen

Deadman44 · 14. Mai 2009, 18:40

Hi Leute,
ich habe mich jetzt vor kurzen mal mit Regulären Ausdrücken in PHP bescchäftigt. Komme soweit auch gut voran, aber ich habe mir selbst als Übung gestellt, den Inhalt von zwei XML Tags auszulesen.

Quellcode

<?php
$uri = "<xml>Test</xml>";
preg_match("/Bla/", $uri, $matches);
echo "<pre>{$matches[0]}</pre>";
?>

Ich wöllte also gerne als Ergebnis "Test" haben. Ich sitze schon seit 2 Stunden daran und bin mittlerweile mit den Nerven am Ende.
Google hat mir leider auch nicht weitergeholfen, da dort immer auf simplexml verwiesen wird. Mir gehts ja eigenetlich nur um die Übung mit den regulären Ausdrücken.
Vielleicht kann mir ja einer sagen, wie der Ausdruck genau auszusehen hat, damit ich auf das gewünschte Ergebnis komme.

Torben Brodt · 14. Mai 2009, 18:50

ganz einfach.
Das was du in Variablen haben willst packst du in Klammern.
Und alle / musst du mit \ escapen:

Quellcode

<?php
$uri = "<xml>Test</xml>";
preg_match("/<xml>(.+)<\/xml>/", $uri, $matches);
printf("<pre>%s</pre>", htmlentities(print_r($matches,1)));
?>

Output:

Array
(
[0] => <xml>Test</xml>
[1] => Test
)

Das erste ist wie du merkst immer der gesamte matchende String. Das zweite nur die Variable. Andere Variablen erreichst du mit den weiteren Indizes.

Lg

Deadman44 · 14. Mai 2009, 21:12

Danke D0nut. Aber auf diese Idee bin ich auch schon gekomemn. Aber was ich erreichen wollte ist, dass ich beliebige Tags als Input benutzen kann, ohne etwas an den regexp zu ändern. Also dass man sich anhand der < und > orientiert.

Torben Brodt · 14. Mai 2009, 22:12

Na gut, Schritt2 ist das

Quellcode

preg_match("/<([^>]+)>(.+)<\/([^>]+)>/", $uri, $matches);

... muss jetzt weg

Deadman44 · 14. Mai 2009, 22:26

Ich bin eben auch noch auf eine einfache Lösung bekommen. Beim zweiten Blick auf deine Antwort habe ich erst die Klammern bemerkt (von denen ich vorher nichts wusste).
Und dann kann man einfach mit deinem ersten Ausdruck in leicht abgewandelter Form auch das machen, was ich will:

Quellcode

preg_match("/<.+>(.+)<\/.+>/", $uri, $matches)
echo {$matches[1]};

Habe deinen zweiten Ausdruck jetzt nicht mehr ausprobieren können, da ich momentan unter windows bin. Aber ich vertraue dir mal, dass er seine Aufgabe auch erfüllt ;-).
Vielen Dank für den (ungewollten) Hinweis auf die Klammern.

Torben Brodt · 15. Mai 2009, 17:39

das [^>]+ heißt übrigens "suche so lange weiter bis du das Zeichen '>' findest"

Wenn du mehrere xml tags in deinem String hast, weiß ich nie ob er bei deinem Ausdruck nun das letzte oder erste Tag nimmt.

PHP0Kid · 15. Mai 2009, 18:34

So wie ich das sehe, matcht der Ausdruck so viel er kann ..

das ist eigentlich das selbe Problem, wie unter BB Code Liste vor einigen Tagen. Im Prinzip läufts wieder auf die Verschachtelung heraus:

<tag1><other_tag><tag1>inhalt</tag1></other_tag></tag1>

Er kann nicht erkennen, dass ein Tag noch offen ist, so dass er eben mit dem ersten Tag "tag1" matcht, das er findet. Damit gibtsn Kuddelmuddel =)

Quellcode

Quellcode

Quellcode

Quellcode

Teilen

Tags