Ok, das mit dem regulären Ausdruck hat sich erledigt , habs jetzt hinbekommen

Nun ergeben sich aber 2 neue Fragen:
1. Zeichen wie "
' ' " werden nach der "Behandlung" mit preg_replace nur noch fehlerhaft dargestellt. Liegt das am eingestellten charset? Wenn ja welches soll ich nehmen? Und auf welches charset soll die DB-Tabelle in der das ganze gespeichert werden soll eingestellt sein??
2. Ich will ja meine Suche so bauen, dass, ähnlich wie bei google, bei den Suchergebnissen die betreffenden Textstellen der vorgeschlagenen Dokumente mit ausgespuckt werden und die Suchwörter markiert werden. Dazu müsste ich ja jetzt den Inhalt der Seiten doppelt speichern, oder? Also einmal bereinigt und komprimiert (Stopwörter schon entfernt, Leerstellen entfernt, andere unwichtige Zeichen usw entfernt .. ) und einmal "unbereinigt" aus welchem dann letzteres realisiert werden würde?? Oder gibt es da eine geschicktere Möglichkeit? Bzw. ist die Auslastung der Datenbank dadurch wesentlich höher??
so long . . .
Ollo