Copy & Past aus Word to Textfeld

Matrixstyle · 13. September 2007, 15:10

Hallo Leute,

ich habe ein Textfeld welches mit

Quellcode

preg_match(#^[\wäÄöÖüÜß\-\:\.\"\€\@\+\§\$\%\&\/\_\`\´\,\;\?\#\*\=\[\]\!\s]+$#i,string)

überprüft wird. Nun möchte der Anwender gerne aus Word Texte rauskopieren und in das Textfeld einfügen. Dies führt dann zu Problemen weil Word komisch Trennzeichen und sonstigen Müll mit übergibt. Wie kann man den Text davon säubern? Wenn das nicht geht wie muss der Reguläre Ausdruck aussehen das alle erlaubt ist, was mir aber nicht so gut gefallen würde.

Habe schon versucht das in UTF-8 Format zu bringen, leider hat das nichts gebracht.

Quellcode

mb_convert_encoding($string,"UTF-8", "iso-8859-1")

Gruß
Stephan

Torben Brodt · 13. September 2007, 15:27

Poste mal ein Beispiel. Ich glaube das Problem sind die vielen, komischen Tags, die Word mitbringt.
Vielleicht hilft es dir den TinyMCE mal etwas zu zerlegen. Habe dessen Word Plugin mal angehängt.

Matrixstyle · 13. September 2007, 15:42

Habe jetzt mal die Zeichen hinzugefügt. Nun geht es, aber die Zeichen sind ja im Text und sehen scheiße aus. Aber damit müssten die User zurecht kommen

Nun weiß ich leider nicht welche Zeichen Word noch so ausspuckt in Zukunft. Deswegen wäre mir es lieb ein Regulären Ausdruck zunehmen der einfach alles erlaubt, oder ich muss für das Textfeld die preg_match funktion rausnehmen.

#^[\wäÄöÖüÜß\-\:\.\"\€\@\¬\–\“ \„\+\§\$\%\&\/\_\`\´\,\;\?\#\*\=\[\]\!\s]+$#i

Wie benutzt man Word-Plugin ?

Torben Brodt · 13. September 2007, 16:26

Das sind ja komische Zeichen....
Habe jetzt einfach mal ein paar Funktionen aus der TinyMCE Datei genommen.... ist halt JavaScript.

Quellcode

/**
* cleanup word content
* @param content
*/
function word(content) {
var bull = String.fromCharCode(8226);
var middot = String.fromCharCode(183);
var cb;
content = content.replace(new RegExp('(.*?)<\/p>', 'gi'), '$1');
content = content.replace(new RegExp('tab-stops: list [0-9]+.0pt">', 'gi'), '">' + "--list--");
content = content.replace(new RegExp(bull + "(.*?) ", "gi"), "" + middot + "$1");
content = content.replace(new RegExp('', 'gi'), "" + bull); // Covert to bull list
content = content.replace(/<o:p><\/o:p>/gi, "");
content = content.replace(new RegExp(' ', 'gi'), '-- page break --'); // Replace pagebreaks
content = content.replace(new RegExp('<(!--)([^>]*)(--)>', 'g'), ""); // Word comments
content = content.replace(/<\/?span[^>]*>/gi, "");
content = content.replace(new RegExp('<(\\w[^>]*) style="([^"]*)"([^>]*)', 'gi'), "<$1$3");
content = content.replace(/<\/?font[^>]*>/gi, "");
content = content.replace(/<(\w[^>]*) class=([^ |>]*)([^>]*)/gi, "<$1$3");
content = content.replace(/<(\w[^>]*) lang=([^ |>]*)([^>]*)/gi, "<$1$3");
content = content.replace(/<\\?\?xml[^>]*>/gi, "");
content = content.replace(/<\/?\w+:[^>]*>/gi, "");
content = content.replace(/-- page break --\s* <\/p>/gi, ""); // Remove pagebreaks
content = content.replace(/-- page break --/gi, ""); // Remove pagebreaks
content = content.replace(/<h[1-6]> <\/h[1-6]>/gi, '  ');
content = content.replace(/<h[1-6]>/gi, '');
content = content.replace(/<\/h[1-6]>/gi, '');
content = content.replace(/ <\/b>/gi, '  ');
content = content.replace(/^( )*/gi, '');
content = content.replace(/--list--/gi, ""); // Remove --list--
return content;
}

Alles anzeigen

Copy & Past aus Word to Textfeld

Copy & Past aus Word to Textfeld

Quellcode

Quellcode

Quellcode

Teilen

Benutzer online 1

Tags