1.3k Aufrufe
Gefragt in Textverarbeitung von
Hallo Wissende,

habe hier eine ganze Reihe von pdf-Dokumenten, die ich mittels Omnipage zu rtf mache und dann in Word 2002 weiterbearbeite.
Nun kann die Texterkennung ja nicht wissen, ob es sich beim Divis am Zeilenende um eine Trenn- oder ein Kuppel-Divis handelt und macht daraus meist eine Trennfuge.

Das Problem wollte ich nun mittels Suchen/Ersetzen mit Platzhalterzeichen lösen.
Der Suchstring lautet also: ^-[A-Z]

Wie kann ich nun erreichen, das die Fundstellen durch ein Kuppel-Divis plus den gefundenen Großbuchstaben ersetzt werden.

Ein Tip würde mit viel Arbeit ersparen.
Danke

1 Antwort

0 Punkte
Beantwortet von kjg17 Profi (34.4k Punkte)
Hallo,

es gibt dafür keine zulässige Eingabe unter 'Ersetzen durch'.

Wie ich vorgehen würde:

Suche: - ^11 (Bindestrich, Leerzeichen, manueler Zeilenumbruch)
Ersetze: ^- (bedingter Trennstrich)

Suche: ^11 (Manueller Zeilenumbruch)
Ersetze: (keine Eingabe)

Da in dem Dokument die Automatische Silbentrennung standardmäßig deaktiviert ist und es keine manuellen Zeilenumbrüche mehr gibt, richtet sich der Text neu aus und die bedingten Trennstriche vom Zeilenende verschwinden. Es ist natürlich zu kontrollieren, ob der eine oder andere Trennstrich doch seine Berechtigung hatte und muss ggf. neu gesetzt werden. Am einfachsten geht das mit der Rechtschreibprüfung, die würde auf jeden Fall über Großbuchstaben innerhalb eines Wortes stolpern.

Eventuell dann noch:
Suche: - (Bindestriche im Text)
Ersetze: ^~ (geschützter Trennstrich)

Das o.a. setzt voraus, dass dein Omnipage den gescannten Text so formatiert, wie meine OCR-Software und jede Zeile mit einem manuellem Zeilenumbruch abschließt.

Gruß
Kalle
...