Anzeige

Am Puls von Microsoft

Anzeige

Absatzende Entfernen

discipuli

gehört zum Inventar
Ich such ein Tool mit dem ich die Absatzenden einer Doc Datei oder ähnlich berabeiten kann.
und nach Möglichkeit sollten auch die Spaten "richtig" entfernt werden.
Übrigens, das sind die ersten Scan-Versuche mit Czur.
Beispiel hier
Discipuli
Absatzende_entfernen.jpg
 
Anzeige
Ich nehme an, Du benutzt Word von Microsoft.
Da benutzt Du die Funktion "Ersetzen". Du ersetzt die Absatzmarke ^p durch ein leeres Zeichen (Ersetzen durch einfach leer lassen).
Nachdem aber im Dokument nicht zwischen unnützen Absatzmarken und sinnvollen Absatzmarken unterschieden wird, mußt Du das ganze Dokument nachbearbeiten.

Vorher
1710601726657.png


Nachher
1710602228952.png
 
Zuletzt bearbeitet:
Das dürfte sich am einfachsten mit Word selbst erledigen lassen, "Suchen und Ersetzen" ist die Funktion deiner Wahl. Ohne ein klein wenig Handarbeit wird's nicht gehen, ich würde so vorgehen:
  • Suchen nach "-^p", ersetzen durch "" (nichts). Das entfernt die Trennzeichen und Absatzmarken.
  • Suchen nach "^p", ersetzen durch " " (Leerzeichen). Das entfernt alle Absatzmarken und du hast einen Fließtext.
  • Manuell neue Absatzmarken einfügen.
 
Diese Art kenne ich.
Die ist aber nicht das was ich suche.
Vor Urzeiten unter MS Dos hatt ich mal so eine App.
ich glaube das war Script mit dos Befehlen.
Jetzt ist Windows 11 angesagt.
 
Ja danke aber wie geht das?
Ich habe bei dem Link mal geguckt und nur Bahnhof verstanden.
In meinem Alter gebrauche ich leider Konkretes.
Ist halt so, leider

Discipuli
 
gebrauche ich leider Konkretes
Vielleicht findest Du bei Add-In-World etwas passendes. Dort gibt es ein Add-In namens Mehrfach Suchen/Ersetzen-Tool. Ich habe es vor langer Zeit einmal verwendet, um in Word mehrere Begriffe gleichzeitig zu ersetzen. Damals war es sogar gratis. Einen Versuch wäre es wert. Ansonsten gilt für Dein Vorhaben das bereits von den Vorpostern Gesagte.
 
Ist ja Add in World
Tut mir leid, ich habe mit mehreren Browsertabs gearbeitet und offensichtlich war einer davon nicht aktualisiert. Ändert jedoch nichts am Geschehen, denn Discipuli braucht nach wie vor etwas "Konkretes" – was immer das sein soll.

Ich habe bei dem Link mal geguckt und nur Bahnhof verstanden
Ich nehme an, dass Du weißt was ein Add-In ist. Wenn nicht, es handelt sich hierbei um eine Art Zusatz für eine Anwendung, welche diese um eine Funktion ergänzt oder diese überhaupt erst möglich macht.
Beispiel: Word kann nur immer einen Term ersetzen. Ein entsprechendes Add-In würde mehrfache Ersetzungen möglich machen.
Dieses Add-In wird herunter geladen und installiert. Je nach Art des Tools oder der Marktpolitik des Herstellers ist es gratis oder es wird ein Betrag fällig.
Nach der Installation hast Du in Deiner Menüleiste oder bei Word im Menüband einen Zusatzeintrag oder eine eigene Gruppe, aus welcher Du wählen kannst was dieses Add-In überhaupt leisten soll.
Solltest Du etwas passendes finden, dann achte bitte auch darauf, ob es sich um eine 32- oder 64-Bit-Version handelt. Viele Add-Ins sind für 32-Bit-Versionen von Office geeignet und funktionieren mit 64 Bit nicht. Normalerweise sollte sich jedoch beim Add-In ein Hinweis finden.
Falls Du allerdings noch immer "Bahnhof" verstehst, dann empfehle ich wie bereits auch andere User hier die Suchen-und-Ersetzen-Methode von Word. Es ist zwar ein gewisser Aufwand, aber immer noch besser als jede Absatzmarke von Hand zu bearbeiten.
 
Danke für deine lange Anwort.
ich werde es jetzt mal versuchen.
Inzwischen habe ich mal in meinem Kopf rumgerkramt.
Das war eine Bat mit Asci Zeichen Die konnte man auch mit dem Tastatur Block eingeben.
Eine kenne ich noch heute ~ Alt 126.
Für Absatz und für Zeilenumbruch kenn eich nicht mehr.
Wollte ich zwei aufeinder folgende Absäze miit duche eien Zeilenumbru erstzen, wurde der absatz halt zwei mal eingegben. Das alles in einer bat. Dazu hatte ich ein Programm das machte aus einer Bat eine exe. und so weiter
Discipuli
Das ist geschätze 40 Jahre und mehr her.
Und dan kam Windows mit dem ging viel Grundlagenwissen verloren.
 
@discipuli
Etwas vom Thema abweichend gefragt: Du hast ein Beispiel gepostet. Welchen Umfang hat Deine Arbeit in etwa? Handelt es sich um ein paar Seiten oder geht es um hunderte? Scannst Du etwa massenhaft Bücher ein?

Warum muss es ausgerechnet Word (doc) als Zielformat sein? Die Software des Gerätes bietet doch auch andere Formate an. Wenn man der Seite glauben darf, dann ist das System so gut, dass Buchrundungen kein Problem sind und dank ABBYY-Technologie auch die OCR-Ergebnisse entsprechend fehlerfrei.

Ist das Layout auch bei anderen Formaten so wie Du es im Eingangspost zeigtest oder gibt es hier andere Umbrüche? Kannst Du eventuell bei der Erkennungssoftware diesbezügliche Einstellungen vornehmen?
 
Ich habe mir diesen Buchscanner für etwa 400,0 €gekauft.
Bessere kosten so > 100.000,00 €. So viel Geld ist mir die Sache nicht wert.
Für Czur habe ich mich entschieden, weil die wenigsten eine bessere Oberfläche und einige Hilfen haben.
Die Hotline ist genauso schlecht wie z B bei Iris

Ich benötige den Scanner, weil es immer mal wieder größere Mengen zu scannen gibt.
Das sind oft viele gebundenen Seiten.
Gelegentlich auch ganz Bücher mit 300 Seiten oder so ähnlich.

Zuerst wird alles als JPG angegeben.
Dann kann dies in viele Formate konvertieren.
Word OCR
Excel OCR, das wird hoffentlich csv sein.
PDF ,PDF Text suche, Tiff
Diese Formate muss ich noch prüfen.
Wie immer wächst sich so was aus.

Ist ABBYY-Technologie allgemein bekannt?
Du schreibst auch die OCR-Ergebnisse entsprechend fehlerfrei.

Ja, gebogene Seiten werden prima
Zusätzlich habe ich eine einfache Buchwiege.

Discipuli
 
Ok, jetzt ist klar was Du scannst und auch der Umfang. Nur, was machst Du mit den Ergebnissen? Geht es Dir nur darum die gedruckte Ausgabe digital verfügbar zu haben, um bspw lesen zu können und Dir die Schlepperei der Bücher zu ersparen? Dann wäre eine Konvertierung oder Nachbearbeitung gar nicht notwendig. Oder möchtest Du die gescannten Seiten weiter verarbeiten oder/und in ein "normales" Seitenlayout anstelle von Spalten bringen? Das würde Deinen Eingangspost erklären.

Und noch eine Frage zum Beispielbild oben: Ist das eine Hardcopy des Ergebnisses der Scannersoftware, oder wurde bereits die OCR durchgeführt und zeigst Du die Ansicht des Textes in Word als Hardcopy?
 
Warum gibt es keine Angaben zum Gerät? :mad:
Alles muss mühsam erfragt werden.

Ist garnicht schlimm, der Stand nach #15 Beiträgen ist der gleiche, wie bei #1.
 
Und ich habe einen Pc mit Windows drauf.
Der PC und dessen Konfiguration spielen für die Arbeiten von discipuli keine Rolle, es geht darum, wie er sein Absatz-/Spalten-/Umbruch-/was-weiß-ich-noch-alles-Problem lösen kann. Mich ärgert auch, dass man gewisse Informationen hinterfragen muss bzw sich der Thread zieht wie Kaugummi, doch wenn Du einmal die achte Dekade im Leben erreicht hast, wirst Du auch etwas gemächlicher ans Werk gehen.
 
Das ging an dich und war ironisch gemeint. Hätte auch schreiben können, HP-Drucker.

Ich möchte einfach nur wissen, um welchen Scanner es geht. Punkt
Ein Czur sagt genauso viel wie Rechner mit Windows, stimmts?
 
Anzeige
Oben