Der Fehler lag bei mir schon viel vorher im System denn es hätte erst gar nicht zu doppelten Auftragsnummern in der Ausgabe kommen dürfen. Ich habe daher über zwei "for"-Schleifen gearbeitet.
Worum es überhaupt geht, unsere Archivierung scannt pro Tag mehrere hundert Seiten in ein PDF-Dokument das man getrennt und die PDF's am Ende nach Auftragsnummer neu und in einer ordentlichen Struktur archiviert haben möchte.
Wen es interessiert - oder das mal brauchen sollte, ich trenne das PDF Seite für Seite per "pdftk", dann nehme ich jede Seite her, konvertiere sie in ein "TIF" per "convert" und das dann in ein "TXT" per "tesseract-ocr". Aus dem "TXT" lese ich gewisse Punkte die nur auf der 1. Seite eines Auftrags vorkommen aus, füge die erste Seite des Auftrags bis zur letzten Seite des neuen Auftrags wieder zu einem PDF zusammen und das bis alle Seiten abgearbeitet sind bzw. der Scan/die Aufträge vollständig voneinander getrennt wurden.
Archiviert wird dann nach
YEAR
- MONTH-DAY
-- AUFTRAGSNUMMER_..._..._YEAR-MONTH-DAY.pdf
Danke für deine Bemühung @Nimbus)
Grüße



THEMENSTARTER

Zitieren