Ergebnis 1 bis 3 von 3

Thema: Filtern einer ungleichen Ausgabe mit doppelten Nummern

  1. #1
    Avatar von syrius
    Registriert
    Mar 2015
    Beiträge
    2,124
    Gefällt mir!
    1,234
    Du gefällst: 2,814

    Filtern einer ungleichen Ausgabe mit doppelten Nummern

    Hi,


    ich habe aktuell ein Problem bei dem ich nicht weiter komme und tue mir schwer auch über Suchmaschinen hilfreiche Ergebnisse zu finden.


    Habe folgende Ausgabe:


    Code:
    /usr/local/bin/antrag/input/20151215160052297_01.txt:Auftragsnummer: 444185
    /usr/local/bin/antrag/input/20151215160052297_07.txt:Auftragsnummer: 444058
    /usr/local/bin/antrag/input/20151215160052297_13.txt:Auftragsnummer: 443949
    /usr/local/bin/antrag/input/20151215160052297_15.txt:Auftragsnummer: 443949

    Die letzten beiden Zeilen haben die gleiche Auftragsnummer. Jetzt darf ich aber nur folgende Ausgabe erhalten:


    Code:
    /usr/local/bin/antrag/input/20151215160052297_01.txt:Auftragsnummer: 444185
    /usr/local/bin/antrag/input/20151215160052297_07.txt:Auftragsnummer: 444058
    /usr/local/bin/antrag/input/20151215160052297_13.txt:Auftragsnummer: 443949

    Es soll also die txt mit höherem Wert "_xx.txt" und gleicher Auftragsnummer von der Ausgabe ausgenommen werden.


    Grüße
    SzeneBox.org bei Telegram https://t.me/szenebox

  2. #2
    Senior Avatar von Nimbus
    Registriert
    Oct 2015
    Beiträge
    587
    Gefällt mir!
    110
    Du gefällst: 605
    Ist die Eingabe schon so sortiert, dass man davon ausgehen kann, dass der 2. identische Eintrag der zu überspringende ist?

    Falls ja, dann könntest du folgendes probieren "dein_cmd | uniq -s 68"

    Das liefert hier bei mir das gewünschte Ergebnis mit der Beispieleingabe. Falls das nicht das gewünschte liefert, dann wäre es eventuell hilfreich, wenn du mehr Beispieldaten angibst bzw. uns über die Homogenität der Daten aufklärst. Damit würden sich dann eventuell andere Ansätze finden lassen.

  3. #3
    THEMENSTARTER

    Avatar von syrius
    Registriert
    Mar 2015
    Beiträge
    2,124
    Gefällt mir!
    1,234
    Du gefällst: 2,814
    Der Fehler lag bei mir schon viel vorher im System denn es hätte erst gar nicht zu doppelten Auftragsnummern in der Ausgabe kommen dürfen. Ich habe daher über zwei "for"-Schleifen gearbeitet.

    Worum es überhaupt geht, unsere Archivierung scannt pro Tag mehrere hundert Seiten in ein PDF-Dokument das man getrennt und die PDF's am Ende nach Auftragsnummer neu und in einer ordentlichen Struktur archiviert haben möchte.

    Wen es interessiert - oder das mal brauchen sollte, ich trenne das PDF Seite für Seite per "pdftk", dann nehme ich jede Seite her, konvertiere sie in ein "TIF" per "convert" und das dann in ein "TXT" per "tesseract-ocr". Aus dem "TXT" lese ich gewisse Punkte die nur auf der 1. Seite eines Auftrags vorkommen aus, füge die erste Seite des Auftrags bis zur letzten Seite des neuen Auftrags wieder zu einem PDF zusammen und das bis alle Seiten abgearbeitet sind bzw. der Scan/die Aufträge vollständig voneinander getrennt wurden.

    Archiviert wird dann nach

    YEAR
    - MONTH-DAY
    -- AUFTRAGSNUMMER_..._..._YEAR-MONTH-DAY.pdf

    Danke für deine Bemühung @Nimbus)

    Grüße
    SzeneBox.org bei Telegram https://t.me/szenebox

Ähnliche Themen

  1. (PHP) - Links filtern (gruppieren)
    Von Uranjitsu im Forum Entwicklung / Programmierung
    Antworten: 8
    Letzter Beitrag: 24.03.2017, 17:15
  2. Vodafone-Partner luchst VIP-Nummern ab und verkauft sie meistbietend
    Von SPAM-SPAM im Forum Datenschutz & Privatsphäre (IT-Security)
    Antworten: 0
    Letzter Beitrag: 05.03.2017, 12:49
  3. 15 Mio. Nummern: Telegram per SMS-Authentifizierung gehackt
    Von RedDevil im Forum Datenschutz & Privatsphäre (IT-Security)
    Antworten: 0
    Letzter Beitrag: 03.08.2016, 12:12
  4. [✔] Seitenauswahl wird auch bei aktiven Filtern angezeigt
    Von Zarroc im Forum Filecrypt.cc - Anregung & Kritik
    Antworten: 0
    Letzter Beitrag: 16.02.2016, 05:38
  5. DNS-Filter - nxfilter.org | Filtern per Proxy, DNS & Applications
    Von syrius im Forum Technik / Hardware & Software
    Antworten: 0
    Letzter Beitrag: 21.04.2015, 22:04

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
SzeneBox.org... im Mittelpunkt der Szene!
© since 2015 szeneBOX.org - All Rights Reserved
Domains: www.szenebox.org