Notensatz aufbereiten¶
Befehl: noten-verarbeitung
Splittet einen gescannten PDF-Notensatz für sinfonisches Blasorchester in einzelne Stimmen-PDFs, skaliert sie auf A4 (oder A5-quer) und stempelt sie optional digital mit Logo + Archivnummer.
Workflow¶
- PDF aus dem aktuellen Verzeichnis per
fzfauswählen (oder als Argument übergeben). - Eingabe: Archivnummer + Titel + Stempeln (
j/n). - OCR pro Seite (Tesseract
deu+eng) auf den oberen 30 % der Seite. Rote Pixel werden vor der Erkennung gefiltert, damit ein roter Archivstempel nicht als Stimmenbezeichnung gelesen wird. - Eine neue Stimme beginnt, wenn alle drei Header-Blöcke gleichzeitig erkannt werden:
- Titel mittig oben (groß)
- Stimmenbezeichnung oben links
- Komponist/Arrangeur oben rechts
- Bei OCR-Unsicherheit (Confidence unter Schwelle oder Instrument unbekannt) öffnet sich die betroffene Seite via
xdg-openzur Vorschau und das Terminal wird zurück in den Fokus geholt. Der User tippt die Stimme als Freitext ein (z. B.Klarinette 2 in B). Wenn die Eingabe einem bekannten Instrument entspricht, wird sie automatisch in Code/Name/Nummer/Zusatz zerlegt; ist das Instrument unbekannt, wird zusätzlich nur der Code (00–11) abgefragt. Die Zuordnung wird in~/.config/noten-tools/learned_aliases.yamlfür die Zukunft gelernt. - Pro Stimme wird ein eigenes PDF erzeugt:
Seiten, die zu keinem Stimmen-Segment zugeordnet werden konnten (z. B. Deckblatt, Inhalt, fehlerhafte Seiten am Anfang), landen gesammelt in
[Archivnr] - [Titel] - 99 Reste.pdf. - Skalierung auf A4 hochkant (oder A5 quer mit
--a5), fit-to-page mit weißen Rändern. - Stempel-Overlay (optional): Logo links oben,
Nr. XXXXrechts oben.
Flags¶
| Flag | Bedeutung |
|---|---|
--a5 |
Ausgabeformat A5 quer statt A4 hochkant |
--no-stamp |
Stempel deaktivieren |
--logo PATH |
Alternatives Logo statt assets/logo.png |
--logo-offset X,Y |
Logo-Verschiebung in mm relativ zum Default (X = nach rechts, Y = nach unten) |
--archiv-offset X,Y |
Archivnummer-Verschiebung in mm relativ zum Default (X = nach links, Y = nach unten) |
--lang LANG |
OCR-Sprache, z. B. deu, eng, deu+eng |
--confidence N |
OCR-Confidence-Schwelle 0–100 (Default 50) |
--verbose / --quiet |
Mehr/weniger Konsolen-Logs |
--dry-run |
Nur erkennen, keine Dateien schreiben |
Konventionen¶
Die Codes (00–11) und Stimmungs-Naming-Regeln, denen noten-verarbeitung beim Erzeugen von Dateinamen folgt, sind im Archiv-Bereich beschrieben:
Pipeline-Hinweise¶
- Wenn der Scan aus einem A3-Booklet stammt, vorher
noten-bookletlaufen lassen. - Bei rotierten oder strukturell beschädigten Scans vorher
noten-pdf-fix. - Gelernte Aliase aus dem laufenden Betrieb können mit
noten-tools-aliasesins Repo zurückgespielt werden.