PDF-Workflows: Eingangsrechnungen automatisch ins ERP
Eingangsrechnungen manuell zu erfassen ist das Äquivalent zum Fensterkurbeln beim Auto — es geht, aber es gibt keinen Grund mehr, es zu tun. Mit OCR, einem lokalen LLM und einem kurzen n8n-Workflow läuft das von allein.
Die Pipeline
E-Mail-Eingang → Paperless-ngx → OCR & Klassifikation → n8n → ERP-Buchung
- E-Mail-Eingang: Lieferanten schicken PDF-Rechnungen an
rechnung@unternehmen.at. NoSpamProxy filtert vor, der Mailserver leitet sie an einen Paperless-ngx-Konsumordner weiter. - Paperless-ngx: Liest die PDF, OCR-erkennt den Text, klassifiziert Dokumenttyp und Lieferant, extrahiert Schlüsseldaten — Betrag, Rechnungsdatum, Rechnungsnummer.
- n8n-Workflow: Holt die extrahierten Daten via Paperless-API ab, validiert sie gegen den Winline-Kundenstamm, bucht die Rechnung in die Fibu.
- Archiv: Das Original-PDF bleibt in Paperless, revisionssicher, suchbar.
Warum on-prem?
Rechnungen enthalten sensible Informationen: Preise, Konditionen, Lieferantenbeziehungen. Das an einen Cloud-OCR-Dienst zu schicken ist datenschutzrechtlich heikel — und unter NIS2 im Zweifel meldepflichtig.
Paperless-ngx läuft als Docker-Container auf eigener Infrastruktur. Das LLM für unstrukturierte Abweichungen (abweichende Rechnungsformate, Sonderfälle) läuft lokal auf der GPU — die Daten verlassen das Haus nicht.
Das lokale LLM als Fallback-Classifier
Standardrechnungen erkennt Paperless-ngx mit trainierter Klassifikation zuverlässig. Für Sonderformate, ausländische Rechnungen und Freitext-Korrekturen springt ein lokales LLM ein:
Extrahiere aus folgendem Rechnungstext:
- Rechnungsdatum (YYYY-MM-DD)
- Nettobetrag (numerisch)
- Rechnungsnummer
- Lieferant (Name wie im ERP hinterlegt)
Das läuft über die vLLM-API on-prem — keine Daten an OpenAI, keine Compliance-Frage.
Was noch nicht automatisch geht
Die Freigabe. Sachliche Prüfung — „wurde die Ware wirklich geliefert?" — braucht einen Menschen. Aber der Mensch findet eine vorklassifizierte Rechnung mit allen Daten im ERP vor und klickt nur noch „Freigabe" — statt 10 Minuten abzutippen.
Fazit
PDF-Workflows sind die niedrig hängende Frucht der ERP-Automatisierung. Der Return-on-Invest liegt bei jedem KMU mit mehr als 50 Eingangsrechnungen im Monat unter einem Jahr — vorausgesetzt, man macht es on-prem.