senn-techsenn-tech
Zurück zum Blog
Strategie2027-05-18

PDF-Workflows: Eingangsrechnungen automatisch ins ERP

Eingangsrechnungen manuell zu erfassen ist das Äquivalent zum Fensterkurbeln beim Auto — es geht, aber es gibt keinen Grund mehr, es zu tun. Mit OCR, einem lokalen LLM und einem kurzen n8n-Workflow läuft das von allein.

Die Pipeline

E-Mail-Eingang → Paperless-ngx → OCR & Klassifikation → n8n → ERP-Buchung
  1. E-Mail-Eingang: Lieferanten schicken PDF-Rechnungen an rechnung@unternehmen.at. NoSpamProxy filtert vor, der Mailserver leitet sie an einen Paperless-ngx-Konsumordner weiter.
  2. Paperless-ngx: Liest die PDF, OCR-erkennt den Text, klassifiziert Dokumenttyp und Lieferant, extrahiert Schlüsseldaten — Betrag, Rechnungsdatum, Rechnungsnummer.
  3. n8n-Workflow: Holt die extrahierten Daten via Paperless-API ab, validiert sie gegen den Winline-Kundenstamm, bucht die Rechnung in die Fibu.
  4. Archiv: Das Original-PDF bleibt in Paperless, revisionssicher, suchbar.

Warum on-prem?

Rechnungen enthalten sensible Informationen: Preise, Konditionen, Lieferantenbeziehungen. Das an einen Cloud-OCR-Dienst zu schicken ist datenschutzrechtlich heikel — und unter NIS2 im Zweifel meldepflichtig.

Paperless-ngx läuft als Docker-Container auf eigener Infrastruktur. Das LLM für unstrukturierte Abweichungen (abweichende Rechnungsformate, Sonderfälle) läuft lokal auf der GPU — die Daten verlassen das Haus nicht.

Das lokale LLM als Fallback-Classifier

Standardrechnungen erkennt Paperless-ngx mit trainierter Klassifikation zuverlässig. Für Sonderformate, ausländische Rechnungen und Freitext-Korrekturen springt ein lokales LLM ein:

Extrahiere aus folgendem Rechnungstext:
- Rechnungsdatum (YYYY-MM-DD)
- Nettobetrag (numerisch)
- Rechnungsnummer
- Lieferant (Name wie im ERP hinterlegt)

Das läuft über die vLLM-API on-prem — keine Daten an OpenAI, keine Compliance-Frage.

Was noch nicht automatisch geht

Die Freigabe. Sachliche Prüfung — „wurde die Ware wirklich geliefert?" — braucht einen Menschen. Aber der Mensch findet eine vorklassifizierte Rechnung mit allen Daten im ERP vor und klickt nur noch „Freigabe" — statt 10 Minuten abzutippen.

Fazit

PDF-Workflows sind die niedrig hängende Frucht der ERP-Automatisierung. Der Return-on-Invest liegt bei jedem KMU mit mehr als 50 Eingangsrechnungen im Monat unter einem Jahr — vorausgesetzt, man macht es on-prem.