Rechnungsdaten nach Excel extrahieren – ganz gleich, welches Layout
Jeder Lieferant verschickt Rechnungen in einem anderen Layout, und genau das macht es so mühsam, sie in eine Tabelle zu bekommen. So holen Sie Rechnungsnummer, Datumsangaben, Summen und Positionen sauber nach Excel, CSV oder JSON – über jedes Layout hinweg, ohne pro Lieferant eine eigene Vorlage zu bauen.
- tutorial
- invoices
Wenn sich Ihr Posteingang jeden Monat mit Lieferantenrechnungen füllt, kennen Sie die Routine bereits: jedes PDF öffnen, die Rechnungsnummer suchen, das Datum, die Summe, jede einzelne Position herauskopieren und alles in eine Tabelle eintippen. Und dann das Ganze noch einmal für den nächsten Lieferanten – dessen Rechnung nicht im Geringsten so aussieht wie die letzte.
Genau dieser letzte Punkt ist das eigentliche Problem. Es ist nicht die Menge an Rechnungen; es ist, dass keine zwei Lieferanten sie auf dieselbe Weise formatieren. Die Summe steht an einer anderen Stelle, die Datumsangaben folgen einem anderen Format, die Positionstabelle hat andere Spalten. Ein Mensch passt sich an jede einzelne an, ohne nachzudenken. Die meisten Programme tun das nicht – und deshalb geben so viele Teams auf und tippen am Ende einfach alles von Hand ab.
Dieser Beitrag zeigt Schritt für Schritt, wie Sie Rechnungsdaten sauber nach Excel, CSV oder JSON bekommen – über jedes Layout hinweg – ohne für jeden Lieferanten eine eigene Vorlage zu bauen und zu pflegen.
Warum Rechnungen schwerer zu extrahieren sind, als sie aussehen
Eine einzelne, feste Rechnungsvorlage ist einfach. Das Problem ist, dass Sie fast nie nur eine haben. Ein paar Gründe, warum sich Rechnungen einer sauberen Extraktion widersetzen:
- Das Layout jedes Lieferanten ist anders. Es gibt keinen Branchenstandard dafür, wo Rechnungsnummer, Rechnungsadresse oder Summen stehen. Die Vorlage, die Sie für einen Lieferanten eingerichtet haben, bricht in dem Moment zusammen, in dem ein neuer Lieferant seine erste Rechnung schickt.
- „Der Betrag” ist mehrdeutig. Eine einzige Rechnung enthält eine Zwischensumme, Steuern, Versandkosten, eine Summe vor Rabatt und einen endgültigen Zahlbetrag – oft direkt untereinander gestapelt. Holen Sie „den Betrag”, ohne zu sagen, welchen, bekommen Sie genau den, den die Engine geraten hat.
- Positionen sind eine Liste, kein einzelner Wert. Jede Rechnung hat eine Rechnungsnummer, aber viele Positionen, jede mit eigener Beschreibung, Menge, Einzelpreis und Positionssumme. Wenn Sie das falsch zusammenfalten, bekommen Sie ein Durcheinander, wo Sie saubere Zeilen wollten.
- PDF, Scan oder Foto. Eine als PDF gemailte Rechnung ist sauberer Text. Dieselbe Rechnung, am Empfang eingescannt oder mit dem Handy fotografiert, ist ein Bild – jetzt brauchen Sie OCR, bevor Sie überhaupt etwas extrahieren können, und OCR bringt eigene Fehler mit sich.
Jedes Tool, das behauptet, „einfach Rechnungen zu extrahieren”, muss auf all das eine Antwort haben. Der manuelle Frust steckt in dieser Vielfalt, nicht in einer einzelnen Rechnung.
Die gängigen Ansätze – und wo jeder an seine Grenze stößt
Es gibt nicht das eine richtige Tool – es kommt darauf an, mit wie vielen Lieferanten Sie zu tun haben und wie einheitlich deren Layouts sind.
Von Hand abtippen. Kein Einrichtungsaufwand, präzise, wenn Sie sorgfältig sind, und überhaupt nicht skalierbar. Für eine Handvoll im Monat in Ordnung; ein klares Nein, sobald Sie Dutzende von vielen verschiedenen Lieferanten verarbeiten.
Vorlagenbasierte Parser. Sie legen einmal fest, wo jedes Feld auf der Seite steht. Schnell und günstig, sofern jede Rechnung identisch aussieht. Aber da sich jeder Lieferant unterscheidet, bauen und pflegen Sie am Ende eine Vorlage pro Lieferant – und bauen sie an dem Tag neu, an dem ein Lieferant sein Layout anpasst. Bei drei oder vier festen Lieferanten ist das in Ordnung. Bei einer langen, sich ständig ändernden Lieferantenliste frisst der Einrichtungsaufwand die Zeitersparnis wieder auf.
Extraktion in natürlicher Sprache. Statt Positionen zu markieren, beschreiben Sie die gewünschten Felder in alltäglicher Sprache, und die Engine passt sich an jedes Layout an. Das löst das Problem „jeder Lieferant ist anders” direkt und ist außerdem deutlich nachsichtiger gegenüber Scans und ungewöhnlicher Formatierung. Der Haken: Sie wollen ein Tool, mit dem Sie das Ergebnis überprüfen können – denn Sie vertrauen darauf, dass ein Modell die Seite liest, statt auf eine feste Koordinate.
In diese letzte Kategorie gehört Ztract, gehen wir es also konkret durch.
Schritt für Schritt: von der Rechnung nach Excel in Ztract
Hier ist der gesamte Ablauf – derselbe, ob Sie eine einzelne Rechnung oder einen Ordner mit fünfzig von einem Dutzend verschiedener Lieferanten verarbeiten.
1. Ein Projekt anlegen und beschreiben, was Sie wollen
Ein Projekt ist einfach ein Container für zusammengehörige Dokumente und das Schema, das Sie darauf anwenden. Für Rechnungen haben Sie drei Möglichkeiten, dieses Schema zu definieren:
-
Mit dem fertigen Rechnungs-Schema starten und es anpassen. Das ist der schnellste Einstieg – es kennt bereits Rechnungsnummern, Datumsangaben, Lieferantendetails, Summen und Positionen.
-
Die Felder in alltäglicher Sprache beschreiben. Zum Beispiel:
„Extrahiere für jede Rechnung die Rechnungsnummer, das Ausstellungsdatum, den Lieferantennamen und den fälligen Gesamtbetrag (nach Steuern und Rabatten). Extrahiere dann für jede Position die Beschreibung, die Menge, den Einzelpreis und die Positionssumme. Wenn ein Feld nicht vorhanden ist, lass es leer, statt zu raten.”
Achten Sie dabei auf zwei Dinge. „Der fällige Gesamtbetrag (nach Steuern und Rabatten)” sagt der Engine genau, welchen der mehreren Beträge Sie meinen. Und „für jede Position” kennzeichnet die Positionen als wiederkehrende Liste, sodass Sie saubere Zeilen zurückbekommen, statt alles in eine Zelle gepresst. Diese zwei Angewohnheiten machen den größten Unterschied zwischen vertrauenswürdigem Rechnungsergebnis und einem Durcheinander aus.
-
Aus einem Beispiel ableiten. Werfen Sie eine repräsentative Rechnung hinein und lassen Sie Ztract daraus ein Schema vorschlagen. Nützlich, wenn die Rechnung eines neuen Lieferanten Felder enthält, mit denen Sie nicht gerechnet haben.
Der entscheidende Vorteil: Das gleiche Schema funktioniert über alle Lieferanten hinweg. Sie beschreiben die gewünschten Daten, nicht die Position, an der sie stehen – ein noch nie gesehenes Layout wird also genauso behandelt wie ein bekanntes. Keine Vorlage pro Lieferant.
2. Die Rechnungen hochladen
Ziehen Sie Ihre Dateien hinein – PDF, Word, Excel, Scans oder Handyfotos, bis zu 500 MB pro Datei. Textbasierte PDFs und bildbasierte Scans funktionieren beide; die Scans durchlaufen einfach zuerst OCR. Wenn die Rechnungen eines Monats als separate Dateien von verschiedenen Lieferanten eintreffen, laden Sie sie alle zusammen hoch, und dasselbe Schema gilt für jede einzelne.
3. Prüfen und korrigieren – der Teil, der wirklich Zeit spart
Hier ist, was die Leute unterschätzen: Bei Rechnungen ist nicht die Extraktion der Zeitfresser – sondern das Prüfen. Wenn Sie dem Ergebnis nicht trauen können, lesen Sie am Ende doch wieder jede Rechnung gegen die Tabelle ab und haben nichts gespart.
Ztract ist genau darum herum gebaut. Jeder extrahierte Wert ist an seine genaue Position im Quelldokument verankert: Klicken Sie im Ergebnis auf eine Zahl, und es wird hervorgehoben, woher auf der Rechnung sie stammt. Diese Ansicht nebeneinander macht die Prüfung schnell. Statt jedes Feld erneut zu kontrollieren, suchen Sie nur die heraus, die merkwürdig aussehen – eine Summe, die versehentlich die Zwischensumme gezogen hat, eine Position, die zwei Zeilen zusammengeführt hat – und korrigieren sie mit einem Klick.
Und weil wir nur für die Extraktion abrechnen, kostet Sie das Korrigieren eines Werts nichts. Das nachträgliche Bearbeiten ist kostenlos; nur die Seiten, die Sie extrahieren, zählen gegen Ihr Paket, nicht die Nachbearbeitung.
4. Exportieren
Sobald es stimmt, exportieren Sie nach Excel, CSV oder JSON – eine einzelne Rechnung oder das ganze Projekt auf einmal. Von dort wandert es direkt in Ihren Kreditorenworkflow, in den Import Ihrer Buchhaltungssoftware oder wohin auch immer die Zahlen als Nächstes müssen.
Die Fälle, die weiterhin ein menschliches Auge brauchen
Wir sagen Ihnen lieber, wo es knifflig wird, als so zu tun, als gäbe es das nicht. Ein paar Situationen, auf die Sie achten sollten:
- Gutschriften und Rückerstattungen. Eine Gutschrift sieht aus wie eine Rechnung, aber die Beträge laufen in die andere Richtung. Legen Sie in Ihrem Schema ausdrücklich fest, wie negative Beträge zu behandeln sind, und prüfen Sie das Vorzeichen im Prüfschritt doppelt.
- Lieferanten in mehreren Währungen. Wenn Sie bei Lieferanten in verschiedenen Währungen einkaufen, erfassen Sie die Währung pro Rechnung als eigenes Feld, statt eine einheitliche Währung über den ganzen Stapel anzunehmen – sonst sagt Ihnen eine Summe von „1.000” gar nichts.
- Stark beschädigte Scans. Eine gefaxte und dann erneut gescannte Rechnung mit blassem Druck ist für jeden schwer zu lesen, OCR eingeschlossen. Wenn die Vorlage für Ihr Auge unleserlich ist, rechnen Sie mit genauerem Prüfen – ein saubererer Scan schlägt jede noch so große nachträgliche Korrektur.
Wenn ein Layout, das wir verarbeiten sollten, fehlerhaft zurückkommt, wollen wir es wirklich sehen – schicken Sie ein Beispiel (bei Bedarf anonymisiert) an support@ztract.com, und wir gehen der Sache nach. Die Dokumente, die uns die Leute schicken, sind der Weg, auf dem die Engine besser wird.
Ein Hinweis zu Lieferantendaten
Rechnungen enthalten sensible Geschäftsinformationen – bei wem Sie einkaufen, was Sie zahlen, Ihre Kontonummern –, deshalb lohnt es sich, das klar zu sagen: Wir trainieren keine Modelle mit den Dokumenten, die Sie hochladen. Weder unsere eigene Engine noch die Drittanbieter-LLMs, über die wir leiten; die kommerziellen APIs, die wir nutzen, untersagen das Training mit eingereichten Daten, und wir verlassen uns auf diese Zusagen. Wenn Sie eine Rechnung löschen, ist sie sofort aus dem aktiven Speicher verschwunden und innerhalb von 14 Tagen aus den Backups. Das vollständige Bild finden Sie in unserer Datenschutzerklärung und unserem Auftragsverarbeitungsvertrag.
Probieren Sie es an Ihren eigenen Rechnungen aus
Am schnellsten finden Sie heraus, ob das zu Ihrem Workflow passt, indem Sie es an einer Handvoll echter Rechnungen ausprobieren, die Sie sonst von Hand abtippen würden – idealerweise von ein paar verschiedenen Lieferanten, damit Sie sehen, wie dasselbe Schema unterschiedliche Layouts bewältigt. Neue Konten erhalten 30 kostenlose Seiten, ohne Kreditkarte – mehr als genug, um einen Stapel von Anfang bis Ende zu extrahieren und die Summen selbst zu prüfen.
Und wenn Sie Rechnungen in großem Umfang verarbeiten und ehrliches Feedback dazu teilen würden, was funktioniert hat und was nicht, melden Sie sich – wir nehmen gerade frühe Nutzer an Bord und richten das, was wir als Nächstes bauen, an den Dokumenten aus, mit denen die Leute tatsächlich kämpfen. Rechnungen stehen ganz oben auf dieser Liste.
Sehen Sie sich für mehr unsere Use-Case-Seite zur Rechnungsdaten-Extraktion an.