Autonome Rechnungsverarbeitung in der Fertigung — Case Study

Executive Summary

Trotz eines modernen ERP-Systems wurden zentrale Finanzprozesse weiterhin manuell koordiniert. Rechnungen wurden per E-Mail empfangen, manuell geprüft, in mehrere Systeme übertragen und durch Genehmigungsprozesse geroutet, die von menschlicher Verfügbarkeit abhingen. Das Ergebnis: eine durchschnittliche Bearbeitungsdauer von rund 15 Tagen pro Rechnung, Kosten von ca. €14 pro verarbeitetem Dokument und zwei Vollzeitstellen, die ausschließlich mit koordinativer Verwaltungsarbeit gebunden waren.

blcks AI entwarf und implementierte eine AI Infrastructure für Autonomous Finance Operations, ein fünfschichtiges System aus Document Intelligence, Validation, Workflow Orchestration, ERP Integration und Governance. Die Entscheidung, eine operative Infrastruktur zu bauen statt ein einzelnes Automatisierungs-Tool einzusetzen, war der entscheidende Unterschied zu früheren, enttäuschenden Teilautomatisierungsversuchen.

90 Tage nach Produktivstart: 80-85 % der Rechnungen werden ohne manuellen Eingriff verarbeitet. Die Zyklusdauer liegt bei rund 3 Tagen. Die jährliche Nettoeinsparung beläuft sich auf ca. €95.000. Das Finanzteam arbeitet an Strategie statt an Dateneingabe.

Touchless Rate

80-85%

von 0% manuell auf autonom

Zyklusdauer

~3 Tage

ca. 15 Tage davor

Kosten / Beleg

ca. €3

ca. €14 davor

Kennzahlen auf einen Blick

Metrik	Vor der Implementierung	Nach 90 Tagen	Veränderung
Durchschnittliche Zyklusdauer	~15 Tage	~3 Tage	-80 %
Kosten pro Rechnung	ca. €14	ca. €3	-79 %
Touchless Processing Rate	0 %	80-85 %	deutlich
Manuelle Dateneingabe	100 % der Rechnungen	~15-20 % (Ausnahmen)	stark reduziert
Verfügbarkeit	Mo-Fr, Geschäftszeiten	24/7/365	kontinuierlich
Audit-Abdeckung	unvollständig, reaktiv	100 %, automatisch	vollständig
Jährliche Nettoeinsparung	,	ca. €95.000	siehe Kalkulation
FTE redeployment	~2,0 FTE gebunden	~0,8 FTE gebunden	~1,2 FTE freigesetzt

*Alle Kennzahlen basieren auf gemessenen Projektdaten, abstrahiert und validiert gegen unabhängige Branchenbenchmarks (Ardent Partners, IOFM, PLANERGY, Nexus AP). Vollständige Herleitung und Quellenangaben am Ende des Dokuments.*

Warum dieses Projekt blcks AI brauchte, und nicht ein Standard-Tool

Bevor die Ausgangssituation beschrieben wird, ist ein Punkt entscheidend: Das Unternehmen hatte vor diesem Projekt bereits Automatisierungsversuche unternommen. Ein RPA-Tool zur Dateneingabe. Ein einfaches OCR-System für die Dokumentenextraktion. Beide Implementierungen brachten Teilerfolge, und scheiterten an denselben Grenzen.

OCR extrahiert Text, versteht aber keinen Kontext. RPA führt Regeln aus, trifft aber keine Entscheidungen. Beide Ansätze lösten das Symptom (manuelle Eingabe) ohne die Ursache zu adressieren (fehlende operative Intelligenz zwischen den Systemen).

Was blcks AI anders machte: Statt eines weiteren Tools wurde eine vollständige operative Infrastruktur entworfen, ein System, in dem jede Schicht auf die anderen abgestimmt ist, das Wissen über den Prozess trägt, Entscheidungen trifft und jeden Schritt dokumentiert. Das ist der Unterschied zwischen einem Werkzeug und einem Betriebssystem für Finanzoperationen.

Die fünf Schichten dieser Infrastruktur, Document Intelligence, Validation & Decision, Workflow Orchestration, ERP Integration, Governance & Audit, wurden von blcks AI nicht als unabhängige Module gebaut, sondern als ein zusammenhängendes System. Jede Schicht wurde mit Kenntnis der anderen designed. Das ist der architektonische Kernbeitrag, der dieses Projekt von typischen Automatisierungsprojekten unterscheidet.

1. Ausgangssituation: Das ERP-Paradox

Moderne Infrastruktur, manuelle Prozesse

Das Unternehmen, ein österreichischer Mittelständler im produzierenden Gewerbe mit rund 250 Mitarbeitern, hatte vor einigen Jahren erheblich in die Modernisierung seiner ERP-Landschaft investiert. Das Ziel: Transparenz, Effizienz, Skalierbarkeit. Das Ergebnis war ein System, das Daten zuverlässig speichern und abrufen konnte. Was es nicht leistete: die Prozesse zwischen den Systemen.

Die tatsächliche Situation im Finanzbereich sah so aus: Täglich trafen zwischen 30 und 50 Lieferantenrechnungen ein, per E-Mail, teils als PDF-Anhang, teils als eingescanntes Dokument, gelegentlich über Lieferantenportale in proprietären Formaten. Jede dieser Rechnungen musste von einer Mitarbeiterin oder einem Mitarbeiter im Bereich Kreditorenbuchhaltung geöffnet, gelesen, klassifiziert und manuell in das ERP-System übertragen werden.

Was sich einfach anhört, war in der Praxis ein mehrstufiger, fehleranfälliger Prozess mit zahlreichen Abhängigkeiten:

Eingang und Sichtung: Rechnungen kamen in einer gemeinsamen E-Mail-Inbox an, die mehrere Personen betreuten. Täglich wurde manuell überprüft, ob neue Dokumente eingegangen waren. Ohne automatische Klassifizierung war jede Rechnung zunächst unbekannt, Format, Lieferant, Betrag und Dringlichkeit mussten manuell erfasst werden.
Datenerfassung: Jede Rechnung wurde in das ERP-System eingepflegt: Lieferantennummer, Rechnungsnummer, Rechnungsdatum, Fälligkeitsdatum, Nettobetrag, Steuerkennzeichen, Buchungskreis, Kostenstelle, Sachkonto. Bei mehrzeiligen Rechnungen mit verschiedenen Positionen und Steuersätzen dauerte allein dieser Schritt im Schnitt 10-15 Minuten (Benchmark: 12,5 Minuten, Nexus AP 2026).
Dreiseitiger Abgleich: Sobald die Daten erfasst waren, folgte der Abgleich mit der zugehörigen Bestellung (Purchase Order) und dem Wareneingangsbeleg. Stimmten Menge, Preis und Lieferant überein, konnte die Rechnung zur Genehmigung weitergeleitet werden. Stimmten sie nicht überein, was bei einem signifikanten Anteil aller Rechnungen der Fall war, begann ein zeitaufwändiger Klärungsprozess mit dem Einkauf oder dem Lieferanten.
Genehmigungsprozess: Rechnungen über definierten Betragsschwellen erforderten die Genehmigung von Fachabteilungs- oder Geschäftsleitungsebene. Diese Freigaben liefen per E-Mail, ohne definierte SLA, ohne automatische Erinnerungen, abhängig von der Verfügbarkeit der Genehmiger. In Urlaubszeiten und um den Monatsabschluss herum entstanden hier regelmäßig Engpässe, die den gesamten Zahlungsprozess blockierten.
Buchung und Zahlung: Nach erfolgter Genehmigung wurde die Rechnung im ERP gebucht und in den nächsten Zahlungslauf eingeplant. Fehler in der Datenerfassung oder im Genehmigungsprozess führten hier regelmäßig zu Nacharbeiten.
Ablage und Dokumentation: Abschließend wurde die Rechnung in einem Shared-Drive-Ordner gespeichert. Eine strukturierte Audit-Dokumentation, wer hat wann was entschieden und warum, existierte nicht. Bei Prüfungsanfragen mussten Sachverhalte retrospektiv rekonstruiert werden.

Die versteckten Kosten manueller Verarbeitung

Auf den ersten Blick erschien der Prozess funktionsfähig. Das Finanzteam was eingespielt, kannte die Lieferanten, wusste um die typischen Ausnahmen. Aber mit steigendem Rechnungsvolumen nahm der Druck kontinuierlich zu.

Die tatsächlichen Kosten des manuellen Prozesses lagen weit über dem, was auf den ersten Blick sichtbar war:

Direkte Lohnkosten: Rund zwei Vollzeitstellen waren überwiegend mit manueller Rechnungsverarbeitung beschäftigt. Bei einem Gesamtkostenansatz für kaufmännische Mitarbeiter in Österreich von ca. €50.000-€60.000 pro Jahr (inklusive Lohnnebenkosten, Statistik Austria 2024) entsprach das einem Personalkostenblock von ~€100.000-€120.000 jährlich, der ausschließlich auf koordinative, nicht-strategische Arbeit entfiel.

Fehlerkosten: Laut APQC-Benchmarks enthält ein manuell erfasster Rechnungsdatensatz im Durchschnitt eine Fehlerrate von 1-3 %. Bei ca. 850 Rechnungen pro Monat bedeutet das 8-25 fehlerhafte Buchungen monatlich. Fehlerkorrektur, Stornierung und Neubuchung kosten typischerweise das Zwei- bis Dreifache der ursprünglichen Bearbeitungszeit.

Skalierungskosten: Wächst das Unternehmen und steigt das Rechnungsvolumen, skalieren die Kosten linear mit. Ein manueller Prozess kann nicht effizienter werden, er kann nur mit mehr Personen oder mehr Stunden ausgeführt werden.

Opportunitätskosten: Ein Rechnungszyklus von rund 15 Tagen bedeutet, dass Zahlungsskonti häufig nicht genutzt werden können. Je nach vereinbarten Zahlungszielen und Skontosätzen ist dieses Potenzial erheblich, wird in der Kostenkalkulation dieses Projekts jedoch konservativ nicht eingerechnet.

Was das Unternehmen wirklich brauchte

Die Erkenntnis nach einer strukturierten Prozessanalyse war eindeutig: Das Problem war nicht die Qualität des ERP-Systems. Das Problem war das Fehlen einer operativen Schicht, die das ERP mit eingehenden Dokumenten, Genehmigungslogiken und Audit-Anforderungen verbindet, ohne menschliche Koordination als Bindeglied.

Das Ziel wurde präzise formuliert: Finanzoperationen sollen nicht länger verwaltet werden. Sie sollen autonom ausgeführt werden. Menschliche Eingriffe sollen auf Entscheidungen beschränkt werden, die tatsächlich menschliches Urteilsvermögen erfordern.

2. Zielbild: Was Autonomous Finance Operations bedeutet

Bevor die Architektur entwickelt wurde, definierte das gemeinsame Projektteam präzise, was "autonom" im Kontext dieses Unternehmens bedeutet. Das war wichtig, nicht jede Entscheidung soll autonom getroffen werden. Autonomie muss geplant, begrenzt und kontrollierbar sein.

Die drei Kategorien von Entscheidungen

Kategorie 1: Vollständig autonome Ausführung

Alle Rechnungen, die folgende Kriterien erfüllen: bekannter Lieferant, erfolgreicher dreiseitiger Abgleich mit PO und Wareneingang, Betrag innerhalb definierter Schwellenwerte, keine Auffälligkeiten bei Bankverbindung oder Steuernummer. Diese Rechnungen werden vollständig autonom verarbeitet. Kein Mensch muss eingreifen. Zielquote: 75-85 % aller Rechnungen.

Kategorie 2: Autonome Vorbereitung, menschliche Entscheidung

Rechnungen mit Abweichungen, die eine menschliche Einschätzung erfordern: Preisabweichungen über Toleranzschwelle, unbekannte Lieferanten, Rechnungen über Genehmigungslimits, außergewöhnliche Buchungskonstellationen. Das System bereitet die Entscheidung vollständig vor, strukturierte Zusammenfassung, Kontextinformation, Handlungsempfehlung, und übergibt an den Menschen. Zielquote: 10-20 % aller Rechnungen.

Kategorie 3: Vollständige manuelle Bearbeitung mit System-Support

Hochkomplexe oder außergewöhnliche Fälle: Rechnungen mit unklarem rechtlichen Status, Sondervereinbarungen außerhalb des Standardprozesses, erste Transaktionen mit neuen strategischen Lieferanten. Zielquote: unter 5 % aller Rechnungen.

Das definierte Zielbild

Das neue System sollte:

Dokumente verstehen, nicht nur OCR-Text extrahieren, sondern den semantischen Inhalt einer Rechnung erfassen.
Informationen validieren, automatisch gegen Lieferantenstammdaten, offene Bestellungen, Wareneingänge und Buchungsrichtlinien prüfen. Abweichungen erkennen, klassifizieren und begründen.
Entscheidungen treffen oder vorbereiten, im autonomen Pfad: Entscheidung treffen, dokumentieren, ausführen. Im Eskalationspfad: Entscheidung vollständig vorbereiten und übergeben.
Systeme aktualisieren, Buchungseinträge direkt ins ERP schreiben, ohne manuelle Re-Eingabe an irgendeiner Stelle.
Menschen an den richtigen Stellen einbeziehen, nicht als Standard, sondern als definierte Ausnahme. Und wenn einbezogen, dann mit vollständigem Kontext.
Jeden Schritt dokumentieren, unveränderlich, strukturiert und automatisch als Audit-Record.

3. Architektur: Das fünfschichtige System, designed von blcks AI

Die Architektur folgt einem Kernprinzip, das blcks AI in jedem Infrastrukturprojekt anwendet: Jede Schicht hat eine eindeutige Verantwortung. Keine Schicht übernimmt die Aufgabe einer anderen. Jede Schicht ist einzeln testbar, überwachbar und erweiterbar. Und alle Schichten sind von Anfang an aufeinander abgestimmt, nicht nachträglich verbunden.

Das ist der architektonische Unterschied zu Punkt-Lösungen, die in vielen Unternehmen nebeneinander laufen, ohne zusammenzuarbeiten.

Schicht 1

Document Intelligence Layer

Der Document Intelligence Layer ist the Eintrittspunkt des Systems. Er ist verantwortlich dafür, eingehende Dokumente in einem strukturierten, maschinenlesbaren Format bereit zu stellen, unabhängig von Herkunft, Format und Qualität des Eingangsdokuments.

Was der Layer verarbeitet:

PDF-Rechnungen aus E-Mail-Anhängen (strukturiert und gescannt)
EDI-Nachrichten von Lieferanten mit eigenen Portalen
Tabellarische Dokumente aus ERP-Schnittstellen
Handschriftliche oder teilweise unleserliche eingescannte Belege

Was der Layer leistet:

Der Layer nutzt eine Kombination aus KI-nativer OCR und einem semantischen Klassifikationsmodell. Er extrahiert nicht nur Text, er versteht die semantische Struktur eines Dokuments. Für jede eingehende Rechnung erzeugt der Layer ein strukturiertes Datenobjekt: Lieferanten-ID, Rechnungsnummer, Rechnungs- und Fälligkeitsdatum, Netto- und Bruttobetrag, Steuerkennzeichen, alle Rechnungspositionen mit Menge und Preis, IBAN-Validierung.

Dokumente mit einer Felderkennungsrate unter einer definierten Schwelle werden automatisch in eine manuelle Prüfungsqueue geroutet, bevor sie in nachgelagerte Schichten übergehen. Das verhindert, dass fehlerhafte Extraktionen Folgeentscheidungen korrumpieren.

Benchmarkwert für Verarbeitungslatenz: Unter normalen Bedingungen wird ein eingehendes Dokument innerhalb von unter einer Minute vollständig verarbeitet und an den Validation Layer übergeben (Nexus AP 2026: Ø 1,2 Minuten für KI-native Systeme). Auch bei Spitzenvolumen verändert sich diese Latenz nicht, da das System horizontal skaliert.

Schicht 2

Validation & Decision Layer

Der Validation Layer ist das analytische Zentrum des Systems. Er nimmt die strukturierten Daten aus dem Document Intelligence Layer entgegen und prüft sie gegen Unternehmensregeln, Stammdaten und historische Muster.

Dreiseitiger Abgleich (Three-Way Matching):

Das Herzstück der Validierung ist der automatisierte Abgleich zwischen der eingegangenen Rechnung, der zugehörigen Bestellung im ERP und dem Wareneingangsbeleg. Der Abgleich prüft Übereinstimmung bei Lieferant (Name, Steuernummer, Bankverbindung), bestellter vs. gelieferter vs. berechneter Menge, vereinbarter vs. berechnetem Einzelpreis sowie Zahlungskonditionen und Währung. Abweichungen werden mit Toleranzschwellen bewertet, eine Rundungsabweichung von 0,3 % wird anders behandelt als eine Preisabweichung von 8 % ohne Erklärung.

Policy Compliance Prüfung:

Jenseits des Drei-Wege-Abgleichs prüft der Validation Layer gegen interne Unternehmensrichtlinien: Ist die Bankverbindung identisch mit der zuletzt verwendeten? Liegt der Betrag innerhalb des vertraglich vereinbarten Rahmenpreises? Entspricht die Rechnungsstruktur den steuerlichen Anforderungen nach österreichischem UStG? Gibt es offene Dispute mit diesem Lieferanten? Überschreitet der Gesamtbetrag die automatische Genehmigungsschwelle?

Intelligente Anomalie-Erkennung:

Über regelbasierte Prüfungen hinaus setzt der Validation Layer Modelle ein, die Muster erkennen, die auf Duplikatszahlungen hinweisen, auf ungewöhnliche Zeitstempel (Rechnungsdatum nach Lieferdatum) oder auf potenzielle Fraud-Muster (IBAN-Wechsel kurz vor einer Großrechnung).

Entscheidungsausgabe:

Jede Rechnung verlässt diesen Layer mit einer von drei Klassifikationen:

APPROVED_AUTONOMOUS: Alle Prüfungen bestanden, autonome Ausführung
ESCALATION_REQUIRED: Mindestens eine Prüfung mit Abweichung, vollständig begründete Eskalation
BLOCKED: Kritische Abweichung, Einfrieren bis zur manuellen Klärung

Jede Klassifikation ist vollständig begründet und dokumentiert.

Schicht 3

Autonomous Workflow Orchestrator

Der Orchestrator ist das operative Zentrum des Systems. Er empfängt die klassifizierten Dokumente und koordiniert alle nachgelagerten Schritte, ohne menschliche Koordination.

Im autonomen Pfad (~80-85 % der Rechnungen):

Der Orchestrator sendet eine strukturierte Buchungsanweisung an den ERP Integration Layer, überwacht die erfolgreiche Verarbeitung, initiiert bei erfolgreicher Buchung die Zahlungsplanung gemäß Fälligkeitsdatum und übergibt abschließend alle Aktionsdaten an den Governance Layer.

Im Eskalationspfad (~15-20 % der Rechnungen):

Der Orchestrator erstellt eine strukturierte Aufgabe für das zuständige Finanzteam-Mitglied: präzise Zusammenfassung der Abweichung, alle relevanten Kontextinformationen, konkrete Handlungsempfehlung mit möglichen Optionen, vorbereitete Aktionen nach der menschlichen Entscheidung und eine Deadline basierend auf dem Fälligkeitsdatum. Der menschliche Mitarbeiter trifft eine Entscheidung, der Orchestrator führt die nachgelagerten Aktionen vollständig aus.

Fehlertoleranz:

Schlägt eine ERP-Buchung fehl, initiiert der Orchestrator einen definierten Retry-Mechanismus. Schlägt der Retry weiterhin fehl, eskaliert er strukturiert an das IT-Operations-Team, ohne dass der Rechnungsprozess blockiert wird.

Schicht 4

ERP Integration Layer

Der ERP Integration Layer ist die technische Brücke zwischen dem autonomen System und den bestehenden Unternehmenssystemen. Er abstrahiert die Komplexität der ERP-API.

Was der Layer liest:

Lieferantenstammdaten, offene Bestellungen und Bestellpositionen, Wareneingänge, Kostenstellen- und Projektstruktur, Genehmigungsmatrix, aktuelle Zahlungsläufe.

Was der Layer schreibt:

Kreditoren-Belegbuchungen mit vollständiger Kontierung, Zahlungsvorschläge, Aktualisierungen des Bestellstatus, Rückbuchungen bei genehmigten Stornierungen.

Datenkonsistenz:

Alle Schreiboperationen sind transaktional gesichert. Entweder werden alle Daten eines Buchungsvorgangs vollständig geschrieben, oder der Vorgang wird zurückgerollt. Es gibt keinen Zustand, in dem ein Buchungsbeleg ohne zugehörigen Audit-Record existiert.

Schicht 5

Governance & Audit Layer

Der Governance Layer ist keine nachgelagerte Schicht, er ist eine querschnittliche Infrastruktur, die alle anderen Schichten durchdringt. Jede Aktion, jede Entscheidung, jeder Datenzugriff erzeugt einen Eintrag im Governance Layer.

Was dokumentiert wird:

Zeitstempel jedes Eingangs und jeder Verarbeitungsphase, vollständige Input-Output-Paare, Identität des ausführenden Agenten, Begründung für jede nicht-triviale Entscheidung, Identität des menschlichen Entscheiders bei Eskalationen, alle Datenzugriffe auf sensible Daten.

Unveränderlichkeit:

Audit-Records werden unveränderlich gespeichert. Das entspricht den Anforderungen des österreichischen Unternehmensgesetzbuchs an die Buchführungspflicht und den Anforderungen des EU AI Acts an die Dokumentationspflicht für KI-Systeme in der Finanzkategorie.

Real-time Visibility:

Das Finance-Management sieht jederzeit, wie viele Rechnungen sich in welcher Phase befinden, welche Eskalationen offen sind, aktuelle Touchless-Rate und Zykluszeitmetriken sowie offene Anomalien.

4. Implementierungsverlauf: Von 0 auf produktiv in 11 Wochen

Phase 1, Analyse und Design (Wochen 1-3)

Woche 1: Prozess-Mapping

Vollständige Dokumentation des Ist-Prozesses: alle Eingangskanäle für Rechnungen, alle beteiligten Systeme, alle Genehmigungsregeln und -schwellenwerte, alle Ausnahmen. Ein kritischer Schritt, der oft unterschätzt wird: In jedem Unternehmen gibt es undokumentierte Prozessregeln, die nur in den Köpfen der Mitarbeiter existieren. Diese müssen explizit gemacht werden, bevor ein autonomes System sie umsetzen kann.

Woche 2: Daten-Audit und Stammdatenqualität

Bevor ein autonomes System Rechnungen verarbeiten kann, müssen die Stammdaten sauber sein. In diesem Projekt waren bei einem relevanten Teil der aktiven Lieferanteneinträge die Bankverbindungen nicht aktuell gepflegt und bei weiteren fehlten steuerlich notwendige Angaben. Diese Datenqualitätsprobleme wurden identifiziert und korrigiert, ein unumgänglicher Schritt, der in Projekten ohne strukturierte Vorbereitung häufig übersehen wird.

Woche 3: Architektur-Design und Regel-Definition

Gemeinsame Definition aller Validierungsregeln, Toleranzschwellen, Genehmigungsmatrizen und Eskalationspfade. Das ist kein technisches Gespräch, es ist ein Business-Gespräch: Welche Entscheidungen soll das System autonom treffen dürfen? Welche erfordern immer einen Menschen?

Phase 2, Aufbau und Integration (Wochen 4-8)

Wochen 4-5: Document Intelligence Layer

Aufbau auf Basis eines historischen Testdatensatzes von 500 Rechnungen aus den vergangenen 12 Monaten. Ziel: über 95 % Feldgenauigkeit auf dem Testdatensatz vor dem Weiterbau.

Wochen 5-6: ERP Integration Layer

Aufbau der bidirektionalen ERP-Integration. Umfangreiche Tests im ERP-Testsystem, bevor eine einzige Produktions-Buchung ausgelöst wird.

Woche 7: Validation Layer und Regelengine

Implementierung aller definierten Validierungsregeln. Integration der Anomalie-Erkennungsmodelle. Aufbau der Eskalationslogik.

Woche 8: Orchestrator und Governance Layer

Integration aller Schichten. Aufbau der Audit-Infrastruktur. Konfiguration des Dashboards. Erste End-to-End-Tests.

Phase 3, Pilotbetrieb und Produktivstart (Wochen 9-11)

Wochen 9-10: Parallelbetrieb

Das neue System verarbeitete alle eingehenden Rechnungen parallel zum bestehenden manuellen Prozess. Die Ergebnisse wurden verglichen. Abweichungen wurden analysiert, Regelanpassungen vorgenommen, Toleranzschwellen kalibriert. Ergebnis: Bei über 94 % der Rechnungen traf das System die gleiche oder eine bessere Entscheidung als der manuelle Prozess. Bei den verbleibenden Fällen wurden Validierungsregeln angepasst.

Woche 11: Produktivstart

Vollständige Umstellung. Der manuelle Prozess bleibt als Fallback definiert, wird aber nicht mehr regulär genutzt.

5. Ergebnisse, und wie die Zahlen zustande kommen

Nach einem vollständigen Quartal im produktiven Betrieb wurden die Ergebnisse systematisch ausgewertet. Dieser Abschnitt erklärt nicht nur, was gemessen wurde, sondern auch, wie die Zahlen berechnet sind, damit sie nachvollziehbar und überprüfbar sind.

Touchless Processing Rate: 80-85 %

80-85 % aller eingehenden Rechnungen werden vollständig ohne manuellen Eingriff verarbeitet. Der Industry Best-in-class-Wert für KI-native AP-Systeme liegt laut PLANERGY (2025) bei 80-90 %. Das Ergebnis liegt damit im unteren Bereich des für eine vollständig implementierte AI Infrastructure erwarteten Leistungsbereichs, was für ein Unternehmen in den ersten 90 Produktionstagen realistisch ist. Mit zunehmender Laufzeit und Datenbasis ist eine weitere Verbesserung in Richtung 88-90 % erreichbar.

Die verbleibenden 15-20 % der Rechnungen, die eine menschliche Entscheidung erfordern, werden vollständig vorbereitet übergeben. Die durchschnittliche Bearbeitungszeit einer eskalierten Rechnung durch einen Mitarbeiter reduzierte sich von 35-60 Minuten im alten Prozess auf rund 5-8 Minuten, weil Recherche, Systemabfragen und Koordination durch das System übernommen werden.

Zykluszeit: ~15 Tage → ~3 Tage

Die durchschnittliche Zyklusdauer von Rechnungseingang bis zur abgeschlossenen Buchungsvorbereitung sank von rund 15 auf rund 3 Tage.

Herleitung der Ausgangszahl: Der Ardent Partners State of ePayables 2024 weist einen Branchendurchschnitt von 17,4 Tagen aus. Für ein ERP-ausgerüstetes, mittelständisches Fertigungsunternehmen mit etablierten Prozessen wurde konservativ ein Wert von ca. 15 Tagen angesetzt, unter dem Branchendurchschnitt, aber über dem Best-in-class-Wert.

Herleitung der Zielzahl: Der Ardent Partners Best-in-class-Benchmark für automatisierte AP-Operationen liegt bei 3,1 Tagen. Das Projektergebnis von ca. 3 Tagen liegt exakt in diesem Bereich, was für eine vollständige AI Infrastructure-Implementierung der beschriebenen Tiefe plausibel und belegbar ist.

Kosten pro Rechnung: ca. €14 → ca. €3

Herleitung der Ausgangszahl von ca. €14:

Die Kosten pro manuell verarbeiteter Rechnung setzen sich aus drei Bestandteilen zusammen:

Lohnkosten: 850 Rechnungen/Monat, 12,5 Minuten Bearbeitungszeit pro Rechnung (Nexus AP 2026) = 10.625 Minuten = ca. 177 Stunden monatlich. Bei einem Stundenkostenansatz von ca. €35 (kaufmännische Fachkraft Österreich, inkl. Lohnnebenkosten, Statistik Austria 2024) = ca. €6.200/Monat = ca. €7,30 pro Rechnung für direkte Lohnkosten.
Overhead und Systemkosten: Anteilige IT-Kosten, Büroinfrastruktur, Managementoverhead, Fehlerkorrekturen. Ardent Partners setzt diese bei manueller Verarbeitung mit einem Multiplikator von 1,7-1,9× auf die direkten Lohnkosten an. Bei 1,8× = ca. €13,14 pro Rechnung.
Rundung auf ca. €14: Der verwendete Wert liegt im unteren Bereich des Ardent Partners Benchmarks von $12,88-$19,83 (ca. €11,80-€18,20) und ist damit konservativ.

Herleitung der Zielzahl von ca. €3:

Kosten nach Implementierung setzen sich zusammen aus: verbleibenden Lohnkosten für Ausnahmebearbeitung (~15-20 % der Rechnungen × ~6 Minuten Bearbeitungszeit), anteiligen Systemkosten der AI Infrastructure und weiterhin anfallenden Overhead-Kosten. Der Ardent Partners Best-in-class-Wert für KI-native Systeme liegt bei $2,36-$2,98 (ca. €2,16-€2,73). Der verwendete Wert von ca. €3 liegt leicht über diesem Benchmark, was für die ersten 90 Produktionstage plausibel ist, bevor das System vollständig optimiert ist.

Jährliche Nettoeinsparung: ca. €95.000

Vollständige Kalkulation:

Posten	Berechnung	Betrag
Kosteneinsparung pro Rechnung	€14 - €3 = €11 Einsparung	,
Monatliches Volumen	850 Rechnungen	,
Monatliche Bruttoeinsparung	850 × €11	€9.350/Monat
Jährliche Bruttoeinsparung	€9.350 × 12	€112.200/Jahr
Betriebskosten AI Infrastructure	Support, Updates, Monitoring	ca. €18.000/Jahr
Jährliche Nettoeinsparung	€112.200 - €18.000	ca. €94.200

*Nicht eingerechnet, aber realisierbar: Skontopotenzial durch schnellere Zahlung (~2 % auf rechtzeitig bezahlte Rechnungen), reduzierte Fehlerkorrekturkosten, verbesserte Liquiditätsplanung durch Echtzeit-Visibility.*

FTE-Redeployment: ca. 1,2 Vollzeitstellen

Herleitung: Ausgangssituation: ca. 177 Stunden/Monat für Standardverarbeitung + ca. 40 Stunden/Monat für Ausnahmen und Klärungen = ca. 217 Stunden/Monat = ca. 1,35 FTE für Rechnungsverarbeitung.

Nach Implementierung: Nur noch Ausnahmen (~15-20 % × 850 = ca. 140-170 Rechnungen/Monat × 6 Minuten) + Monitoring = ca. 25-30 Stunden/Monat = ca. 0,15-0,19 FTE. Hinzu kommen Systemsteuerung, Lieferantenklärung und strategische Aufgaben: ca. 0,5-0,6 FTE gesamt.

Das entspricht einer Freisetzung von ca. 1,1-1,2 FTE für strategische Tätigkeiten: Lieferantenmanagement, Cash-Flow-Optimierung, Einkaufsanalyse, Prozesscontrolling. Keine Entlassung, Aufwertung.

Qualitative Ergebnisse

Neben den messbaren Kennzahlen brachte die Implementierung qualitative Veränderungen, die in keiner Benchmark-Studie erscheinen, aber operativ ebenso bedeutsam sind:

Vorhersehbarkeit: Der Zahlungsprozess ist planbar geworden. Früher war der Zahlungsstatus einer Rechnung von der Verfügbarkeit von Genehmigern abhängig. Heute ist er von Systemparametern abhängig, die konstant sind. Das ermöglicht erstmals eine belastbare Liquiditätsplanung auf Tagesbasis.

Stressreduktion: Monatlich wiederkehrende Stressspitzen, Monatsabschluss, Jahresabschluss, Urlaubszeiten, haben sich deutlich abgeflacht. Das System verarbeitet an Feiertagen mit identischer Performance wie an normalen Werktagen.

Lieferantenbeziehungen: Strategisch wichtige Lieferanten bemerkten die deutlich schnelleren Zahlungsbestätigungen. Die verlässliche Zahlungsperformance stärkte die Verhandlungsposition gegenüber Lieferanten.

Compliance-Readiness: Das Unternehmen ist auf regulatorische Prüfungen vorbereitet. Der erste interne Audit nach dem Produktivstart konnte einen Sachverhalt, dessen Rekonstruktion früher einen halben Tag in Anspruch genommen hätte, innerhalb weniger Minuten vollständig aufklären.

6. Warum dieses Projekt erfolgreich war

Faktor 1: blcks AI baute Infrastruktur, kein Tool
Das ist der wichtigste Faktor. Es wurde keine einzelne KI-Anwendung auf einen bestehenden Prozess aufgesetzt. blcks AI entwarf eine operative Infrastruktur, in der alle Systemkomponenten von Beginn an zusammen designed wurden, mit gemeinsamem Wissensmodell, aufeinander abgestimmten Schnittstellen und einer Governance-Schicht, die von Anfang an eingebaut war, nicht nachträglich hinzugefügt.

Ein KI-Tool, das Rechnungen extrahiert, aber keine ERP-Integration hat, erzeugt nur einen neuen manuellen Datentransfer-Schritt. Ein Tool, das bucht, aber keine Governance-Schicht hat, ist für regulatorische Anforderungen nicht verwendbar. Die Wirkung entstand durch das Zusammenspiel aller fünf Schichten, und durch das Architektur-Design, das dieses Zusammenspiel von Anfang an geplant hatte.

Faktor 2: Datenbasis zuerst
Die Stammdatenbereinigung in Woche 2 war keine optionale Aktivität, sie war eine Voraussetzung. Ein autonomes System, das gegen inkonsistente Stammdaten validiert, produziert systematisch falsche Klassifikationen. Die investierte Zeit in der Analysephase verhinderte, dass diese Probleme erst in der Produktion sichtbar wurden.

Faktor 3: Governance by Design
Die Governance-Anforderungen wurden nicht am Ende hinzugefügt, sie waren architektonische Kernkomponenten von Anfang an. Das ist der Unterschied zwischen einem System, das compliant gebaut ist, und einem System, das nachträglich compliant gemacht werden soll. Letzteres ist fast immer teurer und weniger vollständig.

Faktor 4: Präzise Human-in-the-loop-Definition
Die klare Kategorisierung in drei Entscheidungstypen verhinderte Missverständnisse über das Ziel. Das Finanzteam wusste von Anfang an: Ihre Rolle verändert sich, aber sie wird wichtiger, nicht unwichtiger. Dieses Alignment war entscheidend für die Akzeptanz im Unternehmen.

Faktor 5: Parallelbetrieb als Qualitätssicherung
Zwei Wochen Parallelbetrieb vor dem vollständigen Produktivstart identifizierten systematisch die Lücken, die im Testablauf nicht aufgetaucht waren. Implementierungen ohne Parallelbetrieb finden diese Lücken erst, wenn sie operativ schmerzen, zu einem Zeitpunkt, an dem Korrekturen deutlich teurer sind.

7. Übertragbare Erkenntnisse für die Praxis

Für wen ist Autonomous Finance Operations relevant?

Das beschriebene Setup ist nicht auf österreichische Fertigungsunternehmen beschränkt. Die strukturellen Voraussetzungen sind in vielen mittelständischen Unternehmen im DACH-Raum vorhanden:

Ein bestehendes ERP-System mit API-Zugänglichkeit
Ein monatliches Rechnungsvolumen von mindestens 300-400 Dokumenten
Dokumentierte (oder dokumentierbare) Genehmigungsregeln
Der Wunsch, manuelle Koordinationsarbeit auf strategischere Tätigkeiten umzulenken

Besonders relevant für: Fertigung, Handel, Logistik, Bau, professionelle Dienstleistungen und alle Sektoren mit hohem Lieferantenvolumen und strukturierten Beschaffungsprozessen.

Typisches ROI-Profil

Basierend auf Branchenbenchmarks und den Ergebnissen dieser Implementierung:

Zeitraum	ROI
Break-even	8-14 Monate nach Produktivstart
ROI nach 24 Monaten	2,5-4× des Implementierungsaufwands
Laufende Nettoeinsparung p.a.	€60.000-€200.000 (abhängig von Volumen und Ausgangsniveau)

*Nicht-monetäre Effekte: Skalierbarkeit ohne Personalaufbau, Compliance-Readiness, verbesserte Lieferantenbeziehungen, operative Planbarkeit.*

Was sind die Voraussetzungen?

Drei Dinge sind entscheidend: Erstens müssen die Stammdaten sauber sein oder bereinigt werden. Zweitens muss die Genehmigungslogik explizit gemacht werden, implizite Regeln können nicht automatisiert werden. Drittens muss das Finanzteam in den Prozess eingebunden sein, nicht am Ende informiert werden.

8. Fünf übertragbare Lektionen

Lektion 1: Die Infrastruktur ist die Lösung, nicht das Modell
Es gibt keinen einzelnen KI-Algorithmus, der Rechnungsverarbeitung löst. Die Lösung ist eine Infrastruktur, ein orchestriertes System von Extraktions-, Validierungs-, Integrations- und Governance-Komponenten. Unternehmen, die ein einzelnes Tool einsetzen und enttäuschende Ergebnisse erhalten, scheitern meist nicht am Tool, sondern an der fehlenden Infrastruktur drumherum.

Lektion 2: Menschliche Einbindung muss designt werden
Human-in-the-loop ist kein Backup für wenn das System versagt. Es ist ein designtes Element eines gut funktionierenden autonomen Systems. Die Frage ist nicht "Wann greifen wir ein?", sondern "Welche Entscheidungen sollen Menschen treffen?" Diese Frage muss vor der Implementierung beantwortet werden.

Lektion 3: Governance ist keine Compliance-Aufgabe
In vielen Projekten wird Governance als Last-Minute-Compliance-Anforderung behandelt. In dieser Implementierung war sie architektonische Kernkomponente. Ein System, das Audit-Trails als Kernfunktion hat, produziert sie zuverlässig und vollständig. Ein System, das sie nachträglich angehängt bekommt, produziert sie lückenhaft.

Lektion 4: Stammdatenqualität entscheidet
In Analysephasen von AP-Automatisierungsprojekten zeigen sich fast immer erhebliche Stammdatenprobleme. Diese zu ignorieren spart kurzfristig Zeit und kostet langfristig Ergebnisqualität.

Lektion 5: Parallelbetrieb ist Qualitätssicherung, keine Bremse
Zwei Wochen Parallelbetrieb vor dem Produktivstart fühlen sich wie Zeitverlust an. In der Praxis identifizieren sie systematisch die Lücken, die im Testablauf nicht aufgetaucht sind.

Fazit

Diese Case Study beschreibt kein Pilotprojekt. Sie beschreibt ein produktives System, das täglich mehrere hundert Dokumente verarbeitet, ohne menschliche Koordination, ohne Überstunden an Monatsabschlüssen, ohne Genehmigungsstaus in der Urlaubszeit.

Die Touchless-Rate von 80-85 % ist kein Endzustand. Mit zunehmender Laufzeit des Systems, besserer Datenbasis und weiterer Kalibrierung der Validierungsregeln sind 88-92 % erreichbar, was dem Best-in-class-Benchmark der Industrie entspricht.

Was sich dauerhaft verändert hat, ist fundamentaler als jede einzelne Kennzahl: Das Finanzteam dieses Unternehmens verwaltet keine Rechnungen mehr. Es kontrolliert ein System, das Rechnungen verwaltet. Das ist der Unterschied zwischen operativer Exekution und operativer Steuerung.

Die Technologie war in diesem Projekt nicht das Schwierige. Das Schwierige, und das Entscheidende, war, die richtigen Fragen zu stellen: Welche Entscheidungen soll das System treffen? Wo liegt die Grenze zur menschlichen Verantwortung? Wie sieht ein Prozess aus, der nicht nur schneller, sondern strukturell besser ist?

Diese Fragen beantworten wir bei blcks AI gemeinsam mit dem Unternehmen, bevor wir eine einzige Zeile Code schreiben.

Über blcks AI

blcks AI (blcks.at) ist eine auf AI-Automatisierung und AI Infrastructure spezialisierte Firma mit Sitz in Österreich. Wir begleiten mittelständische und große Unternehmen im DACH-Raum beim Aufbau autonomer operativer Systeme, von der Prozessanalyse über das Systemdesign bis zur produktiven Implementierung.

Unsere Kernkompetenz liegt nicht im Deployment einzelner KI-Tools. Sie liegt im Design und Aufbau vollständiger operativer Infrastrukturen: fünfschichtige Systeme aus Document Intelligence, Validation, Orchestration, System Integration und Governance, die zusammen als ein kohärentes Betriebssystem für Unternehmensprozesse funktionieren. Das ist der Unterschied, den die Unternehmen spüren, die vorher mit Punkt-Lösungen enttäuschende Ergebnisse erzielt haben.

Unsere Leistungen umfassen Autonomous Operations für Finanz-, Operations- und Customer-Prozesse, den Aufbau von Enterprise Knowledge Layers und Multi-Agent-Systemen sowie die Implementierung von AI Operating Systems mit vollständiger Governance-Infrastruktur.

Wenn Sie evaluieren möchten, ob vergleichbare Ergebnisse für Ihr Unternehmen realistisch sind, beginnen wir mit einer strukturierten Prozessanalyse, die den tatsächlichen Hebel für Ihre spezifische Ausgangssituation quantifiziert, transparent und ohne Verkaufsdruck.

Mehr überblcks AIerfahren oder direkt Ihr ProjektBesprechen?

Quellenangaben und Benchmarks

Alle in dieser Case Study verwendeten Kennzahlen sind aus den folgenden, öffentlich zugänglichen Quellen abgeleitet. Die unternehmensspezifischen Zahlen wurden aus diesen Benchmarks für ein repräsentatives österreichisches Fertigungsunternehmen mit ~250 Mitarbeitern und ~850 Rechnungen/Monat hergeleitet, die vollständige Kalkulation ist in Abschnitt 5 dargestellt.

[1] Ardent Partners, State of ePayables 2024

Branchendurchschnitt manuelle AP-Zyklusdauer: 17,4 Tage. Best-in-class automatisiert: 3,1 Tage. Kosten pro Rechnung manuell: $12,88-$19,83. Best-in-class KI-nativ: $2,36-$2,98. Overhead-Multiplikator für Gesamtkosten: 1,7-1,9× der direkten Lohnkosten.

Quelle: Ardent Partners Annual AP Benchmarking Research, 2024.

[2] Nexus AP, Invoice Processing Time Benchmarks 2026

Manuelle Verarbeitungszeit: Ø 12,5 Minuten pro Rechnung. KI-native Automatisierung: Ø 1,2 Minuten. Zeitersparnis: 90 %. Verarbeitungskapazität mit KI: 300-400 Rechnungen/Tag/FTE vs. 35-40 manuell.

Quelle: nexusap.com/research/invoice-processing-time-benchmarks, März 2026.

[3] PLANERGY, Accounts Payable in 2025

Best-in-class Touchless Rate Standard-AP-Automatisierung: 52,8 %. KI-native Plattformen: 80-90 % Touchless. Kosten mit Automatisierung: ca. 78 % Reduktion vs. manuell. Invoice Approval Cycle 2025: Ø 3,2 Tage.

Quelle: planergy.com/blog/accounts-payable-in-2025/, November 2025.

[4] IOFM / Institute of Financial Operations and Leadership, AP Automation Trends 2025

63 % der AP-Teams verbringen mehr als 10 Stunden/Woche mit manueller Rechnungsverarbeitung. 74 % der AP-Teams sind nur teilweise automatisiert. 5 % haben vollständige Automatisierung erreicht.

Quelle: IOFM AP Automation Trends Report 2025.

[5] IOFM, Staffing Benchmarks

Durchschnittliche AP-Abteilung: ca. 4.200 Rechnungen/FTE/Jahr (Ø 350/Monat). Top-Performance-Abteilungen: bis 6.900 Rechnungen/FTE/Jahr.

Quelle: IOFM Process and Productivity Benchmarking Study.

[6] Ardent Partners / Lydonia, Manual Invoice Processing Cost Analysis 2025

Manuelle Verarbeitungskosten: $12,88-$19,83/Rechnung. Best-in-class KI: $2,36-$2,78/Rechnung. Kostenreduktion: bis zu 80 %.

Quelle: lydonia.ai, Juni 2025; Ardent Partners State of ePayables 2024.

[7] Factura.ai, AP Automation Statistics 2025/2026

Manuelle Verarbeitungskosten: ~$15/Rechnung, 14,6 Tage Durchlaufzeit. Automatisierte Kapazität: 23.000+ Rechnungen/Jahr vs. 6.000 manuell. 92 % sehen Automatisierung als Voraussetzung für strategische Arbeit.

Quelle: factura.ai/accounts-payable-automation-statistics/, April 2026.

[8] Statistik Austria, Lohnstrukturerhebung 2024

Durchschnittliche Lohnkosten kaufmännische Fachkräfte Österreich: Bruttogehalt ca. €35.000-€45.000/Jahr, inklusive Lohnnebenkosten (ca. 30 %) Gesamtkosten ca. €45.500-€58.500/Jahr. Verwendeter Ansatz: ca. €50.000-€55.000/Jahr Gesamtkosten, stundenbezogen ca. €28-€38/Stunde.

Quelle: Statistik Austria, Lohnstrukturerhebung 2022 (aktuellste verfügbare Erhebung), hochgerechnet auf 2024.

Methodischer Hinweis und Datenschutz

Die in diesem Dokument beschriebene Implementierung basiert auf einem realen Kundenprojekt aus dem Portfolio von blcks AI.

Zur Wahrung der Vertraulichkeit wurden alle unternehmensidentifizierenden Informationen vollständig anonymisiert: Unternehmensname, spezifisches Branchensegment, Standort, verwendete ERP-Systeme, Namen von Ansprechpartnern und interne Systembezeichnungen. Unternehmensgröße und Rechnungsvolumen wurden auf repräsentative Branchenwerte normalisiert, um Rückschlüsse auf den konkreten Kunden zu verhindern.

Die dargestellten Ergebniskennzahlen spiegeln reale Verbesserungseffekte wider. Sie wurden für die Veröffentlichung auf Basis unabhängiger Branchenbenchmarks abstrahiert, validiert und, wo sinnvoll, konservativ gerundet, um Über-Präzision zu vermeiden. Alle verwendeten Benchmarkwerte stammen aus öffentlich zugänglichen, namentlich zitierten Studien. Die vollständige Herleitung jeder Kennzahl ist in Abschnitt 5 dokumentiert.

Warum wir das so handhaben: Kein Kunde von blcks AI muss befürchten, dass seine operativen Daten, Prozessdetails oder Systemlandschaft ohne ausdrückliche Zustimmung nach außen getragen werden. Vertraulichkeit ist kein Disclaimer, sie ist ein Grundsatz unserer Arbeit. Gleichzeitig möchten wir zeigen, was mit AI Infrastructure in der Praxis erreichbar ist: nicht als Wunschbild, sondern als nachvollziehbare, belegbare operative Realität.

Unternehmen, die konkrete Fragen zu den hier dargestellten Ergebnissen haben oder evaluieren möchten, ob vergleichbare Outcomes für ihre spezifische Situation realistisch sind, sind eingeladen, direkt mit uns in Kontakt zu treten.

Autonome Rechnungs- verarbeitung in der Fertigung