KI im Treasury – Vom Hype zur Execution – Beitrag 1 von 7 – Februar 2026

KI im Treasury – Vom Hype zur Execution

Drei Jahre Diskussion. Jetzt ist Schluss damit.

Erinnern Sie sich an die Treasury-Konferenzen 2023 und 2024? Nahezu jede Keynote enthielt irgendwo das Wort „Künstliche Intelligenz". Die Präsentationen zeigten beeindruckende Grafiken, die Möglichkeiten klangen revolutionär, und am Ende des Tages fuhr man nach Hause – fasziniert, aber ohne einen konkreten nächsten Schritt.

2025 wurde es ernst. Erste Pilotprojekte liefen an. Manche scheiterten. Manche überzeugten. Und eine kleine Gruppe von Treasury-Teams begann, echte Ergebnisse zu sehen.

2026 ist das Jahr, in dem die Frage nicht mehr lautet: „Sollten wir KI einsetzen?" Die Frage lautet: „Warum haben wir noch nicht angefangen – und was kostet uns das?"

Dieser Beitrag ist der Auftakt einer siebenteiligen Serie, die KI im Treasury nicht als Technologiethema behandelt, sondern als strategische und operative Realität. Keine Visionen, keine Zukunftsmusik. Sondern eine ehrliche Bestandsaufnahme dessen, was heute möglich ist, was heute bereits getan wird – und was Sie konkret tun können.

Der Wendepunkt: Von der Exploration zur Execution

Die Finanzbranche kennt den Zyklus gut. Neue Technologien erscheinen, werden überhöht, enttäuschen kurzfristig und etablieren sich langfristig. Gartner nennt es den Hype Cycle. KI im Treasury hat diesen Zyklus in bemerkenswerter Geschwindigkeit durchlaufen.

Was 2022 mit ChatGPT als Demonstration sprachlicher KI-Fähigkeiten begann, hat sich in weniger als vier Jahren zu einem vollständigen Ökosystem produktiver KI-Anwendungen entwickelt. Large Language Models (LLMs) sind kein experimentelles Terrain mehr – sie sind Infrastruktur. Multimodale KI, die gleichzeitig Text, Daten, Bilder und Dokumente verarbeiten kann, ist der neue Standard.

Und Agentic AI – autonome KI-Systeme, die nicht nur antworten, sondern eigenständig handeln und Prozesse orchestrieren – ist das dominierende Thema des Jahres 2026.

Für das Treasury bedeutet das: Die technologische Grundlage ist gelegt. Die Frage ist nicht mehr, ob KI funktioniert. Die Frage ist, wie schnell Ihr Unternehmen die Kurve kriegt.

Der Branchenkonsens ist eindeutig: 2026 wird als das Year of AI Execution bezeichnet. Finance-Teams, die 2025 mit kleinen, fokussierten Use Cases begonnen haben – Reconciliation, Cash Visibility, Forecasting – verzeichnen heute messbare Wettbewerbsvorteile. Teams, die noch abwarten, verlieren diese Vorteile täglich.

Was KI im Treasury tatsächlich leistet – mit Zahlen

Reden wir über Substanz. Was bringt KI konkret, wenn sie im Treasury eingesetzt wird?

Cash Flow Forecasting: Auf Basis von Praxisbeobachtungen bei führenden Unternehmen erreichen KI-gestützte Prognosemodelle heute eine Genauigkeit von bis zu 90 Prozent – gegenüber 60 bis 70 Prozent bei klassischen regelbasierten Ansätzen. Das klingt nach einem technischen Detail, hat aber erhebliche praktische Konsequenzen: bessere Liquiditätsplanung, geringere Puffer-Anforderungen, präzisere Entscheidungsgrundlagen für das Management.

Covenant-Analyse und Vertragsmanagement: Ein Praxisbeispiel eines mittelständischen Automobilzulieferers (ca. 180 Mio. EUR Umsatz) illustriert das Potenzial: Was früher Stunden manueller Analyse erforderte – das Durcharbeiten von Kreditverträgen, das Identifizieren relevanter Covenants, das Erstellen strukturierter Berichte – lässt sich mit KI-gestützten Systemen um bis zu 95 Prozent schneller erledigen. Nicht als Ersatz des menschlichen Urteils, sondern als Vorarbeit, die dieses Urteil erst ermöglicht.

Reconciliation und Ausnahmebehandlung: Regelbasierte Automatisierung (RPA) kann Standardfälle abwickeln. KI kann darüber hinaus Muster erkennen, Ausnahmen klassifizieren und priorisieren – und lernt dabei kontinuierlich aus den Entscheidungen, die Menschen treffen.

Risikoerkennung: KI-Systeme analysieren in Echtzeit Marktdaten, Gegenparteienrisiken und Portfoliopositionen auf Anomalien und Muster, die kein menschliches Team in dieser Geschwindigkeit und Vollständigkeit erfassen könnte.

Diese Zahlen stammen nicht aus Hochglanzbroschüren, sondern aus konkreten Projekterfahrungen führender Finanzinstitute und Beratungsunternehmen, die aktive KI-Lösungen im Treasury-Bereich im Einsatz haben. Die Technologie funktioniert – wenn sie richtig implementiert wird.

KI ist nicht gleich KI: Eine notwendige Abgrenzung

Bevor wir tiefer einsteigen, ist eine Klarstellung wichtig, die in vielen Diskussionen fehlt: Nicht alles, was heute als „KI" vermarktet wird, ist dasselbe. Und die Unterschiede sind für Treasury-Entscheider relevant.

Robotic Process Automation (RPA)

Was RPA kann:

RPA führt regelbasierte Prozesse automatisch aus. Sie ist wertvoll, aber nicht intelligent – sie kann nicht mit Ausnahmen umgehen, die sie nicht kennt, und lernt nicht.

  • Daten zwischen Systemen übertragen (z.B. aus E-Mails in TMS)
  • Standardisierte Reports erstellen
  • Wiederkehrende Klickpfade automatisieren

Was RPA nicht kann:

  • Mit unerwarteten Formaten umgehen
  • Entscheidungen auf Basis von Kontext treffen
  • Aus Fehlern lernen

Treasury-Anwendung: Automatisierte Übernahme von Bankauszügen in standardisierten Formaten, Erstellung wiederkehrender Liquiditätsberichte.

Machine Learning (ML)

ML erkennt Muster in großen Datenmengen und trifft Vorhersagen. Cash Flow Forecasting ist ein klassischer ML-Anwendungsfall. ML lernt, verbessert sich mit mehr Daten und kann mit Unsicherheiten umgehen.

Was ML kann:

  • Muster in historischen Daten erkennen
  • Vorhersagen treffen und deren Unsicherheit quantifizieren
  • Sich mit jedem neuen Datenpunkt verbessern

Was ML nicht kann:

  • Mit völlig neuen Situationen umgehen, die keine Entsprechung in den Trainingsdaten haben
  • Kausalität verstehen (nur Korrelation)
  • Ohne ausreichende Datenhistorie funktionieren

Treasury-Anwendung: Cash Flow Forecasting, FX-Exposure-Prognosen, Working Capital-Optimierung.

Large Language Models (LLMs)

Was LLMs können:

LLMs wie GPT verarbeiten und generieren Sprache auf einem Niveau, das menschliche Kommunikation nachahmt. Im Treasury sind sie besonders wertvoll für die Analyse von Dokumenten, die Beantwortung komplexer Fragen auf Basis interner Wissensdatenbanken und die Erstellung von Berichten.

  • Unstrukturierte Dokumente verstehen und zusammenfassen
  • Komplexe Fragen in natürlicher Sprache beantworten
  • Berichte und Analysen in konsistenter Qualität erstellen
  • Mehrere Informationsquellen synthetisieren

Was LLMs nicht können:

  • Garantiert faktisch korrekte Informationen liefern (Halluzination-Risiko)
  • Mathematische Berechnungen ohne zusätzliche Tools durchführen
  • Echtzeitdaten verarbeiten (ohne Integration)

Treasury-Anwendung: Vertragsanalyse, Knowledge Management, Reporting-Automatisierung.

Agentic AI

Agentic AI – das aktuell heißeste Thema – geht einen Schritt weiter: Autonome KI-Agenten können eigenständig Aufgaben planen, Ressourcen nutzen, andere Systeme ansprechen und Prozesse von Anfang bis Ende orchestrieren. Ohne dass ein Mensch jeden Schritt initiiert.

Was Agentic AI kann:

  • Komplexe Aufgaben in Teilschritte zerlegen
  • Eigenständig entscheiden, welche Tools/Systeme zu nutzen sind
  • Mit anderen Agenten zusammenarbeiten
  • Auf Basis von Feedback die Strategie anpassen

Was Agentic AI nicht kann:

  • Vollständig autonom ohne menschliche Zielvorgabe agieren
  • Die Konsequenzen ihres Handelns in allen Dimensionen verstehen
  • Mit ethischen Dilemmata umgehen

Treasury-Anwendung: End-to-End-Prozessorchestrierung – z.B. vom Eingang einer Rechnung über Liquiditätsprüfung, Freigabe-Workflow, bis zur optimierten Zahlungsausführung.

Der entscheidende Unterschied: Agentic AI vs. Chatbot

Ein Chatbot – selbst ein LLM-basierter – wartet auf Ihre Frage und gibt eine Antwort. Ein Agentic System erkennt eigenständig, dass eine Aufgabe ansteht, plant die notwendigen Schritte, führt sie aus und informiert Sie über das Ergebnis.

Beispiel:

Chatbot-Ansatz:
Sie: „Welche Liquidität haben wir morgen?"
System: „Basierend auf aktuellen Daten: 12,3 Mio. EUR."

Agentic-Ansatz:
System erkennt: Morgen ist ein großer Zahlungsausgang geplant (15 Mio. EUR). Es prüft eigenständig alle Konten, identifiziert, dass Liquidität auf zwei Konzernkonten verfügbar ist, erstellt einen Transfervorschlag, prüft ob dieser den internen Richtlinien entspricht, und legt ihn Ihnen zur Freigabe vor – bevor Sie überhaupt danach gefragt haben.

Das ist der qualitative Sprung, den Agentic AI bringt. Nicht reaktiv, sondern proaktiv. Nicht ausführend, sondern orchestrierend.

Diese Unterscheidung ist nicht akademisch. Wer RPA als KI verkauft, übertreibt. Wer KI nur als Chatbot versteht, unterschätzt das Potenzial. Für eine strategische Entscheidung brauchen Sie Klarheit darüber, welche Technologie welches Problem löst.

Wie Machine Learning im Cash Flow Forecasting wirklich funktioniert – und warum Excel scheitert

Lassen Sie uns konkret werden. „KI verbessert Cash Flow Forecasting um 20 Prozentpunkte Genauigkeit" – das ist eine Aussage, die in jedem zweiten Whitepaper steht. Aber was bedeutet das eigentlich? Wie funktioniert das? Und warum kann Excel das nicht?

Das strukturelle Problem klassischer Forecasting-Methoden

Die meisten Unternehmen nutzen für Cash Flow Forecasting eine Kombination aus drei Ansätzen:

  • Direkte Methode: Geplante Zahlungseingänge und -ausgänge werden manuell erfasst und aggregiert.
  • Indirekte Methode: Aus Gewinn-/Verlustrechnung werden Cashflows abgeleitet.
  • Historische Durchschnitte: „Im März hatten wir die letzten drei Jahre durchschnittlich X Millionen Cashflow, also nehmen wir das wieder."

Alle drei haben ein gemeinsames Problem: Sie können Nicht-Linearitäten, Saisonalitäten, externe Schocks und komplexe Wechselwirkungen nur begrenzt abbilden.

Excel-Modelle scheitern strukturell, weil:

  • Sie auf statischen Formeln basieren, die menschlich definiert werden müssen. Jede Wenn-Dann-Regel muss explizit programmiert werden.
  • Sie keine Mustererkennung über große Datenmengen durchführen können. Ein Mensch kann nicht 50 Variablen gleichzeitig betrachten und deren Interaktion verstehen.
  • Sie nicht lernen. Das Modell von heute ist identisch mit dem von vor sechs Monaten – es sei denn, ein Mensch hat es manuell angepasst.
  • Sie mit Unsicherheit schlecht umgehen. Excel gibt Ihnen eine Zahl, keine Wahrscheinlichkeitsverteilung.

Wie ein ML-Modell stattdessen vorgeht

Ein Machine Learning-Modell für Cash Flow Forecasting – typischerweise ein Ensemble aus Gradient Boosting-Algorithmen oder neuronalen Netzen – funktioniert grundlegend anders:

Schritt 1: Datensammlung und Feature Engineering

Das Modell benötigt historische Daten – idealerweise mindestens 24 Monate tägliche oder wöchentliche Cashflow-Daten. Aber nicht nur Cashflows. Sondern auch:

  • Umsatzdaten (nach Region, Produktlinie, Kunde)
  • Forderungs- und Verbindlichkeitenbestände
  • Zahlungsbedingungen und historische Zahlungsmuster (DSO, DPO)
  • Saisonale Marker (Kalenderwochen, Feiertage, Monatsenden)
  • Externe Faktoren (Zinssätze, FX-Kurse, Rohstoffpreise bei relevanten Industrien)
  • Makroökonomische Indikatoren (BIP-Wachstum, Einkaufsmanagerindizes)

Das Modell konstruiert daraus „Features" – abgeleitete Variablen, die prädiktive Kraft haben. Beispiel: Nicht nur „Umsatz im März", sondern „Umsatz im März der letzten drei Jahre, Trend, Volatilität, Abweichung vom gleitenden 12-Monats-Durchschnitt".

Schritt 2: Training

Das Modell sucht nach Mustern. Es lernt: „Wenn DSO in den letzten zwei Wochen um 5 Tage gestiegen ist, UND gleichzeitig Umsatz in Region EMEA um 10% gefallen ist, UND wir uns in Kalenderwoche 12 befinden, dann sinkt der Cashflow in den nächsten 7 Tagen im Durchschnitt um 8%, mit einer Standardabweichung von 3%."

Das ist keine Regel, die ein Mensch programmiert hat. Das ist ein statistisches Muster, das der Algorithmus selbst gefunden hat – eines von Tausenden.

Schritt 3: Validierung

Das Modell wird nicht auf allen Daten trainiert. Ein Teil (typisch 20-30%) wird zurückgehalten. Das Modell macht Vorhersagen für diese Daten – und seine Genauigkeit wird gemessen. Das verhindert Overfitting: Das Modell soll nicht historische Daten auswendig lernen, sondern echte Zusammenhänge verstehen.

Schritt 4: Produktiveinsatz und kontinuierliches Lernen

Das trainierte Modell macht täglich neue Vorhersagen. Es berechnet nicht nur einen Punktwert („Cashflow: 12,3 Mio. EUR"), sondern eine Wahrscheinlichkeitsverteilung: „Mit 70% Wahrscheinlichkeit zwischen 11,5 und 13,1 Mio. EUR, mit 95% Wahrscheinlichkeit zwischen 10,2 und 14,4 Mio. EUR."

Wichtiger noch: Sobald der tatsächliche Cashflow bekannt ist, wird dieser Datenpunkt dem Modell hinzugefügt. Das Modell wird regelmäßig neu trainiert – monatlich, wöchentlich, oder sogar täglich. Es wird kontinuierlich besser.

Warum das 20 Prozentpunkte Genauigkeitsgewinn bringt

Ein klassisches Excel-Modell kann vielleicht 10-15 Variablen sinnvoll verarbeiten. Ein ML-Modell kann Hunderte verarbeiten und deren komplexe, nicht-lineare Wechselwirkungen erkennen.

Ein Excel-Modell kann sagen: „Historisch hatten wir im Q1 15% höheren Cashflow." Ein ML-Modell kann sagen: „In Q1-Jahren mit steigenden Zinsen UND hoher Volatilität der Rohstoffpreise UND überdurchschnittlichem DSO war der Cashflow durchschnittlich 8% niedriger als in normalen Q1-Jahren."

Das ist der Unterschied zwischen einer vereinfachten Faustformel und einem präzisen, datengetriebenen Verständnis der tatsächlichen Dynamik Ihres Unternehmens.

Was das Modell konkret braucht

Die häufigste Frage: „Haben wir genug Daten?"

Die ernüchternde Antwort: Viele Unternehmen haben genug Daten, aber nicht saubere Daten.

Minimale Anforderungen:

  • Mindestens 24 Monate historische Cashflow-Daten (täglich oder wöchentlich)
  • Konsistente Erfassung (keine Systemwechsel, keine Definitionsänderungen)
  • Zuordnung zu relevanten Kategorien (Operating Cash Flow, Investing, Financing)
  • Zugang zu begleitenden Daten (Umsatz, Forderungen, Verbindlichkeiten)

Typische Probleme:

  • Daten liegen in Silos (ERP, TMS, CRM, Excel – nicht integriert)
  • Inkonsistente Zeitreihen (Systemwechsel, M&A-Aktivitäten, COVID-bedingte Strukturbrüche)
  • Fehlende Granularität (nur Monatsendwerte statt täglicher Daten)

Die gute Nachricht: Diese Probleme sind lösbar. Aber sie müssen adressiert werden, bevor ein ML-Modell produktiv genutzt werden kann. Datenqualität ist nicht ein technisches Detail – es ist das Fundament. (Mehr dazu in Beitrag 3 dieser Serie.)

Ein konkretes Szenario: Mittelständisches Unternehmen, fragmentierte IT-Landschaft, erfolgreicher KI-Einstieg

Theorie ist wichtig. Aber sie überzeugt nur begrenzt. Lassen Sie uns ein reales Szenario durchspielen – anonymisiert, aber in allen relevanten Details authentisch.

Ausgangssituation

Unternehmen: Mittelständischer Automobilzulieferer, 180 Mio. EUR Umsatz, 450 Mitarbeiter, drei Produktionsstandorte in Deutschland und Osteuropa.

Treasury-Team: Drei Personen. Ein Treasury Manager, zwei Treasury-Sachbearbeiter.

Systemlandschaft:

  • ERP: SAP (Hauptstandort Deutschland), lokales ERP-System in Osteuropa
  • TMS: Keines. Liquiditätsmanagement über Excel und manuelle Bankauszugsverarbeitung
  • Banking: Drei Bankpartner, unterschiedliche Formate, teilweise manuelle Eingabe

Herausforderung: Cash Flow Forecasting basiert auf manueller Zusammenstellung von Daten aus SAP, lokalen Systemen und Excel-Planungen der Fachabteilungen. Zeitaufwand: Zwei Tage pro Woche (einer der Sachbearbeiter ist nahezu vollständig damit ausgelastet). Genauigkeit: 14-Tages-Prognose erreicht eine Accuracy von ca. 75% (Abweichung durchschnittlich 25% vom tatsächlichen Wert). Das Management fordert höhere Genauigkeit und schnellere Updates.

Der pragmatische Einstieg: Schnell starten – aber mit klarem Scope und Governance

Interne Skepsis: „Wir sind zu klein für KI. Unsere Daten sind zu fragmentiert. Wir haben kein Budget für ein 18-Monats-Projekt."

Das Unternehmen entscheidet sich gegen ein großes Transformationsprojekt. Stattdessen: Ein fokussierter Pilotansatz über sechs Monate – mit klarer Definition von Umfang, Erfolgskriterien und Governance von Anfang an. Der Ansatz: Schnell lernen durch begrenzte Iteration, aber nicht übereilt implementieren ohne solide Grundlage.

Phase 1: Datenkonsolidierung (Monat 1-2)

Nicht als KI-Projekt, sondern als Treasury-Optimierung. Ziel: Eine zentrale Datenbasis schaffen.

  • Automatisierte Bankauszugsverarbeitung: Integration eines Cloud-basierten Tools, das Bankauszüge aller drei Partner in ein standardisiertes Format überführt.
  • SAP-Datenexport: Automatisierte tägliche Extraktion von Forderungen, Verbindlichkeiten, geplanten Zahlungen.
  • Konsolidierung in einem Data Warehouse (Cloud-basiert, SaaS-Modell, keine eigene Infrastruktur nötig).

Kosten: 15.000 EUR einmalig, 2.500 EUR monatlich.

Zeiterparnis bereits nach zwei Monaten: Ein halber Tag pro Woche.

Phase 2: ML-basiertes Forecasting (Monat 3-4)

Mit sauberer Datenbasis wird ein spezialisierter Forecasting-Service eines Drittanbieters integriert. Das Modell wird auf 28 Monate historischer Daten trainiert.

Besonderheit: Das Unternehmen muss kein eigenes Modell entwickeln oder Data Scientists einstellen. Der Anbieter liefert eine API-basierte Lösung. Das Treasury-Team gibt Feedback: Welche Vorhersagen waren gut, welche schlecht, und warum? Dieses Feedback fließt in das Training ein.

Phase 3: Pilotbetrieb (Monat 5-6)

Parallel zum bestehenden Excel-Modell läuft das ML-Modell. Jeden Montag werden beide Vorhersagen verglichen mit den tatsächlichen Ergebnissen der Vorwoche.

Ergebnis nach sechs Monaten:

  • ML-Modell: 14-Tages-Prognose erreicht eine Accuracy von ca. 88% (Abweichung durchschnittlich 12%; zuvor: Accuracy 75%, Abweichung 25%).
  • Zeitaufwand für Forecasting: Reduziert von zwei Tagen auf einen halben Tag pro Woche.
  • ROI: Die freigewordene Zeit eines Sachbearbeiters wird für strategische Projekte genutzt (Hedging-Strategie-Optimierung, Bankbeziehungsmanagement).

Erfolgsfaktoren – Was hat funktioniert?

  • Kleiner, fokussierter Scope: Nicht „KI-Transformation", sondern „besseres Forecasting".
  • Klare Erfolgskriterien: Steigerung der Accuracy um mindestens 10 Prozentpunkte (Reduzierung der Abweichung um mindestens 30%), Zeitersparnis von mindestens einem Tag pro Woche.
  • Management-Buy-in durch frühe Erfolge: Nach zwei Monaten bereits sichtbare Zeitersparnis durch Datenkonsolidierung – lange bevor das ML-Modell lief.
  • Keine Überforderung: Kein Aufbau eigener Kompetenzen, sondern Nutzung spezialisierter Dienstleister.
  • Sorgfältige Governance von Anfang an: Dokumentation, Verantwortlichkeiten, Datenschutz- und Compliance-Check vor Pilotstart.

Was dabei gelernt wurde

Die größte Überraschung: Die Datenqualität war besser als erwartet. Das Problem war nicht fehlende Daten, sondern fragmentierte Systeme. Sobald diese integriert waren, war der Schritt zu ML klein.

Die größte Hürde: Nicht Technologie, sondern Change Management. Einer der Sachbearbeiter empfand das neue System zunächst als Bedrohung. Erst als klar wurde, dass die freigewordene Zeit für wertvollere Aufgaben genutzt wird (und seine Rolle aufgewertet wurde), drehte die Stimmung.

Der regulatorische Rahmen: EU AI Act – was Treasury-Abteilungen wirklich betrifft

Ein Aspekt, der in vielen KI-Diskussionen noch immer als „offene Frage" behandelt wird, ist längst entschieden: Der EU AI Act ist Realität.

Stand Februar 2026: Das Gesetz ist seit August 2024 in Kraft. Seit Februar 2025 gelten die Verbote für besonders risikoreiche KI-Praktiken. Und ab August 2026 – das sind weniger als sechs Monate – müssen alle Unternehmen, die sogenannte High-Risk-AI-Systeme einsetzen, vollständig compliant sein.

Hinweis: Die nachfolgenden Informationen zum EU AI Act basieren auf dem Stand Februar 2026. Regulatorische Entwicklungen können sich ändern; konsultieren Sie für verbindliche Auskünfte Ihre Rechtsabteilung oder spezialisierte Berater.

Was sind High-Risk-AI-Systeme im Treasury-Kontext?

Der AI Act definiert High-Risk-Systeme in Anhang III. Für Treasury-Abteilungen sind besonders relevant:

Kategorie 5(b): KI-Systeme zur Bewertung der Kreditwürdigkeit natürlicher Personen

Das betrifft primär Retail-Banking, weniger Corporate Treasury. Aber: Wenn Ihr Unternehmen ein KI-System nutzt, um Kreditlimits für Geschäftspartner zu setzen, die natürliche Personen sind (z.B. Einzelunternehmer), könnte das darunter fallen.

Die Grauzone: Interne Finanzsysteme

Kategorie (nicht explizit, aber interpretiert): Systeme mit erheblichen Auswirkungen auf kritische Infrastrukturen

Wenn Ihr Treasury-System autonome Entscheidungen in einem systemrelevanten Finanzinstitut trifft, könnte es als high-risk klassifiziert werden.

Ein KI-System, das Cash Flow Forecasts erstellt und diese als Informationsgrundlage liefert, ist wahrscheinlich nicht high-risk. Ein KI-System, das eigenständig Liquiditätstransfers zwischen Konzerngesellschaften ausführt, könnte es sein.

Die Rechtslage ist noch nicht vollständig geklärt. Die Empfehlung: Wenn Ihr System autonome, finanzwirksame Entscheidungen trifft, behandeln Sie es vorsorglich als high-risk und implementieren Sie entsprechende Maßnahmen.

Die Compliance-Anforderungen für High-Risk-Systeme

Wenn Ihr System als high-risk klassifiziert wird, müssen Sie folgende Anforderungen erfüllen:

1. Risikomanagement-System

Ein dokumentierter, kontinuierlicher Prozess zur Identifikation, Bewertung und Minderung von Risiken.

  • Welche Risiken birgt das System? (Fehlprognosen, Bias, Datenschutzverletzungen)
  • Wie werden diese überwacht?
  • Welche Maßnahmen gibt es bei Fehlverhalten?

2. Datenqualität und Data Governance

Trainingsdaten müssen:

  • Relevant, repräsentativ und fehlerfrei sein
  • Angemessene statistische Eigenschaften haben
  • Frei von Verzerrungen sein, die zu Diskriminierung führen könnten

Das erfordert dokumentierte Data Governance-Prozesse: Wer validiert Daten? Wie werden Fehler identifiziert? Wie wird Bias getestet?

3. Technische Dokumentation

Umfassende Dokumentation über:

  • Design und Entwicklungsprozess des Systems
  • Funktionsweise (auf technischer Ebene)
  • Leistungsmetriken und Limitationen
  • Annahmen und Einschränkungen

Diese Dokumentation muss jederzeit verfügbar sein – für interne Audits und bei Bedarf für Aufsichtsbehörden.

4. Transparenz und menschliche Aufsicht

High-Risk-Systeme müssen:

  • So gestaltet sein, dass Menschen ihre Funktionsweise verstehen können
  • Klare Informationen an Nutzer liefern (was kann das System, was nicht?)
  • Mechanismen für menschliche Aufsicht enthalten (Menschen müssen Entscheidungen überschreiben können)

5. Logging und Nachvollziehbarkeit

Alle relevanten Systemaktivitäten müssen protokolliert werden:

  • Welche Entscheidungen wurden getroffen?
  • Auf Basis welcher Daten?
  • Welche Personen haben interagiert?

Diese Logs müssen mindestens sechs Monate aufbewahrt werden (je nach Anwendungsfall länger).

Was passiert bei Nicht-Compliance?

Die Strafen sind erheblich. Der AI Act sieht Bußgelder von bis zu 35 Millionen Euro oder 7% des weltweiten Jahresumsatzes vor (je nachdem, welcher Betrag höher ist) – für die schwerwiegendsten Verstöße.

Aber die größere Gefahr ist nicht die Strafe, sondern das Risiko:

  • Reputationsschaden: „Unternehmen X verstößt gegen KI-Regulierung" ist keine Schlagzeile, die Sie wollen.
  • Betriebsunterbrechung: Wenn ein System nicht compliant ist, muss es eventuell abgeschaltet werden – mitten im Betrieb.
  • Haftungsrisiken: Wenn ein KI-System fehlerhafte Entscheidungen trifft und dadurch Schaden entsteht, könnten rechtliche Konsequenzen folgen.

Praktische Handlungsempfehlungen

Schritt 1: Klassifizierung

Erstellen Sie eine Liste aller KI-Systeme, die Ihr Treasury nutzt oder plant.

Bewerten Sie für jedes System:

  • Welche Entscheidungen trifft es?
  • Sind diese Entscheidungen autonom oder unterstützend?
  • Könnte das System unter eine High-Risk-Kategorie fallen?

Schritt 2: Governance-Rahmen aufbauen

Selbst wenn Ihre Systeme nicht als High-Risk klassifiziert werden – implementieren Sie Grundprinzipien:

  • Dokumentierte Genehmigungsprozesse für neue KI-Anwendungen
  • Regelmäßige Reviews der Systemperformance
  • Klare Eskalationswege bei Fehlfunktionen

Schritt 3: Schulung

Ihr Team muss verstehen:

  • Wie KI-Systeme funktionieren (auf konzeptioneller Ebene)
  • Welche Limitationen sie haben
  • Wie man mit Fehlern umgeht

Schritt 4: Zusammenarbeit mit Anbietern

Wenn Sie KI-Systeme von Drittanbietern nutzen, stellen Sie sicher, dass diese AI Act-compliant sind. Involvieren Sie frühzeitig Rechtsabteilung und Compliance.

Die Psychologie des Abwartens – warum „nicht jetzt" selten rational ist

Es gibt legitime Gründe, mit KI-Projekten zu warten. Unzureichende Datenqualität. Fehlende IT-Kapazitäten. Regulatorische Unsicherheit.

Aber oft sind die Gründe andere. Lassen Sie uns ehrlich sein.

Einwand 1: „Wir warten, bis die Technologie ausgereift ist"

Dieser Einwand war 2023 berechtigt. 2024 diskutabel. 2026 ist er überholt.

LLMs sind seit mehr als drei Jahren im produktiven Einsatz. Machine Learning für Forecasting ist seit einem Jahrzehnt etabliert. Die Technologie ist nicht mehr experimentell.

Was sich ändert, ist die Geschwindigkeit der Verbesserung. Aber wer darauf wartet, dass „alles fertig ist", wartet für immer. Die Frage ist nicht, ob die Technologie reif genug ist. Die Frage ist, ob Sie bereit sind, den Lernprozess zu beginnen.

Einwand 2: „Wir haben aktuell keine Ressourcen"

Das ist der häufigste Einwand – und oft der ehrlichste.

Die Realität: KI-Projekte müssen keine Mammutprojekte sein. Große Beratungsunternehmen bieten „KI Quick Wins"-Programme an: Vier bis sechs Wochen, fokussiert auf einen Use Case (typischerweise Reconciliation oder Forecasting), mit garantierter messbarer Verbesserung.

Das Ziel: Die psychologische Hürde senken und Erfahrung aufbauen.

Das bedeutet: Der Wettbewerb investiert nicht Millionen. Sie investieren Zeit – und die investieren sie jetzt. Wer 2026 noch nicht mit einem ersten Piloten begonnen hat, verliert nicht nur Effizienzpotenzial. Sondern auch Lernkurve.

Einwand 3: „Das ist zu komplex für uns"

Dieser Einwand basiert auf einem Missverständnis: KI ist keine Frage der Unternehmensgröße, sondern der Prozesskomplexität.

Die Realität: Ein mittelständisches Unternehmen mit drei Standorten und komplexen Konzernstrukturen hat oft mehr Nutzen von KI als ein Großkonzern mit standardisierten Prozessen.

Warum? Weil KI besonders gut darin ist, mit Heterogenität umzugehen.

Und: Sie müssen kein KI-Experte werden. Sie müssen wissen, welche Probleme Sie haben – und welche Anbieter diese lösen können. Das ist keine technische Frage, sondern eine strategische.

Einwand 4: „Das rechnet sich nicht"

Die Frage nach dem ROI ist berechtigt. Aber oft wird sie zu eng gestellt.

Typische ROI-Betrachtung:

  • Kosten: Implementierung, Lizenzgebühren, Schulung
  • Nutzen: Zeitersparnis, höhere Genauigkeit

Der ROI: Wenn Sie einen halben FTE (Full-Time Equivalent) durch Automatisierung freisetzen, haben Sie das in 12-18 Monaten wieder drin. Jede weitere Verbesserung ist reiner Gewinn.

Die versteckten Kosten des Abwartens:

  • Opportunity Cost: Während Sie abwarten, nutzen Wettbewerber KI, um bessere Forecasts zu erstellen, schneller auf Marktveränderungen zu reagieren, und strategischere Entscheidungen zu treffen.
  • Lernkurve: Jeder Monat, den Sie später beginnen, ist ein Monat, in dem Sie keine Erfahrung aufbauen.
  • Talentabwanderung: Die besten Treasury-Professionals wollen mit moderner Technologie arbeiten. Wer das nicht bietet, verliert sie an Wettbewerber.

Einwand 5: „Unser Team ist skeptisch"

Das ist der ehrlichste – und oft unterschätzteste – Einwand.

Niemand mag Veränderung. Besonders, wenn sie als Bedrohung wahrgenommen wird.

Das Gegenmittel:

  • Frühe Einbindung: Lassen Sie das Team Teil des Entscheidungsprozesses sein. Nicht: „Wir implementieren KI." Sondern: „Welches Problem nervt euch am meisten – und könnten wir das mit KI lösen?"
  • Kleine Erfolge: Beginnen Sie mit einem Use Case, der schnell Ergebnisse liefert. Nichts überzeugt so sehr wie messbare Verbesserung.
  • Transparenz über Konsequenzen: Freigesetzte Zeit ist kein Stellenabbau. Es ist Aufwertung. Machen Sie klar: Wer sich von Routineaufgaben befreit, kann strategisch wertvoller werden.

Wo Sie konkret starten können – drei realistische erste Schritte

Theorie ist wichtig. Aber was können Sie konkret tun – diese Woche, nicht nächstes Jahr?

Schritt 1 – Reconciliation

Was es ist: Automatisierte Abstimmung von Zahlungsströmen zwischen Bank, ERP und TMS. Identifikation von Ausnahmen (unmatched items).

Warum hier starten:

  • Geringer Bedarf an historischen Daten (das System lernt aus aktuellen Transaktionen)
  • Schnelle Implementierung (oft 6-12 Wochen)
  • Sofortiger, messbarer Nutzen (Zeitersparnis)
  • Geringes Risiko (unterstützende Funktion, keine strategische Entscheidung)

Erwartbare Ergebnisse:

  • 70-90% der Transaktionen werden automatisch gematched
  • Verbleibende Ausnahmen werden priorisiert und strukturiert vorgelegt
  • Zeitersparnis: 50-80% (je nach Ausgangssituation)

Anbieter-Beispiele:

Spezialisierte Lösungen wie HighRadius, BlackLine, oder TMS-integrierte Automatisierung bei SAP, FIS, Kyriba.

Schritt 2 – Cash Visibility & Reporting

Was es ist: Automatisierte Aggregation und Visualisierung von Cashbeständen über mehrere Banken, Währungen und Rechtseinheiten hinweg. LLM-gestützte Berichtserstellung.

Warum hier starten:

  • Unmittelbare Wertschöpfung (Management bekommt bessere, schnellere Information)
  • Fundament für weitere KI-Anwendungen (saubere, konsolidierte Datenbasis)
  • Moderate Komplexität (keine Vorhersagemodelle, „nur" Aggregation und Visualisierung)

Erwartbare Ergebnisse:

  • Echtzeit-Übersicht über globale Liquidität (statt manueller Excel-Konsolidierung)
  • Automatische Berichtserstellung (z.B. „Weekly Cash Report" in natürlicher Sprache)
  • Zeitersparnis: 1-2 Tage pro Woche

Schritt 3 – Cash Flow Forecasting

Was es ist: ML-basierte Vorhersage zukünftiger Cashflows auf Basis historischer Daten, Umsatzentwicklung, Zahlungsverhalten und externer Faktoren.

Warum nicht gleich hier starten:

  • Benötigt saubere, konsistente Datenhistorie (die Sie in Schritt 1+2 aufgebaut haben)
  • Größte messbare Genauigkeitsgewinne (typisch +15-25 Prozentpunkte Accuracy-Steigerung)
  • Hoher strategischer Wert (bessere Planung, geringere Liquiditätspuffer)

Erwartbare Ergebnisse:

  • Forecasting-Genauigkeit steigt von 60-75% Accuracy auf 85-92% Accuracy
  • Wahrscheinlichkeitsverteilung statt Punktschätzung (besseres Risikoverständnis)
  • Kontinuierliche Verbesserung (Modell lernt mit jedem neuen Datenpunkt)

Die Botschaft dieses Beitrags: Handeln, nicht abwarten

Dieser erste Beitrag hat den Kontext gesetzt – die Realität des Jahres 2026, die regulatorischen Anforderungen, die Marktentwicklungen und die strategische Dringlichkeit. Die folgenden sechs Beiträge gehen tiefer:

  • Beitrag 2 beleuchtet KI-Agenten und Assistenzsysteme im Treasury – was sie konkret leisten, wie sie sich von Chatbots unterscheiden, und welche Anwendungsfälle bereits produktiv laufen.
  • Beitrag 3 widmet sich der Datenqualität und Infrastruktur – dem oft unterschätzten Fundament jeder erfolgreichen KI-Implementierung.
  • Beitrag 4 analysiert Blockchain und DeFi im Treasury-Kontext – jenseits des Hypes, mit Fokus auf reale Anwendungsfälle.
  • Beitrag 5 behandelt Risikomanagement und Compliance – wie Sie KI sicher und regelkonform einsetzen.
  • Beitrag 6 zeigt die strategische Perspektive – wie KI die Rolle des Treasurers verändert und welche neuen Kompetenzen gefordert sind.
  • Beitrag 7 blickt in die Zukunft – wohin entwickelt sich KI im Treasury, und wie bereiten Sie sich darauf vor?

Aber der wichtigste Punkt ist: Sie müssen nicht alle sieben Beiträge lesen, bevor Sie handeln. Sie können heute beginnen.

Die Unternehmen, die 2026 führend sind, haben eines gemeinsam: Sie haben 2024 oder spätestens 2025 angefangen. Nicht mit einem perfekten Plan. Sondern mit einem fokussierten Piloten, klaren Erfolgskriterien und der Bereitschaft, zu lernen.

Die Frage ist nicht, ob KI im Treasury funktioniert. Die Frage ist, wann Sie anfangen.

Blogartikel 2 erscheint in vier Wochen: KI-Agenten im Treasury – Wie autonome Systeme Prozesse neu definieren.

Diesen Beitrag teilen

KI im Treasury – Vom Hype zur Execution – Beitrag 1 von 7 – Februar 2026

AI in Treasury – From Hype to Execution - 

Article 1 of 7 February 2026

Three years of discussion. Time to move on.

Do you remember the treasury conferences of 2023 and 2024? Nearly every keynote contained the words "Artificial Intelligence" somewhere. The presentations featured impressive graphics, the possibilities sounded revolutionary, and at the end of the day you went home—fascinated, but without a concrete next step.

2025 got serious. First pilot projects were launched. Some failed. Some convinced. And a small group of treasury teams began seeing real results.

2026 is the year when the question is no longer: "Should we deploy AI?" The question is: "Why haven't we started yet—and what is it costing us?"

This article is the opening of a seven-part series that treats AI in treasury not as a technology topic, but as a strategic and operational reality. No visions, no pie in the sky. Rather, an honest assessment of what is possible today, what is already being done today—and what you can concretely do.

The Turning Point: From Exploration to Execution

The finance industry knows the cycle well. New technologies appear, are overhyped, disappoint in the short term, and establish themselves in the long term. Gartner calls it the Hype Cycle. AI in treasury has gone through this cycle at remarkable speed.

What began in 2022 with ChatGPT as a demonstration of linguistic AI capabilities has evolved in less than four years into a complete ecosystem of productive AI applications. Large Language Models (LLMs) are no longer experimental terrain—they are infrastructure. Multimodal AI, which can simultaneously process text, data, images, and documents, is the new standard.

And Agentic AI—autonomous AI systems that don't just respond but act independently and orchestrate processes—is the dominant topic of 2026.

For treasury, this means: The technological foundation is laid. The question is no longer whether AI works. The question is how quickly your company can make the turn.

The industry consensus is clear: 2026 is being called the Year of AI Execution. Finance teams that started in 2025 with small, focused use cases—reconciliation, cash visibility, forecasting—are reporting measurable competitive advantages today. Teams still waiting are losing these advantages daily.

What AI Actually Delivers in Treasury – With Numbers

Let's talk substance. What does AI concretely deliver when deployed in treasury?

Cash Flow Forecasting: Based on practical observations at leading companies, AI-supported forecasting models today achieve accuracy of up to 90 percent—compared to 60 to 70 percent with classic rule-based approaches. This sounds like a technical detail, but has significant practical consequences: better liquidity planning, lower buffer requirements, more precise decision-making foundations for management.

Covenant Analysis and Contract Management: A practical example from a mid-sized automotive supplier (approx. 180 million EUR revenue) illustrates the potential: What previously required hours of manual analysis—working through credit agreements, identifying relevant covenants, creating structured reports—can be completed up to 95 percent faster with AI-supported systems. Not as a replacement for human judgment, but as preliminary work that enables that judgment in the first place.

Reconciliation and Exception Handling: Rule-based automation (RPA) can handle standard cases. AI can additionally recognize patterns, classify and prioritize exceptions—and learns continuously from the decisions people make.

Risk Detection: AI systems analyze market data, counterparty risks, and portfolio positions in real-time for anomalies and patterns that no human team could capture with this speed and completeness.

These numbers don't come from glossy brochures, but from concrete project experiences of leading financial institutions and consulting firms that have active AI solutions in use in the treasury area. The technology works—when implemented correctly.

AI Is Not Equal to AI: A Necessary Distinction

Before we dive deeper, an important clarification is needed that is missing in many discussions: Not everything marketed as "AI" today is the same. And the differences are relevant for treasury decision-makers.

Robotic Process Automation (RPA)

What RPA can do:

  • Transfer data between systems (e.g., from emails to TMS)
  • Create standardized reports
  • Automate recurring click paths

What RPA cannot do:

  • Handle unexpected formats
  • Make decisions based on context
  • Learn from mistakes

RPA executes rule-based processes automatically. It is valuable, but not intelligent—it cannot handle exceptions it doesn't know, and doesn't learn.

Treasury application: Automated transfer of bank statements in standardized formats, creation of recurring liquidity reports.

Machine Learning (ML)

ML recognizes patterns in large data sets and makes predictions. Cash flow forecasting is a classic ML use case. ML learns, improves with more data, and can handle uncertainties.

What ML can do:

  • Recognize patterns in historical data
  • Make predictions and quantify their uncertainty
  • Improve with each new data point

What ML cannot do:

  • Handle completely new situations with no correspondence in training data
  • Understand causality (only correlation)
  • Function without sufficient data history

Treasury application: Cash flow forecasting, FX exposure predictions, working capital optimization.

Large Language Models (LLMs)

LLMs like GPT process and generate language at a level that mimics human communication. In treasury, they are particularly valuable for analyzing documents, answering complex questions based on internal knowledge databases, and creating reports.

What LLMs can do:

  • Understand and summarize unstructured documents
  • Answer complex questions in natural language
  • Create reports and analyses in consistent quality
  • Synthesize multiple information sources

What LLMs cannot do:

  • Guarantee factually correct information (hallucination risk)
  • Perform mathematical calculations without additional tools
  • Process real-time data (without integration)

Treasury application: Contract analysis, knowledge management, reporting automation.

Agentic AI

Agentic AI—currently the hottest topic—goes a step further: Autonomous AI agents can independently plan tasks, use resources, interface with other systems, and orchestrate processes from start to finish. Without a human initiating every step.

What Agentic AI can do:

  • Break complex tasks into sub-steps
  • Independently decide which tools/systems to use
  • Collaborate with other agents
  • Adjust strategy based on feedback

What Agentic AI cannot do:

  • Act completely autonomously without human goal setting
  • Understand the consequences of its actions in all dimensions
  • Handle ethical dilemmas

Treasury application: End-to-end process orchestration—e.g., from receipt of an invoice through liquidity check, approval workflow, to optimized payment execution.

The Critical Difference: Agentic AI vs. Chatbot

A chatbot—even an LLM-based one—waits for your question and gives an answer. An agentic system independently recognizes that a task is pending, plans the necessary steps, executes them, and informs you of the result.

Example:

Chatbot approach: You: "What liquidity do we have tomorrow?" System: "Based on current data: 12.3 million EUR."

Agentic approach: System recognizes: A large payment outflow is planned for tomorrow (15 million EUR). It independently checks all accounts, identifies that liquidity is available in two group accounts, creates a transfer proposal, checks whether it complies with internal guidelines, and presents it to you for approval—before you even asked about it.

This is the qualitative leap that Agentic AI brings. Not reactive, but proactive. Not executing, but orchestrating.

This distinction is not academic. Those who sell RPA as AI are exaggerating. Those who understand AI only as a chatbot underestimate the potential. For a strategic decision, you need clarity about which technology solves which problem.

How Machine Learning Really Works in Cash Flow Forecasting – And Why Excel Fails

Let's get concrete. "AI improves cash flow forecasting by 20 percentage points of accuracy"—that's a statement found in every other whitepaper. But what does that actually mean? How does it work? And why can't Excel do this?

The Structural Problem of Classic Forecasting Methods

Most companies use a combination of three approaches for cash flow forecasting:

  • Direct method: Planned cash inflows and outflows are manually captured and aggregated
  • Indirect method: Cash flows are derived from the income statement
  • Historical averages: "In March we had an average of X million in cash flow the last three years, so we'll take that again"

All three have a common problem: They can only depict non-linearities, seasonalities, external shocks, and complex interactions to a limited extent.

Excel models fail structurally because:

  • They are based on static formulas that must be defined by humans. Every if-then rule must be explicitly programmed
  • They cannot perform pattern recognition across large data sets. A human cannot simultaneously consider 50 variables and understand their interaction
  • They don't learn. Today's model is identical to the one from six months ago—unless a human has manually adjusted it
  • They handle uncertainty poorly. Excel gives you a number, not a probability distribution

How an ML Model Proceeds Instead

A Machine Learning model for cash flow forecasting—typically an ensemble of gradient boosting algorithms or neural networks—works fundamentally differently:

Step 1: Data Collection and Feature Engineering

The model requires historical data—ideally at least 24 months of daily or weekly cash flow data. But not just cash flows. Also:

  • Sales data (by region, product line, customer)
  • Accounts receivable and payable balances
  • Payment terms and historical payment patterns (DSO, DPO)
  • Seasonal markers (calendar weeks, holidays, month-ends)
  • External factors (interest rates, FX rates, commodity prices for relevant industries)
  • Macroeconomic indicators (GDP growth, purchasing manager indices)

The model constructs "features" from this—derived variables that have predictive power. Example: Not just "sales in March," but "sales in March over the last three years, trend, volatility, deviation from the rolling 12-month average."

Step 2: Training

The model searches for patterns. It learns: "If DSO has risen by 5 days in the last two weeks, AND simultaneously sales in the EMEA region have fallen by 10%, AND we're in calendar week 12, then cash flow drops on average by 8% in the next 7 days, with a standard deviation of 3%."

This is not a rule that a human programmed. This is a statistical pattern that the algorithm found itself—one of thousands.

Step 3: Validation

The model is not trained on all data. A portion (typically 20-30%) is held back. The model makes predictions for this data—and its accuracy is measured. This prevents overfitting: The model should not memorize historical data, but understand real relationships.

Step 4: Production Use and Continuous Learning

The trained model makes new predictions daily. It calculates not just a point value ("Cash flow: 12.3 million EUR"), but a probability distribution: "With 70% probability between 11.5 and 13.1 million EUR, with 95% probability between 10.2 and 14.4 million EUR."

More importantly: As soon as the actual cash flow is known, this data point is added to the model. The model is regularly retrained—monthly, weekly, or even daily. It continuously gets better.

Why This Brings 20 Percentage Points of Accuracy Gain

A classic Excel model can perhaps meaningfully process 10-15 variables. An ML model can process hundreds and recognize their complex, non-linear interactions.

An Excel model can say: "Historically we had 15% higher cash flow in Q1." An ML model can say: "In Q1 years with rising interest rates AND high commodity price volatility AND above-average DSO, cash flow was on average 8% lower than in normal Q1 years."

That's the difference between a simplified rule of thumb and a precise, data-driven understanding of your company's actual dynamics.

What the Model Concretely Needs

The most common question: "Do we have enough data?"

The sobering answer: Many companies have enough data, but not clean data.

Minimum requirements:

  • At least 24 months of historical cash flow data (daily or weekly)
  • Consistent capture (no system changes, no definition changes)
  • Assignment to relevant categories (Operating Cash Flow, Investing, Financing)
  • Access to accompanying data (revenue, receivables, payables)

Typical problems:

  • Data exists in silos (ERP, TMS, CRM, Excel—not integrated)
  • Inconsistent time series (system changes, M&A activities, COVID-related structural breaks)
  • Missing granularity (only month-end values instead of daily data)

The good news: These problems are solvable. But they must be addressed before an ML model can be used productively. Data quality is not a technical detail—it is the foundation. (More on this in Article 3 of this series.)

A Concrete Scenario: Mid-Sized Company, Fragmented IT Landscape, Successful AI Entry

Theory is important. But it only convinces to a limited extent. Let's walk through a real scenario—anonymized, but authentic in all relevant details.

Initial Situation

Company: Mid-sized automotive supplier, 180 million EUR revenue, 450 employees, three production sites in Germany and Eastern Europe.

Treasury team: Three people. One treasury manager, two treasury clerks.

System landscape:

  • ERP: SAP (main site Germany), local ERP system in Eastern Europe
  • TMS: None. Liquidity management via Excel and manual bank statement processing
  • Banking: Three banking partners, different formats, partially manual entry

Challenge: Cash flow forecasting is based on manual compilation of data from SAP, local systems, and Excel plans from specialist departments. Time required: Two days per week (one of the clerks is almost fully occupied with this). Accuracy: 14-day forecast achieves approximately 75% accuracy (deviation on average 25% from actual value). Management demands higher accuracy and faster updates.

The Pragmatic Entry: Start Quickly – But With Clear Scope and Governance

Internal skepticism: "We're too small for AI. Our data is too fragmented. We don't have the budget for an 18-month project."

The company decides against a large transformation project. Instead: A focused pilot approach over six months—with clear definition of scope, success criteria, and governance from the start. The approach: Learn quickly through limited iteration, but don't implement hastily without a solid foundation.

Phase 1: Data Consolidation (Months 1-2)

Not as an AI project, but as treasury optimization. Goal: Create a central data basis.

  • Automated bank statement processing: Integration of a cloud-based tool that converts bank statements from all three partners into a standardized format
  • SAP data export: Automated daily extraction of receivables, payables, planned payments
  • Consolidation in a data warehouse (cloud-based, SaaS model, no own infrastructure needed)

Costs: 15,000 EUR one-time, 2,500 EUR monthly.

Time savings after just two months: Half a day per week.

Phase 2: ML-Based Forecasting (Months 3-4)

With a clean data basis, a specialized forecasting service from a third-party provider is integrated. The model is trained on 28 months of historical data.

Special feature: The company doesn't need to develop its own model or hire data scientists. The provider delivers an API-based solution. The treasury team provides feedback: Which predictions were good, which were bad, and why? This feedback flows into the training.

Phase 3: Pilot Operation (Months 5-6)

The ML model runs parallel to the existing Excel model. Every Monday, both predictions are compared with the actual results from the previous week.

Results after six months:

  • ML model: 14-day forecast achieves approximately 88% accuracy (deviation on average 12%; previously: 75% accuracy, 25% deviation)
  • Time required for forecasting: Reduced from two days to half a day per week
  • ROI: The freed-up time of one clerk is used for strategic projects (hedging strategy optimization, bank relationship management)

Success Factors – What Worked?

  • Small, focused scope: Not "AI transformation," but "better forecasting"
  • Clear success criteria: Increase accuracy by at least 10 percentage points (reduce deviation by at least 30%), time savings of at least one day per week
  • Management buy-in through early successes: After two months, already visible time savings through data consolidation—long before the ML model ran
  • No overwhelming: No building of own competencies, but use of specialized service providers
  • Careful governance from the start: Documentation, responsibilities, data protection and compliance check before pilot start

What Was Learned

The biggest surprise: Data quality was better than expected. The problem wasn't missing data, but fragmented systems. Once these were integrated, the step to ML was small.

The biggest hurdle: Not technology, but change management. One of the clerks initially perceived the new system as a threat. Only when it became clear that the freed-up time would be used for more valuable tasks (and his role was upgraded) did sentiment turn.

The Regulatory Framework: EU AI Act – What Really Affects Treasury Departments

An aspect still often treated as an "open question" in many AI discussions has long been decided: The EU AI Act is reality.

Status February 2026: The law has been in force since August 2024. Since February 2025, the prohibitions for particularly high-risk AI practices apply. And from August 2026—that's less than six months—all companies using so-called high-risk AI systems must be fully compliant.

Note: The following information on the EU AI Act is based on the status as of February 2026. Regulatory developments may change; consult your legal department or specialized advisors for binding information.

What Are High-Risk AI Systems in the Treasury Context?

The AI Act defines high-risk systems in Annex III. Particularly relevant for treasury departments:

Category 5(b): AI systems for assessing the creditworthiness of natural persons

This primarily affects retail banking, less corporate treasury. But: If your company uses an AI system to set credit limits for business partners who are natural persons (e.g., sole proprietors), this could fall under it.

The gray area: Internal financial systems

Category (not explicit, but interpreted): Systems with significant impact on critical infrastructures

If your treasury system makes autonomous decisions in a systemically important financial institution, it could be classified as high-risk.

An AI system that creates cash flow forecasts and delivers them as an information basis is probably not high-risk. An AI system that independently executes liquidity transfers between group companies could be.

The legal situation is not yet fully clarified. The recommendation: If your system makes autonomous, financially effective decisions, treat it preemptively as high-risk and implement appropriate measures.

The Compliance Requirements for High-Risk Systems

If your system is classified as high-risk, you must meet the following requirements:

  1. Risk Management System

A documented, continuous process for identifying, assessing, and mitigating risks.

  • What risks does the system pose? (Incorrect forecasts, bias, data protection violations)
  • How are these monitored?
  • What measures exist for misconduct?
  1. Data Quality and Data Governance

Training data must:

  • Be relevant, representative, and error-free
  • Have appropriate statistical properties
  • Be free from distortions that could lead to discrimination

This requires documented data governance processes: Who validates data? How are errors identified? How is bias tested?

  1. Technical Documentation

Comprehensive documentation about:

  • Design and development process of the system
  • Functionality (at technical level)
  • Performance metrics and limitations
  • Assumptions and restrictions

This documentation must be available at all times—for internal audits and, if necessary, for supervisory authorities.

  1. Transparency and Human Oversight

High-risk systems must:

  • Be designed so that humans can understand their functionality
  • Deliver clear information to users (what can the system do, what can't it?)
  • Contain mechanisms for human oversight (humans must be able to override decisions)
  1. Logging and Traceability

All relevant system activities must be logged:

  • What decisions were made?
  • Based on what data?
  • Which persons interacted?

These logs must be retained for at least six months (longer depending on the use case).

What Happens With Non-Compliance?

The penalties are substantial. The AI Act provides for fines of up to 35 million euros or 7% of global annual revenue (whichever is higher)—for the most serious violations.

But the greater danger is not the penalty, but the risk:

  • Reputational damage: "Company X violates AI regulation" is not a headline you want
  • Operational interruption: If a system is not compliant, it may have to be shut down—in the middle of operations
  • Liability risks: If an AI system makes incorrect decisions and causes damage, legal consequences could follow

Practical Action Recommendations

Step 1: Classification

Create a list of all AI systems that your treasury uses or plans to use.

Evaluate for each system:

  • What decisions does it make?
  • Are these decisions autonomous or supportive?
  • Could the system fall under a high-risk category?

Step 2: Build Governance Framework

Even if your systems are not classified as high-risk—implement basic principles:

  • Documented approval processes for new AI applications
  • Regular reviews of system performance
  • Clear escalation paths for malfunctions

Step 3: Training

Your team must understand:

  • How AI systems work (at a conceptual level)
  • What limitations they have
  • How to handle errors

Step 4: Collaboration With Vendors

If you use AI systems from third-party providers, ensure they are AI Act-compliant. Involve the legal department and compliance early.

The Psychology of Waiting – Why "Not Now" Is Rarely Rational

There are legitimate reasons to wait with AI projects. Insufficient data quality. Missing IT capacities. Regulatory uncertainty.

But often the reasons are different. Let's be honest.

Objection 1: "We're waiting until the technology is mature"

This objection was justified in 2023. Debatable in 2024. In 2026, it's outdated.

LLMs have been in productive use for more than three years. Machine learning for forecasting has been established for a decade. The technology is no longer experimental.

What's changing is the speed of improvement. But those who wait for "everything to be finished" wait forever. The question is not whether the technology is mature enough. The question is whether you're ready to begin the learning process.

Objection 2: "We currently don't have resources"

This is the most common objection—and often the most honest.

The reality: AI projects don't have to be mammoth projects. Large consulting firms offer "AI Quick Wins" programs: Four to six weeks, focused on one use case (typically reconciliation or forecasting), with guaranteed measurable improvement.

The goal: Lower the psychological barrier and build experience.

This means: The competition isn't investing millions. They're investing time—and they're investing it now. Those who haven't started with a first pilot in 2026 are losing not just efficiency potential. But also learning curve.

Objection 3: "This is too complex for us"

This objection is based on a misunderstanding: AI is not a question of company size, but of process complexity.

The reality: A mid-sized company with three locations and complex group structures often has more benefit from AI than a large corporation with standardized processes.

Why? Because AI is particularly good at handling heterogeneity.

And: You don't have to become an AI expert. You need to know what problems you have—and which providers can solve them. That's not a technical question, but a strategic one.

Objection 4: "The numbers don't add up"

The question about ROI is justified. But it's often posed too narrowly.

Typical ROI consideration:

  • Costs: Implementation, license fees, training
  • Benefits: Time savings, higher accuracy

The ROI: If you free up half an FTE (Full-Time Equivalent) through automation, you've recouped that in 12-18 months. Every further improvement is pure profit.

The hidden costs of waiting:

  • Opportunity cost: While you wait, competitors use AI to create better forecasts, react faster to market changes, and make more strategic decisions
  • Learning curve: Every month you start later is a month in which you're not building experience
  • Talent drain: The best treasury professionals want to work with modern technology. Those who don't offer it lose them to competitors

Objection 5: "Our team is skeptical"

This is the most honest—and often most underestimated—objection.

Nobody likes change. Especially when it's perceived as a threat.

The antidote:

  • Early involvement: Make the team part of the decision process. Not: "We're implementing AI." But: "What problem annoys you the most—and could we solve it with AI?"
  • Small successes: Start with a use case that delivers results quickly. Nothing convinces like measurable improvement
  • Transparency about consequences: Freed-up time is not job cuts. It's upgrading. Make it clear: Those who free themselves from routine tasks can become strategically more valuable

Where You Can Concretely Start – Three Realistic First Steps

Theory is important. But what can you concretely do—this week, not next year?

Step 1 – Reconciliation

What it is: Automated reconciliation of payment flows between bank, ERP, and TMS. Identification of exceptions (unmatched items).

Why start here:

  • Low need for historical data (the system learns from current transactions)
  • Fast implementation (often 6-12 weeks)
  • Immediate, measurable benefit (time savings)
  • Low risk (supportive function, no strategic decision)

Expected results:

  • 70-90% of transactions are automatically matched
  • Remaining exceptions are prioritized and presented in a structured manner
  • Time savings: 50-80% (depending on initial situation)

Provider examples: Specialized solutions like HighRadius, BlackLine, or TMS-integrated automation at SAP, FIS, Kyriba.

Step 2 – Cash Visibility & Reporting

What it is: Automated aggregation and visualization of cash balances across multiple banks, currencies, and legal entities. LLM-supported report creation.

Why start here:

  • Immediate value creation (management gets better, faster information)
  • Foundation for further AI applications (clean, consolidated data basis)
  • Moderate complexity (no prediction models, "just" aggregation and visualization)

Expected results:

  • Real-time overview of global liquidity (instead of manual Excel consolidation)
  • Automatic report creation (e.g., "Weekly Cash Report" in natural language)
  • Time savings: 1-2 days per week

Step 3 – Cash Flow Forecasting

What it is: ML-based prediction of future cash flows based on historical data, revenue development, payment behavior, and external factors.

Why not start here right away:

  • Requires clean, consistent data history (which you built in Steps 1+2)
  • Greatest measurable accuracy gains (typically +15-25 percentage points accuracy increase)
  • High strategic value (better planning, lower liquidity buffers)

Expected results:

  • Forecasting accuracy increases from 60-75% to 85-92% accuracy
  • Probability distribution instead of point estimate (better risk understanding)
  • Continuous improvement (model learns with each new data point)

The Message of This Article: Act, Don't Wait

This first article has set the context—the reality of 2026, the regulatory requirements, market developments, and strategic urgency. The following six articles go deeper:

  • Article 2 examines AI agents and assistance systems in treasury—what they concretely deliver, how they differ from chatbots, and which use cases are already running productively
  • Article 3 is dedicated to data quality and infrastructure—the often underestimated foundation of every successful AI implementation
  • Article 4 analyzes blockchain and DeFi in the treasury context—beyond the hype, with a focus on real use cases
  • Article 5 addresses risk management and compliance—how to deploy AI safely and in accordance with regulations
  • Article 6 shows the strategic perspective—how AI is changing the role of the treasurer and what new competencies are required
  • Article 7 looks to the future—where is AI in treasury heading, and how do you prepare for it?

But the most important point is: You don't have to read all seven articles before you act. You can start today.

The companies that are leading in 2026 have one thing in common: They started in 2024 or at the latest 2025. Not with a perfect plan. But with a focused pilot, clear success criteria, and the willingness to learn.

The question is not whether AI works in treasury. The question is when you start.

Blog Article 2 appears in four weeks: AI Agents in Treasury – How Autonomous Systems Are Redefining Processes.

Share this post