Schnittstellen: So arbeitet unser KI-Agent mit echten Systemen

Hoi und herzlich willkomma zu den Büro für KI-Insights 👋🏽

In den letzten Wochen habe ich Schritt für Schritt unser KI-Betriebssystem zerlegt. Zuerst ging es um die Identität, also um die Frage, wer der Agent überhaupt ist. Danach um das Gedächtnis, also was er weiss und wiederfindet. Letzte Woche um Skills, also wie er Aufgaben sauber ausführt.

Heute kommt der vierte Baustein dazu, die Schnittstellen.

Hast du dir schon mal überlegt, wo ein Agent in deinem Alltag eigentlich mitarbeiten müsste, damit er dir wirklich etwas abnimmt?

Solange etwas nur im Chatfenster bleibt, bekommst du oft einen guten Vorschlag. Wenn der Mail-Entwurf schon im richtigen Postfach liegt, ein Termin bereits im Kalender vorbereitet ist oder eine Offerte als Entwurf in Bexio steht, ist ein Teil der Arbeit schon gemacht.

Diagramm der fünf Bausteine eines KI-Betriebssystems: Identität, Gedächtnis, Skills, Schnittstellen, Governance

Im Überblick zum KI-Betriebssystem habe ich die fünf Bausteine einmal zusammengezogen. Heute zoomen wir in den vierten hinein.

Identität und Gedächtnis beschreiben das Sein des Agenten, Skills und Schnittstellen sein Tun, und Governance klärt am Schluss, was er überhaupt darf.

In diesem Newsletter zeige ich dir:

Warum ein Agent ohne Schnittstellen oft ein guter Texthelfer bleibt
Woran du eine brauchbare Schnittstelle erkennst
Wie wir Mail, Kalender, Drive, Bexio und WordPress bei uns angebunden haben
Wie du mit einer ersten sinnvollen Schnittstelle starten kannst

Let's dive in 🤓🤿

Worum es bei Schnittstellen wirklich geht

Bei Schnittstellen geht es um eine einfache Frage: Womit spricht dein Agent überhaupt?

Sagt er dir nur «So würde ich die Mail schreiben», oder legt er den Entwurf direkt im richtigen Postfach an? Sagt er nur «Trag dir diesen Termin ein», oder bereitet er den Kalendereintrag bereits vor? Kann er nur eine Offerte texten, oder steht der Entwurf danach schon im Zielsystem?

Genau dort beginnt echte Unterstützung im Alltag.

Warum starke KI ohne Systemzugang stecken bleibt

Stell dir vor, am Montag startet eine neue Person bei dir im Team.

Sie ist stark, schreibt gut, denkt mit, versteht schnell und stellt die richtigen Fragen. Nur hat sie keinen Zugang zu irgendetwas, also weder zu Mail, Kalender und Drive noch zu CRM, Bexio oder irgendwelchen Logins.

Dann merkst du schnell, was fehlt. Kompetenz allein reicht nicht. Die Person kann dir sagen, wie du eine Offerte aufsetzt, welche Infos in eine Antwortmail gehören oder welche Unterlagen für einen Workshop fehlen. Sie kann es aber nicht dort erledigen, wo deine Arbeit tatsächlich stattfindet.

Mit einem starken Modell ohne Schnittstellen passiert dir genau dasselbe. Es kann viel beitragen, bleibt aber vor den eigentlichen Systemen stehen.

Die Arbeit läuft in Unternehmen selten im Modell. Normales ChatGPT ist dann ja doch sehr viel copy/paste. Sie läuft in Postfächern, Kalendern, Dateisystemen, Buchhaltungstools, Browsern, Fachanwendungen und internen Plattformen. Dort wird gesucht, geschrieben, abgelegt, aktualisiert, freigegeben und dokumentiert.

Das Thema ist längst auch im Markt angekommen. Anthropic beschreibt mit dem Model Context Protocol einen offenen Standard für solche Verbindungen. OpenAI bündelt Vergleichbares unter Tools für Agents. Microsoft spricht in Copilot Studio von Tools und Connectors. Die Begriffe unterscheiden sich, das Grundmuster nicht. Sobald KI nicht nur antworten, sondern in echten Systemen lesen, schreiben oder etwas auslösen soll, brauchst du Schnittstellen.

Für viele KMU ist das am Ende relevanter als die Frage, welches Modell etwas schöner formuliert. Entscheidend ist, ob das System an den Ort kommt, an dem die Arbeit passiert.

Was eine gute Schnittstelle von einer halbfertigen Integration trennt

Vielleicht kennst du diesen Satz schon: «Wir haben jetzt eine API angebunden.» Technisch ist das schön. Alles ist ready. Aber damit ist die Arbeit noch nicht erledigt.

Eine gute Schnittstelle ist mehr als eine Leitung zwischen zwei Systemen. Du musst sauber festlegen, was der Agent dort tun soll, was er nicht tun soll und wie sich die Verbindung im Alltag verhalten muss.

Für uns gehören fünf Dinge dazu.

1. Ein klares Zielsystem

Zuerst muss klar sein, womit der Agent konkret spricht, also mit einem Postfach, einem Kalender, Google Drive, Bexio, WordPress oder einem Browser.

Das ist quasi der technische Teil. Also mit welcher API spricht unser Agent eigentlich.

2. Klar definierte Aktionen

Danach muss feststehen, was der Agent dort überhaupt tun darf, also nur lesen, suchen, Entwürfe anlegen, Dateien hochladen, Felder aktualisieren, Seiten publizieren oder echte Systemaktionen auslösen.

Viele Probleme entstehen nicht, weil die Technik kaputt ist, sondern weil nie sauber festgelegt wurde, welche Aktion überhaupt vorgesehen ist.

3. Ein passendes Auth-Modell

Danach stellt sich die Frage, wie der Agent überhaupt reinkommt.

Je näher eine Schnittstelle an sensible Daten oder Aussenwirkung kommt, desto wichtiger wird diese Frage. Delegierte Berechtigungen sind oft sauberer, weil sie an eine Person gebunden bleiben. Manchmal gibt es auch mal gute Gründe für eng begrenzte App-Berechtigungen. Entscheidend ist, dass der Zugang so schmal wie möglich bleibt.

4. Freigabepunkte und Grenzen

Ebenso wichtig ist die Frage, wann der Agent autonom arbeitet, wann er nur vorbereitet und wann es eine Freigabe braucht.

Ein Entwurf im Postfach ist etwas anderes als ein Versand an Kunden. Ein vorbereiteter Kalendereintrag ist etwas anderes als eine endgültige Zusage. Diese Grenzen gehören nicht erst in ein spätes Governance-Dokument. Sie sind Teil der Schnittstelle selbst.

5. Fehlerbehandlung und Rückfallwege

Was passiert bei fehlender Berechtigung, leerem Feld, geänderter API, gesperrtem Browser oder einem Formular, das plötzlich anders aussieht.

In Demos wird dieser Teil gerne übersprungen. Im Alltag ist er oft wichtiger als die schöne Erfolgsspur. Eine Verbindung ist erst dann brauchbar, wenn sie auch mit Fehlern halbwegs sauber umgehen kann.

Infografik der fünf Bausteine einer guten KI-Schnittstelle: Zielsystem, Aktionen, Auth, Freigaben, Fallbacks

Wenn diese fünf Punkte klar sind, wird aus «wir haben eine Integration» eine belastbare Arbeitsverbindung.

Was bei Schnittstellen nicht in denselben Topf gehört

Gerade bei Agenten-Projekten verschwimmt das am Anfang schnell. Darum ist die Abgrenzung wichtig.

Schnittstellen sind nicht Skills.

Ein Skill beschreibt, wie der Agent eine Aufgabe ausführt. Also zum Beispiel, wie eine Offerte aufgebaut wird, welche Schritte geprüft werden, welche Tonalität passt und woran er merkt, dass die Aufgabe wirklich fertig ist. Genau darum ging es letzte Woche im Beitrag über Skills.

Die Schnittstelle beschreibt etwas anderes, nämlich wie dieser Offerten-Entwurf in Bexio landet, welche Felder befüllt werden, ob ein Entwurf angelegt oder direkt versendet wird und welche Fehlermeldung kommt, wenn ein Pflichtfeld fehlt.

Kurz gesagt:

Skill: Wie arbeitet er
Schnittstelle: Womit spricht er

Schnittstellen sind auch kein Gedächtnis.

Der Zugriff auf Google Drive ist eine Schnittstelle. Welche Ordnerstruktur sich bei uns bewährt hat, welche Unterordner es gibt und wo etwas abgelegt wird, das gehört ins Gedächtnis.

Schnittstellen sind nicht Governance.

Dass ein Agent Mail-Entwürfe anlegen kann, ist Schnittstelle. Dass er nie direkt an Kunden senden darf, ist Governance. Genau das wird in der Serie als letzter Baustein (freut euch auf nächsten Sonntag) noch sehr sehr wichtig.

Schnittstellen sind nicht Identität.

Ob ein Agent locker, präzise oder förmlich schreibt, entscheidet nicht die Verbindung zum Postfach. Das ist Teil der Identität.

Die Trennung wirkt streng, spart in der Praxis aber Zeit. Wenn später etwas nicht stimmt, weisst du schneller, wo die Korrektur hingehört.

So haben wir unser System konkret angebunden

Spannend wird es dort, wo du vom Prinzip in den Alltag gehst.

Wir haben nicht einfach «alles integriert». Wir haben ein paar Verbindungen gebaut, die uns im Alltag sofort Arbeit abnehmen. Andere haben wir bewusst klein gehalten oder noch nicht produktiv gemacht.

Mail: Drafts erstellen

Mail ist bei uns ein guter Startpunkt, weil der Nutzen sofort sichtbar wird.

Der Agent formuliert nicht nur einen guten Text, sondern legt den Entwurf direkt im richtigen Postfach an. Damit liegt die Mail dort, wo sie im Prozess hingehört.

Wichtig ist aber die Grenze. Der Agent darf Entwürfe anlegen. Er darf nicht einfach direkt an Kunden senden (und kann er auch nicht, das ist technisch ausgeschlossen). Genau dieser Unterschied macht die Verbindung brauchbar. Sie nimmt Arbeit ab, ohne die Kontrolle aus der Hand zu nehmen.

Kalender und Drive: Weniger copy/paste

Bei Google Calendar und Drive ist der Wert weniger spektakulär, aber im Alltag enorm spürbar.

Der Agent kann Termine vorbereiten, in den relevanten Kalendern nachschauen und Dateien in die richtigen Ordner legen. Das klingt klein. In der Summe spart es erstaunlich viel Hin und Her.

Der entscheidende Teil ist auch hier nicht «Google ist verbunden», sondern die konkrete Logik dahinter:

Welche Kalender relevant sind
Was als echter Termin gilt und was nur Information ist
In welche Ordner geschrieben werden darf
Welche Datei wohin gehört

Genau dort entscheidet sich nämlich, ob eine Verbindung hilfreich ist oder schon nach zwei Tagen nervt.

Bexio: Der Entwurf steht schon im Zielsystem

Bei Bexio wird besonders klar, warum Schnittstellen mehr sind als ein Komfort-Feature.

Ohne Verbindung kann ein Agent aus Gesprächsnotizen eine gute Offerte schreiben. Das hilft schon. Danach beginnt aber die eigentliche Handarbeit, also Kontakt suchen, Daten übertragen, Positionen prüfen, richtige Vorlage wählen und den Entwurf anlegen.

Mit Schnittstelle landet der Entwurf direkt im Zielsystem. Ich schaue drüber, passe wenn nötig an und gebe frei.

Der Effekt ist nicht nur Zeitgewinn. Der Ablauf wird auch sauberer, weil weniger copy/paste, weniger Übertragungsfehler und weniger offene Schleifen entstehen.

WordPress: Browser statt halbgare API

APIs sind nicht immer der beste Weg.

Bei uns gibt es Fälle, in denen bestimmte Felder oder Abläufe über REST-API nicht sauber abbildbar sind. Gerade bei WordPress mit ACF oder Yoast ist Browser-Automation manchmal schlicht der robustere Ansatz.

Das ist kein Workaround. Es ist in solchen Fällen einfach der bessere Weg. Wenn der Agent die Oberfläche zuverlässig bedienen kann und genau weiss, welche Schritte er dort tun darf, ist das oft besser als eine angebundene API, die im entscheidenden Moment an Spezialfeldern scheitert.

Allerdings ist hier das Risiko deutlich höher. Unser Agent hat einen eigenen Login, mit dem er nur Zugriff auf die Funktionen hat, die er zwingend braucht. Zudem haben wir immer Backups ready für den Fall, dass doch mal etwas schiefgehen sollte.

Notion: Inhalte direkt am richtigen Ort

Bei Notion ist der Nutzen für uns ebenfalls klar.

Der Agent legt Inhalte direkt dort an, wo wir sie brauchen, zum Beispiel bei Workshop-Unterlagen und Übungsaufgaben.

Auch hier ist der Wert nicht einfach, dass Notion technisch verbunden ist. Der Wert ist, dass Inhalte sauber am richtigen Ort landen und wir weniger von Hand bearbeiten müssen.

Diagramm: KI-Agent verbindet Outlook, Kalender und Drive mit Bexio, WordPress und weiteren Zielsystemen

Wenn ich auf unser System schaue, ist die wichtigste Erkenntnis ziemlich einfach. Eine Verbindung ist dann gut, wenn sie im Alltag wirklich Arbeit abnimmt.

Warum viele Teams bei Schnittstellen zu technisch denken

Der häufigste Fehler ist klar. Viele Unternehmen behandeln Schnittstellen zuerst als Technikfrage und erst viel später als Arbeitsfrage.

Dann heisst es: «Wir haben jetzt Zugriff auf Mail, CRM und Kalender.» Das klingt gut, hilft euch im Alltag aber noch kein Stück weiter, solange niemand sauber definiert hat, wofür dieser Zugriff eigentlich da ist.

Damit daraus echte Produktivität wird, müsst ihr noch ein paar andere Fragen beantworten:

Für welche Aufgabe genau ist die Verbindung gedacht
Welche Aktionen darf der Agent dort ausführen
Welche Qualität wird erwartet
Wo liegt der Freigabepunkt
Was passiert, wenn etwas fehlschlägt

Ohne diese Fragen bleibt die Schnittstelle eine technische Möglichkeit, aber noch keine produktive Fähigkeit.

Der zweithäufigste Fehler ist, zu schnell zu gross zu werden.

Sobald die erste Verbindung läuft, will man oft sofort das nächste System dazunehmen, also Mail, Kalender, CRM, ERP, Drive, Tickets, HR und Website.

Nur wächst die Komplexität meistens schneller als das Vertrauen.

Oft ist der bessere Weg kleiner. Eine einzige Verbindung wählen, die heute den grössten Medienbruch verursacht, diese sauber aufbauen und erst danach die nächste dazunehmen.

Wenn du mit Schnittstellen startest, ist darum nicht die beste Frage «Was können wir alles anbinden?»

Die bessere Frage lautet: «Welche eine Verbindung würde uns ab Montag wirklich Arbeit abnehmen?»

So würde ich starten

Wenn ihr mit Schnittstellen anfangen wollt, dann baut die erste Verbindung dort, wo ihr heute konkret Zeit verliert.

Zum Beispiel dort, wo ihr:

Mails im Chat vorbereitet, aber danach trotzdem alles von Hand ins Postfach kopiert
Gesprächsnotizen habt, aber CRM oder ERP nochmals manuell nachführen müsst
Inhalte an mehreren Orten braucht und sie jedes Mal neu zusammensucht

Genau dort setzt ihr im Tool an, das ihr bereits nutzt.

Also zum Beispiel in eurem Mail-System, in eurem CRM, in Langdock, ChatGPT, eurer Branchenlösung oder in einem eigenen internen System.

Wichtig: Schnittstellen einrichten ist Sache des Administrators. Wenn ihr also in einer KI-Plattform wie Langdock unterwegs seid, wird Schnittstellen nur jemand mit Admin-Rechten einrichten können. Und das ist auch gut so. 😉

Die Reihenfolge ist aus meiner Sicht einfach:

Nehmt einen einzigen konkreten Ablauf (Prozess/Skill). Zum Beispiel Follow-up-Mails, Gesprächsprotokolle ins CRM oder Dateien sauber im richtigen Ordner ablegen.
Baut genau für diesen Ablauf die Verbindung im relevanten Tool. Das geht normalerweise über den Bereich Integrationen. Dort könnt ihr in den meisten Tools direkt via API Schnittstellen verbinden.
Legt fest, was der Agent dort tun darf. Lesen, suchen, Entwurf anlegen, Eintrag vorbereiten, Felder befüllen.
Legt auch fest, was er nicht tun darf. Zum Beispiel direkt senden, definitiv freigeben oder heikle Daten ändern.
Testet das mit echten Fällen. Nicht nur mit einer schönen Demo, sondern mit dem normalen Alltag.

Wenn das mit einem Ablauf sauber funktioniert, merkt ihr sehr schnell, ob euch die Verbindung wirklich etwas bringt.

Und erst dann nehmt ihr euch die nächste vor.

Bei Langdock, ChatGPT und Co. wird das System bei euch so oder so immer einmal mehr nachfragen, bevor etwas im Zielsystem gemacht wird. Und das soll auch so sein. 😉

Key Takeaways

Schnittstellen verbinden den Agenten mit der realen Arbeitswelt
Ohne Schnittstellen bleibt selbst ein starkes Modell einfach nur ein Texthelfer
Eine gute Schnittstelle braucht Zielsystem, Aktionen, Auth, Freigabepunkte und Fallbacks
Unser eigentlicher Hebel bei uns liegt nicht im Modell, sondern in der Verbindung zu Mail, Kalender, Drive, Bexio, WordPress, Notion und weiteren Systemen
Nicht alles, was technisch irgendwie geht, ist schon eine gute produktive Schnittstelle
Eine einzige saubere Verbindung ist oft wertvoller als sieben halbfertige Integrationen

Fazit

Nach Identität, Gedächtnis und Skills kommst du hier an den Punkt, an dem ein Agent im Alltag zum ersten Mal wirklich greifbar wird.

Hier merkst du sehr schnell, ob ein System nur gut klingt oder euch an der richtigen Stelle tatsächlich Arbeit abnimmt, also ob der Mail-Entwurf im richtigen Postfach liegt, die Datei im richtigen Ordner landet und die Offerte schon als Entwurf im Zielsystem steht.

Genau dort beginnt für viele Unternehmen der Unterschied zwischen einer spannenden KI-Demo und einer Lösung, die im Alltag wirklich was nützt.

Nächste Woche fehlt dann noch der letzte Baustein, nämlich Governance, also die Frage, was ein Agent eigentlich darf.

Bis nächsten Sonntag 👋🏽

Andreas