Welchen Weg soll ich gehen?
Der Reality-Check für KMU (Teil 2 von 3)
Hoi und herzlich willkomma zu den Büro für KI Insights 👋🏽
Letzte Woche haben wir die Grundlagen gelegt: Einstellungen prüfen, Consumer vs. Business Lizenzen verstehen, die 4 Wege kennenlernen.
Heute wird's konkret: Welcher Weg passt zu deinem Unternehmen?
Das ist die Frage, die mir am häufigsten gestellt wird. Nicht «Was gibt es?», sondern «Was soll ICH nehmen?»
Und ich sehe dabei zwei Extreme:
Die Schnellschiesser: «Wir nehmen einfach ChatGPT, das kennt jeder.» Keine Evaluation, keine Strategie.
Die Überplaner: «Wir evaluieren seit 6 Monaten 12 verschiedene Tools.» Und sind immer noch nicht weiter. 😅
Beides führt selten zum Ziel.
Was es braucht: einen strukturierten, aber pragmatischen Prozess. Genau dafür haben wir das 3D-Framework entwickelt.
In diesem Newsletter erfährst du:
- Die 6 Dimensionen der Tool-Evaluation
- Das 3D-Framework: Define → Demo → Decide
- Wie du in 3 Phasen zur richtigen Entscheidung kommst
- Warum «selbst bauen» für die meisten KMU nicht aufgeht
Damit du das Framework direkt anwenden kannst, habe ich einen KI-Tool-Evaluations-Assistenten gebaut. Er führt dich Schritt für Schritt durch alle 3 Phasen und hilft dir, deine Anforderungen zu definieren, Tests zu strukturieren und die finale Entscheidung zu treffen. Den Link findest du am Ende des Newsletters.
Let's dive in 🤓🤿
Die 6 Dimensionen: Dein Kompass für die Tool-Wahl

Bevor wir ins Framework einsteigen, stell ich dir die 6 Dimensionen vor. Sie sind der rote Faden durch den ganzen Prozess.
Jedes KI-Tool lässt sich auf diesen 6 Dimensionen bewerten. Aber was jede Dimension konkret bedeutet, ist individuell. Deshalb definierst du zuerst, was für EUCH wichtig ist.
1. Qualität: Was bedeutet Qualität für euch?
Beispiele:
- «Muss komplexe Fachtexte auf Deutsch schreiben können»
- «Muss Tabellen und Daten zuverlässig analysieren»
- «Muss bei Recherchen akkurate Quellen liefern»
- «Gut genug reicht, wir machen vor allem einfache Aufgaben»
2. Nutzerfreundlichkeit: Wer sind eure User und was brauchen sie?
Beispiele:
- «Muss so einfach sein, dass alle im Team es sofort nutzen können»
- «Power-User, die auch Komplexität akzeptieren»
- «Mobile Nutzung wichtig»
- «Muss auf Deutsch funktionieren»
3. Datenschutz & Compliance: Was sind eure Anforderungen?
Beispiele:
- «DPA/AVV ist Pflicht, EU-Hosting wäre nice to have.»
- «Nur CH/EU-Hosting, wir verarbeiten Gesundheitsdaten.»
- «Kein Training mit unseren Daten, sonst flexibel»
- «Brauchen spezifische Zertifizierungen (ISO 27001, etc.)»
4. Ökosystem Fit: Wo arbeitet ihr heute?
Beispiele:
- «Wir sind tief in Microsoft 365»
- «Google Workspace ist unser Zuhause»
- «Gemischte Landschaft, Integration weniger wichtig bzw. Customizing nötig.»
- «CRM-Anbindung wäre ein grosses Plus»
5. Kosten: Was ist euer Rahmen?
Beispiele:
- «Max. 30 CHF pro User pro Monat»
- «Kosten sekundär, Qualität geht vor»
- «Brauchen eine Gratislösung zum Starten»
- «Total Cost zählt, nicht nur Lizenzpreis»
6. Zukunftssicherheit: Was ist euch wichtig für morgen?
Beispiele:
- «Flexibilität bei Modellwechsel, nicht an einen Anbieter gebunden»
- «Etablierter, stabiler Anbieter»
- «Muss mit uns skalieren können»
- «Zugang zu neuen Features und Modellen»
Wichtig: Die 6 Dimensionen sind individuell. Was für ein Startup mit 5 Leuten stimmt, passt nicht für ein reguliertes Unternehmen mit 200 Mitarbeitenden. Definiert zuerst, was EURE Anforderungen sind. Dann bewertet.
Das 3D-Framework: Define → Demo → Decide

Der Clou: Die 6 Dimensionen ziehen sich durch alle Phasen. So bleibt alles konsistent und vergleichbar.
Phase 1: DEFINE
Bevor du Tools anschaust: Klarheit schaffen.
Schritt 1: Use Cases sammeln
Was wollt ihr mit KI konkret erreichen? Sammelt 3 bis 5 konkrete Use Cases.
Beispiele:
- Kundenanfragen schneller beantworten
- Protokolle automatisch zusammenfassen
- Marketingtexte erstellen
- Interne Dokumente durchsuchbar machen
- Datenanalysen beschleunigen
Schritt 2: Anforderungen pro Dimension definieren
Geht die 6 Dimensionen durch und definiert eure Anforderungen:

Schritt 3: Muss vs. Soll unterscheiden
Für jede Anforderung: Ist das ein Muss (Dealbreaker) oder ein Soll (nice to have)?
Beispiel:
- Datenschutz: «DPA/AVV vorhanden» = Muss
- Datenschutz: «EU/CH-Hosting» = Soll
- Ökosystem: «M365 Integration» = Soll
Warum ist das wichtig?
- Muss-Kriterien sind Filter für Phase 2. Tools, die ein einziges Muss-Kriterium nicht erfüllen, kommen gar nicht erst in den Test.
- Soll-Kriterien fliessen in Phase 3 in die Bewertung ein. Je mehr Soll-Kriterien ein Tool erfüllt, desto höher der Score in der jeweiligen Dimension.

Output Phase 1: Euer Anforderungsprofil
Eine Seite, die klar zeigt:
- Eure Top Use Cases (werden in Phase 2 zu Testaufgaben)
- Eure Anforderungen pro Dimension
- Was Muss ist (filtert Tools für Phase 2)
- Was Soll ist (fliesst in Bewertung Phase 3 ein)
Das ist euer Kompass für alles, was folgt.
Phase 2: DEMO
Jetzt wird's praktisch. Und das ist der Teil, den viele überspringen. Grosser Fehler.
Denn in der Theorie klingt vieles gut. Aber in der Praxis zeigt sich schnell:
- Die Benutzeroberfläche ist zwar schick, aber eure Leute kommen damit nicht klar
- Die Modellqualität ist top, aber für EURE Aufgaben passt es nicht
- Die Integration existiert, funktioniert aber hakelig
Das findet ihr nur raus, wenn ihr es ausprobiert.
So organisiert ihr den Test
1. Vorauswahl treffen
Jetzt zahlt sich die Arbeit aus Phase 1 aus. Prüft für jedes Tool: Erfüllt es ALLE Muss-Kriterien?
- DPA/AVV vorhanden? ✓ oder ✗
- Kein Training mit Daten? ✓ oder ✗
- Budget eingehalten? ✓ oder ✗
Ein einziges ✗ bei einem Muss-Kriterium = Tool fliegt raus.
So bleiben 2 bis 3 Tools übrig, die in den Test gehen.
Typische Kandidaten für KMU:
- ChatGPT Business (30 USD/User, starke Modelle, starke Funktionen, am weitesten verbreitet)
- M365 Copilot (30 USD/User, Microsoft-Ökosystem)
- Langdock (20 EUR/User, EU-Hosting, mehrere Modelle in einem Tool; unser KI-Betriebssystem im Büro für KI)
- Claude Team (25 USD/User, stark bei langen Texten, Coding, Excel etc.)
2. Testgruppe zusammenstellen
5 bis 10 Personen aus verschiedenen Bereichen:
- Verschiedene Abteilungen
- Unterschiedliche Tech-Affinität
- Enthusiasten UND Skeptiker
3. Testphase durchführen
Dauer: 2 bis 4 Wochen
Wichtig: Echte Aufgaben aus dem Arbeitsalltag, nicht künstliche Tests. Nutzt die Use-Cases aus Phase 1 als Grundlage für die Testaufgaben.
4. Feedback pro Dimension sammeln
Strukturiert das Feedback entlang der 6 Dimensionen:

Output Phase 2: Euer Testprotokoll
Echte Erfahrungswerte aus der Praxis:
- Was hat funktioniert?
- Was nicht?
- Feedback pro Dimension und Tool
Phase 3: DECIDE
Jetzt habt ihr alles:
- Klare Anforderungen (Phase 1)
- Praxiserfahrungen (Phase 2)
Zeit für die Entscheidung.
So geht's
1. Dimensionen gewichten
Nicht jede Dimension ist gleich wichtig. Verteilt 100% auf die 6 Dimensionen:
- Qualität: 25%
- Nutzerfreundlichkeit: 20%
- Datenschutz: 20%
- Ökosystem Fit: 15%
- Kosten: 10%
- Zukunftssicherheit: 10%
2. Tools bewerten
Gebt jedem Tool pro Dimension einen Score von 1 bis 10. Basierend auf:
- Euren Anforderungen (Phase 1)
- Euren Testerfahrungen (Phase 2)
- Fakten (Preise, DPA/AVV, Hosting, etc.)
Wie fliessen Muss- und Soll-Kriterien ein?
- Muss-Kriterien: Wurden bereits in Phase 2 geprüft. Alle Tools, die jetzt noch im Rennen sind, erfüllen alle Muss-Kriterien.
- Soll-Kriterien: Fliessen jetzt in die Bewertung ein. Je mehr Soll-Kriterien ein Tool erfüllt, desto höher der Score in der jeweiligen Dimension.
Beispiel: Bei Datenschutz habt ihr als Muss «DPA/AVV vorhanden» und als Soll «EU/CH Hosting». Beide Tools haben ein DPA/AVV (sonst wären sie rausgeflogen). Aber nur eines hat EU-Hosting → das bekommt einen höheren Score.
Hinweis: Kosten und Datenschutz werden nicht im User-Test bewertet, sondern zentral anhand von Fakten:
- Kosten: Lizenzpreis, Setupkosten, versteckte Kosten (z.B. Add-ons, Schulung etc.)
- Datenschutz: DPA/AVV vorhanden? Hosting-Standort? Zertifizierungen?
Diese Dimensionen lassen sich objektiv prüfen und gehören nicht ins subjektive Use-Feedback.
3. Gewichteten Score berechnen
Score × Gewichtung = gewichteter Score. Alle addieren = Gesamtscore.
Ein Beispiel
Ein KMU mit 50 Mitarbeitenden vergleicht ChatGPT Business, M365 Copilot, Langdock und Self Hosted.
Ihre Gewichtung:
- Qualität: 25%
- Nutzerfreundlichkeit: 20%
- Datenschutz: 20%
- Ökosystem Fit: 15%
- Kosten: 10%
- Zukunftssicherheit: 10%
Ihre Bewertung nach dem Test:

Das Ergebnis zeigt: ChatGPT Business und Langdock liegen gleichauf. M365 Copilot fällt etwas ab, punktet aber stark beim Ökosystem Fit. Self Hosted bildet das Schlusslicht.
Was bedeutet das? Die Entscheidung hängt von euren Prioritäten ab:
- Qualität und Nutzerfreundlichkeit zählen am meisten? → ChatGPT Business
- Datenschutz und Kosten sind entscheidend? → Langdock
- Ihr seid tief im Microsoft-Ökosystem? → M365 Copilot kann die richtige Wahl sein
- Ihr habt extreme Datenschutzanforderungen? → Self Hosted prüfen
Warum «selbst bauen» für die meisten KMU nicht aufgeht
Noch ein Thema, das ich in Teil 1 angeteasert habe.
Ich höre oft: «Können wir nicht einfach ein Open-Source-Modell selbst hosten? Dann haben wir volle Kontrolle.»
Die kurze Antwort: Ja, technisch geht das. Nein, für 95% der KMU macht es keinen Sinn.
Die versteckten Kosten
Ich habe dir das hier mal sehr rudimentär zusammengerechnet:
Hardware: Ein professioneller GPU-Server mit 4x NVIDIA L40S (192GB VRAM für Mistral Large 3) und was es drumherum noch alles so braucht kostet ca. CHF 60'000. Das sind Datacenter-GPUs, nicht Consumer-Hardware. Zudem: In 2-3 Jahren ist die Hardware veraltet.
Entwicklung: Das Modell allein reicht nicht. Du brauchst Chat-Interface, User-Management, Monitoring, Security, Integrationen. CHF 60'000–75'000 für die initiale Entwicklung (günstiger, wenn du auf bestehenden Open-Source-Interfaces aufbaust; z. B. Open WebUI, LibreChat). Plus CHF 1'500–3'000/Monat für Weiterentwicklung und Bugfixes.
Betrieb: Setup, Wartung, Strom, Kühlung. Ca. CHF 50'000/Jahr.
Über 3 Jahre: Hardware + Entwicklung + Betrieb = Mehr als CHF 300'000 für 50 Nutzer:innen. Das sind über CHF 160 pro Nutzer/Monat.
Zum Vergleich: ChatGPT Business kostet USD 30 pro Nutzer/Monat. Langdock EUR 20. Beides sofort einsatzbereit, mit allen Features, ohne Entwicklungsaufwand.
Know-how: Datacenter-Setup, Kubernetes, Frontend-Entwicklung, Backend-APIs, Security, Monitoring. Das ist kein Nebenjob. Würkli nicht. 😅
Opportunitätskosten: Die Zeit eurer IT fehlt woanders.
Der Qualitätsunterschied
Die besten Open-Source-Modelle (Llama 3, Mistral Large, DeepSeek) sind gut. Aber sie sind nicht GPT 5.2 oder Claude Opus 4.5.
Du merkst den Unterschied auch als Anfänger ziemlich schnell. Und das ist dann echt frustrierend.
Und: Die Frontier-Modelle (und vor allem die Tools drumherum) entwickeln sich rasant weiter. Dein selbst gehostetes Tool bleibt stehen. Du kannst unmöglich mit den Entwicklerkapazitäten eines OpenAI mithalten.
Wann es doch Sinn macht
Self Hosting kann sinnvoll (eher: nötig) sein, wenn:
- Ihr extrem sensible Daten habt UND die Regulierung es verlangt
- Ihr eine eigene IT-Abteilung mit ML-Erfahrung habt
- Ihr sehr spezifische Anpassungen braucht (Fine Tuning)
- Ihr Offline-Szenarien habt
Für alle anderen: Die Business-Lizenzen der grossen Anbieter sind besser, halten Schweizer Datenschutzstandards in der Regel ein und sind am Ende sehr viel günstiger.
Key Takeaways
- Die 6 Dimensionen sind dein Kompass. Qualität, Nutzerfreundlichkeit, Datenschutz, Ökosystem Fit, Kosten, Zukunftssicherheit.
- Das 3D Framework gibt Struktur. Define → Demo → Decide
- Zuerst Anforderungen und Use Cases, dann Tools. Nicht umgekehrt.
- Testen mit echten Aufgaben. Praxiserfahrung schlägt Herstellerversprechen.
- Die Tabelle macht die Entscheidung transparent. Gewichtete Scores zeigen, was wirklich passt.
- Self Hosting lohnt sich für die allermeisten KMU nicht. Die Business-Lizenzen sind besser und günstiger.
Der KI-Tool-Evaluations-Assistent
Genau dafür habe ich den KI-Tool-Evaluations-Assistenten gebaut.
Was macht er?
Er führt dich Schritt für Schritt durch alle 3 Phasen:
Phase 1: DEFINE
- Hilft dir, deine Use Cases zu sammeln
- Führt dich durch die 6 Dimensionen
- Unterscheidet Muss- und Soll-Kriterien
- Erstellt dein Anforderungsprofil
Phase 2: DEMO
- Schlägt passende Tools basierend auf deinen Muss-Kriterien vor
- Hilft dir, die Testphase zu strukturieren
- Gibt dir Vorlagen für Feedback-Sammlung
Phase 3: DECIDE
- Unterstützt dich bei der Gewichtung
- Berechnet die gewichteten Scores
- Visualisiert die Ergebnisse
- Hilft dir, die finale Entscheidung zu treffen
Wie nutzt du ihn?
- Öffne den Assistenten: KI-Tool-Evaluations-Assistent
- Klicke auf «Jetzt starten»
- Folge den Schritten
Wichtig: Du brauchst ChatGPT Plus, Pro, Business oder Enterprise, um Custom GPTs nutzen zu können.
Der Assistent ersetzt keine Praxistests und keine Rechtsberatung. Aber er macht den Prozess strukturierter, schneller und nachvollziehbarer.
Ausblick
Nächste Woche in Teil 3: Wie bringe ich Klarheit ins Team?
- Pragmatische Leitplanken für dein Unternehmen
- Was Mitarbeitende wirklich wissen müssen
- Wie du das Ganze kommunizierst (ohne Panik und ohne Blockaden)
Fazit
Die Tool-Entscheidung ist keine Glaubensfrage. Und sie muss auch nicht kompliziert sein.
Die wichtigste Erkenntnis: Nicht monatelang evaluieren. Sondern strukturiert vorgehen und dann entscheiden.
Das 3D-Framework gibt dir genau das: Einen klaren Prozess, der in ca. 4 bis 6 Wochen zu einer fundierten Entscheidung führt. Nicht aus dem Bauch heraus. Nicht nach Herstellerversprechen. Sondern basierend auf euren echten Anforderungen und Praxiserfahrungen.
Was ich in den letzten Monaten immer wieder gesehen habe: Die Unternehmen, die sich diese Zeit nehmen, sind danach viel schneller und sicherer unterwegs. Die Investition in einen strukturierten Evaluationsprozess zahlt sich mehrfach aus.
Und noch etwas: Self Hosting (Cloud oder On Prem) klingt gerade in puncto Datenschutz verlockend. Aber für die allermeisten KMU ist es ein Kostengrab (ganz zu schweigen von der Qualität).
Die Business-Lizenzen der etablierten Anbieter sind besser, das Datenschutzgesetz kann grundsätzlich eingehalten werden, und am Ende ist es um ein Vielfaches günstiger.
Ich wünsche dir einen guten Start in die neue Woche.
Bis nächsten Sonntag 👋🏽
Andreas

Kommentare
Melde dich an, um einen Kommentar zu schreiben.


