Welchen Weg soll ich gehen?

Hoi und herzlich willkomma zu den Büro für KI Insights 👋🏽

Letzte Woche haben wir die Grundlagen gelegt: Einstellungen prüfen, Consumer vs. Business Lizenzen verstehen, die 4 Wege kennenlernen.

Heute wird's konkret: Welcher Weg passt zu deinem Unternehmen?

Das ist die Frage, die mir am häufigsten gestellt wird. Nicht «Was gibt es?», sondern «Was soll ICH nehmen?»

Und ich sehe dabei zwei Extreme:

Die Schnellschiesser: «Wir nehmen einfach ChatGPT, das kennt jeder.» Keine Evaluation, keine Strategie.

Die Überplaner: «Wir evaluieren seit 6 Monaten 12 verschiedene Tools.» Und sind immer noch nicht weiter. 😅

Beides führt selten zum Ziel.

Was es braucht: einen strukturierten, aber pragmatischen Prozess. Genau dafür haben wir das 3D-Framework entwickelt.

In diesem Newsletter erfährst du:

Die 6 Dimensionen der Tool-Evaluation
Das 3D-Framework: Define → Demo → Decide
Wie du in 3 Phasen zur richtigen Entscheidung kommst
Warum «selbst bauen» für die meisten KMU nicht aufgeht

Damit du das Framework direkt anwenden kannst, habe ich einen KI-Tool-Evaluations-Assistenten gebaut. Er führt dich Schritt für Schritt durch alle 3 Phasen und hilft dir, deine Anforderungen zu definieren, Tests zu strukturieren und die finale Entscheidung zu treffen. Den Link findest du am Ende des Newsletters.

Let's dive in 🤓🤿

Die 6 Dimensionen: Dein Kompass für die Tool-Wahl

Radar-Diagramm zur Bewertung von KI-Tools mit sechs Dimensionen

Bevor wir ins Framework einsteigen, stell ich dir die 6 Dimensionen vor. Sie sind der rote Faden durch den ganzen Prozess.

Jedes KI-Tool lässt sich auf diesen 6 Dimensionen bewerten. Aber was jede Dimension konkret bedeutet, ist individuell. Deshalb definierst du zuerst, was für EUCH wichtig ist.

1. Qualität: Was bedeutet Qualität für euch?

Beispiele:

«Muss komplexe Fachtexte auf Deutsch schreiben können»
«Muss Tabellen und Daten zuverlässig analysieren»
«Muss bei Recherchen akkurate Quellen liefern»
«Gut genug reicht, wir machen vor allem einfache Aufgaben»

2. Nutzerfreundlichkeit: Wer sind eure User und was brauchen sie?

Beispiele:

«Muss so einfach sein, dass alle im Team es sofort nutzen können»
«Power-User, die auch Komplexität akzeptieren»
«Mobile Nutzung wichtig»
«Muss auf Deutsch funktionieren»

3. Datenschutz & Compliance: Was sind eure Anforderungen?

Beispiele:

«DPA/AVV ist Pflicht, EU-Hosting wäre nice to have.»
«Nur CH/EU-Hosting, wir verarbeiten Gesundheitsdaten.»
«Kein Training mit unseren Daten, sonst flexibel»
«Brauchen spezifische Zertifizierungen (ISO 27001, etc.)»

4. Ökosystem Fit: Wo arbeitet ihr heute?

Beispiele:

«Wir sind tief in Microsoft 365»
«Google Workspace ist unser Zuhause»
«Gemischte Landschaft, Integration weniger wichtig bzw. Customizing nötig.»
«CRM-Anbindung wäre ein grosses Plus»

5. Kosten: Was ist euer Rahmen?

Beispiele:

«Max. 30 CHF pro User pro Monat»
«Kosten sekundär, Qualität geht vor»
«Brauchen eine Gratislösung zum Starten»
«Total Cost zählt, nicht nur Lizenzpreis»

6. Zukunftssicherheit: Was ist euch wichtig für morgen?

Beispiele:

«Flexibilität bei Modellwechsel, nicht an einen Anbieter gebunden»
«Etablierter, stabiler Anbieter»
«Muss mit uns skalieren können»
«Zugang zu neuen Features und Modellen»

Wichtig: Die 6 Dimensionen sind individuell. Was für ein Startup mit 5 Leuten stimmt, passt nicht für ein reguliertes Unternehmen mit 200 Mitarbeitenden. Definiert zuerst, was EURE Anforderungen sind. Dann bewertet.

Das 3D-Framework: Define → Demo → Decide

Grafische Darstellung des 3D-Frameworks zur KI-Tool-Auswahl mit drei Phasen

Der Clou: Die 6 Dimensionen ziehen sich durch alle Phasen. So bleibt alles konsistent und vergleichbar.

Phase 1: DEFINE

Bevor du Tools anschaust: Klarheit schaffen.

Schritt 1: Use Cases sammeln

Was wollt ihr mit KI konkret erreichen? Sammelt 3 bis 5 konkrete Use Cases.

Beispiele:

Kundenanfragen schneller beantworten
Protokolle automatisch zusammenfassen
Marketingtexte erstellen
Interne Dokumente durchsuchbar machen
Datenanalysen beschleunigen

Schritt 2: Anforderungen pro Dimension definieren

Geht die 6 Dimensionen durch und definiert eure Anforderungen:

Strukturierte Tabelle mit 6 Dimensionen zur KI-Tool-Evaluation

Schritt 3: Muss vs. Soll unterscheiden

Für jede Anforderung: Ist das ein Muss (Dealbreaker) oder ein Soll (nice to have)?

Beispiel:

Datenschutz: «DPA/AVV vorhanden» = Muss
Datenschutz: «EU/CH-Hosting» = Soll
Ökosystem: «M365 Integration» = Soll

Warum ist das wichtig?

Muss-Kriterien sind Filter für Phase 2. Tools, die ein einziges Muss-Kriterium nicht erfüllen, kommen gar nicht erst in den Test.
Soll-Kriterien fliessen in Phase 3 in die Bewertung ein. Je mehr Soll-Kriterien ein Tool erfüllt, desto höher der Score in der jeweiligen Dimension.

Tabelle mit den 6 Dimensionen – Muss- und Soll-Kriterien

Output Phase 1: Euer Anforderungsprofil

Eine Seite, die klar zeigt:

Eure Top Use Cases (werden in Phase 2 zu Testaufgaben)
Eure Anforderungen pro Dimension
Was Muss ist (filtert Tools für Phase 2)
Was Soll ist (fliesst in Bewertung Phase 3 ein)

Das ist euer Kompass für alles, was folgt.

Phase 2: DEMO

Jetzt wird's praktisch. Und das ist der Teil, den viele überspringen. Grosser Fehler.

Denn in der Theorie klingt vieles gut. Aber in der Praxis zeigt sich schnell:

Die Benutzeroberfläche ist zwar schick, aber eure Leute kommen damit nicht klar
Die Modellqualität ist top, aber für EURE Aufgaben passt es nicht
Die Integration existiert, funktioniert aber hakelig

Das findet ihr nur raus, wenn ihr es ausprobiert.

So organisiert ihr den Test

1. Vorauswahl treffen

Jetzt zahlt sich die Arbeit aus Phase 1 aus. Prüft für jedes Tool: Erfüllt es ALLE Muss-Kriterien?

DPA/AVV vorhanden? ✓ oder ✗
Kein Training mit Daten? ✓ oder ✗
Budget eingehalten? ✓ oder ✗

Ein einziges ✗ bei einem Muss-Kriterium = Tool fliegt raus.

So bleiben 2 bis 3 Tools übrig, die in den Test gehen.

Typische Kandidaten für KMU:

ChatGPT Business (30 USD/User, starke Modelle, starke Funktionen, am weitesten verbreitet)
M365 Copilot (30 USD/User, Microsoft-Ökosystem)
Langdock (20 EUR/User, EU-Hosting, mehrere Modelle in einem Tool; unser KI-Betriebssystem im Büro für KI)
Claude Team (25 USD/User, stark bei langen Texten, Coding, Excel etc.)

2. Testgruppe zusammenstellen

5 bis 10 Personen aus verschiedenen Bereichen:

Verschiedene Abteilungen
Unterschiedliche Tech-Affinität
Enthusiasten UND Skeptiker

3. Testphase durchführen

Dauer: 2 bis 4 Wochen

Wichtig: Echte Aufgaben aus dem Arbeitsalltag, nicht künstliche Tests. Nutzt die Use-Cases aus Phase 1 als Grundlage für die Testaufgaben.

4. Feedback pro Dimension sammeln

Strukturiert das Feedback entlang der 6 Dimensionen:

Tabelle mit sechs Dimensionen zur strukturierten KI-Tool-Evaluation mit Feedback

Output Phase 2: Euer Testprotokoll

Echte Erfahrungswerte aus der Praxis:

Was hat funktioniert?
Was nicht?
Feedback pro Dimension und Tool

Phase 3: DECIDE

Jetzt habt ihr alles:

Klare Anforderungen (Phase 1)
Praxiserfahrungen (Phase 2)

Zeit für die Entscheidung.

So geht's

1. Dimensionen gewichten

Nicht jede Dimension ist gleich wichtig. Verteilt 100% auf die 6 Dimensionen:

Qualität: 25%
Nutzerfreundlichkeit: 20%
Datenschutz: 20%
Ökosystem Fit: 15%
Kosten: 10%
Zukunftssicherheit: 10%

2. Tools bewerten

Gebt jedem Tool pro Dimension einen Score von 1 bis 10. Basierend auf:

Euren Anforderungen (Phase 1)
Euren Testerfahrungen (Phase 2)
Fakten (Preise, DPA/AVV, Hosting, etc.)

Wie fliessen Muss- und Soll-Kriterien ein?

Muss-Kriterien: Wurden bereits in Phase 2 geprüft. Alle Tools, die jetzt noch im Rennen sind, erfüllen alle Muss-Kriterien.
Soll-Kriterien: Fliessen jetzt in die Bewertung ein. Je mehr Soll-Kriterien ein Tool erfüllt, desto höher der Score in der jeweiligen Dimension.

Beispiel: Bei Datenschutz habt ihr als Muss «DPA/AVV vorhanden» und als Soll «EU/CH Hosting». Beide Tools haben ein DPA/AVV (sonst wären sie rausgeflogen). Aber nur eines hat EU-Hosting → das bekommt einen höheren Score.

Hinweis: Kosten und Datenschutz werden nicht im User-Test bewertet, sondern zentral anhand von Fakten:

Kosten: Lizenzpreis, Setupkosten, versteckte Kosten (z.B. Add-ons, Schulung etc.)
Datenschutz: DPA/AVV vorhanden? Hosting-Standort? Zertifizierungen?

Diese Dimensionen lassen sich objektiv prüfen und gehören nicht ins subjektive Use-Feedback.

3. Gewichteten Score berechnen

Score × Gewichtung = gewichteter Score. Alle addieren = Gesamtscore.

Ein Beispiel

Ein KMU mit 50 Mitarbeitenden vergleicht ChatGPT Business, M365 Copilot, Langdock und Self Hosted.

Ihre Gewichtung:

Qualität: 25%
Nutzerfreundlichkeit: 20%
Datenschutz: 20%
Ökosystem Fit: 15%
Kosten: 10%
Zukunftssicherheit: 10%

Ihre Bewertung nach dem Test:

Vergleichende Bewertungstabelle von KI-Tools nach verschiedenen Dimensionen mit Gewichtung

Das Ergebnis zeigt: ChatGPT Business und Langdock liegen gleichauf. M365 Copilot fällt etwas ab, punktet aber stark beim Ökosystem Fit. Self Hosted bildet das Schlusslicht.

Was bedeutet das? Die Entscheidung hängt von euren Prioritäten ab:

Qualität und Nutzerfreundlichkeit zählen am meisten? → ChatGPT Business
Datenschutz und Kosten sind entscheidend? → Langdock
Ihr seid tief im Microsoft-Ökosystem? → M365 Copilot kann die richtige Wahl sein
Ihr habt extreme Datenschutzanforderungen? → Self Hosted prüfen

Warum «selbst bauen» für die meisten KMU nicht aufgeht

Noch ein Thema, das ich in Teil 1 angeteasert habe.

Ich höre oft: «Können wir nicht einfach ein Open-Source-Modell selbst hosten? Dann haben wir volle Kontrolle.»

Die kurze Antwort: Ja, technisch geht das. Nein, für 95% der KMU macht es keinen Sinn.

Die versteckten Kosten

Ich habe dir das hier mal sehr rudimentär zusammengerechnet:

Hardware: Ein professioneller GPU-Server mit 4x NVIDIA L40S (192GB VRAM für Mistral Large 3) und was es drumherum noch alles so braucht kostet ca. CHF 60'000. Das sind Datacenter-GPUs, nicht Consumer-Hardware. Zudem: In 2-3 Jahren ist die Hardware veraltet.

Entwicklung: Das Modell allein reicht nicht. Du brauchst Chat-Interface, User-Management, Monitoring, Security, Integrationen. CHF 60'000–75'000 für die initiale Entwicklung (günstiger, wenn du auf bestehenden Open-Source-Interfaces aufbaust; z. B. Open WebUI, LibreChat). Plus CHF 1'500–3'000/Monat für Weiterentwicklung und Bugfixes.

Betrieb: Setup, Wartung, Strom, Kühlung. Ca. CHF 50'000/Jahr.

Über 3 Jahre: Hardware + Entwicklung + Betrieb = Mehr als CHF 300'000 für 50 Nutzer:innen. Das sind über CHF 160 pro Nutzer/Monat.

Zum Vergleich: ChatGPT Business kostet USD 30 pro Nutzer/Monat. Langdock EUR 20. Beides sofort einsatzbereit, mit allen Features, ohne Entwicklungsaufwand.

Know-how: Datacenter-Setup, Kubernetes, Frontend-Entwicklung, Backend-APIs, Security, Monitoring. Das ist kein Nebenjob. Würkli nicht. 😅

Opportunitätskosten: Die Zeit eurer IT fehlt woanders.

Der Qualitätsunterschied

Die besten Open-Source-Modelle (Llama 3, Mistral Large, DeepSeek) sind gut. Aber sie sind nicht GPT 5.2 oder Claude Opus 4.5.

Du merkst den Unterschied auch als Anfänger ziemlich schnell. Und das ist dann echt frustrierend.

Und: Die Frontier-Modelle (und vor allem die Tools drumherum) entwickeln sich rasant weiter. Dein selbst gehostetes Tool bleibt stehen. Du kannst unmöglich mit den Entwicklerkapazitäten eines OpenAI mithalten.

Wann es doch Sinn macht

Self Hosting kann sinnvoll (eher: nötig) sein, wenn:

Ihr extrem sensible Daten habt UND die Regulierung es verlangt
Ihr eine eigene IT-Abteilung mit ML-Erfahrung habt
Ihr sehr spezifische Anpassungen braucht (Fine Tuning)
Ihr Offline-Szenarien habt

Für alle anderen: Die Business-Lizenzen der grossen Anbieter sind besser, halten Schweizer Datenschutzstandards in der Regel ein und sind am Ende sehr viel günstiger.

Key Takeaways

Die 6 Dimensionen sind dein Kompass. Qualität, Nutzerfreundlichkeit, Datenschutz, Ökosystem Fit, Kosten, Zukunftssicherheit.
Das 3D Framework gibt Struktur. Define → Demo → Decide
Zuerst Anforderungen und Use Cases, dann Tools. Nicht umgekehrt.
Testen mit echten Aufgaben. Praxiserfahrung schlägt Herstellerversprechen.
Die Tabelle macht die Entscheidung transparent. Gewichtete Scores zeigen, was wirklich passt.
Self Hosting lohnt sich für die allermeisten KMU nicht. Die Business-Lizenzen sind besser und günstiger.

Der KI-Tool-Evaluations-Assistent

Genau dafür habe ich den KI-Tool-Evaluations-Assistenten gebaut.

Was macht er?

Er führt dich Schritt für Schritt durch alle 3 Phasen:

Phase 1: DEFINE

Hilft dir, deine Use Cases zu sammeln
Führt dich durch die 6 Dimensionen
Unterscheidet Muss- und Soll-Kriterien
Erstellt dein Anforderungsprofil

Phase 2: DEMO

Schlägt passende Tools basierend auf deinen Muss-Kriterien vor
Hilft dir, die Testphase zu strukturieren
Gibt dir Vorlagen für Feedback-Sammlung

Phase 3: DECIDE

Unterstützt dich bei der Gewichtung
Berechnet die gewichteten Scores
Visualisiert die Ergebnisse
Hilft dir, die finale Entscheidung zu treffen

Wie nutzt du ihn?

Öffne den Assistenten: KI-Tool-Evaluations-Assistent
Klicke auf «Jetzt starten»
Folge den Schritten

Wichtig: Du brauchst ChatGPT Plus, Pro, Business oder Enterprise, um Custom GPTs nutzen zu können.

Der Assistent ersetzt keine Praxistests und keine Rechtsberatung. Aber er macht den Prozess strukturierter, schneller und nachvollziehbarer.

Ausblick

Nächste Woche in Teil 3: Wie bringe ich Klarheit ins Team?

Pragmatische Leitplanken für dein Unternehmen
Was Mitarbeitende wirklich wissen müssen
Wie du das Ganze kommunizierst (ohne Panik und ohne Blockaden)

Fazit

Die Tool-Entscheidung ist keine Glaubensfrage. Und sie muss auch nicht kompliziert sein.

Die wichtigste Erkenntnis: Nicht monatelang evaluieren. Sondern strukturiert vorgehen und dann entscheiden.

Das 3D-Framework gibt dir genau das: Einen klaren Prozess, der in ca. 4 bis 6 Wochen zu einer fundierten Entscheidung führt. Nicht aus dem Bauch heraus. Nicht nach Herstellerversprechen. Sondern basierend auf euren echten Anforderungen und Praxiserfahrungen.

Was ich in den letzten Monaten immer wieder gesehen habe: Die Unternehmen, die sich diese Zeit nehmen, sind danach viel schneller und sicherer unterwegs. Die Investition in einen strukturierten Evaluationsprozess zahlt sich mehrfach aus.

Und noch etwas: Self Hosting (Cloud oder On Prem) klingt gerade in puncto Datenschutz verlockend. Aber für die allermeisten KMU ist es ein Kostengrab (ganz zu schweigen von der Qualität).

Die Business-Lizenzen der etablierten Anbieter sind besser, das Datenschutzgesetz kann grundsätzlich eingehalten werden, und am Ende ist es um ein Vielfaches günstiger.

Ich wünsche dir einen guten Start in die neue Woche.

Bis nächsten Sonntag 👋🏽

Andreas

Die 6 Dimensionen: Dein Kompass für die Tool-Wahl

Das 3D-Framework: Define → Demo → Decide

Phase 1: DEFINE

Schritt 1: Use Cases sammeln

Schritt 2: Anforderungen pro Dimension definieren

Schritt 3: Muss vs. Soll unterscheiden

Output Phase 1: Euer Anforderungsprofil

Phase 2: DEMO

So organisiert ihr den Test

Output Phase 2: Euer Testprotokoll

Phase 3: DECIDE

So geht's

Ein Beispiel

Warum «selbst bauen» für die meisten KMU nicht aufgeht

Die versteckten Kosten

Der Qualitätsunterschied

Wann es doch Sinn macht

Key Takeaways

Der KI-Tool-Evaluations-Assistent

Ausblick

Fazit

Kommentare

Weiterlesen

Wo gehen meine Daten hin?

Nach der Tool-Entscheidung: So gelingt der Rollout

KI nutzen heisst heute nicht mehr besser prompten