Zum Inhalt springen
Logosoftware-architecture.ai

KI-Technologie-Radar

Mein kuratierter Überblick über KI-Technologien, die für kleine und mittlere Unternehmen relevant sind. Die Einordnung basiert auf Praxiserfahrung, nicht auf Hype. Ob eine Technologie für dein Unternehmen passt, hängt immer vom konkreten Anwendungsfall, Budget und Team ab.

Stand: Q2-2026 · Letzte Aktualisierung: 2026-04-04
20 Technologien
20 Technologien angezeigt
EtabliertPraxistauglichVielversprechendBeobachtenModelle & PlattformenWerkzeuge & AgentenDaten & InfrastrukturMethoden & Praxis

Reifegrade (Ringe)

EtabliertProduktionsreif, erprobt, breites Ökosystem
PraxistauglichFunktioniert, erfordert Know-how oder Anpassung
VielversprechendStarkes Potenzial, aber noch Einschränkungen
BeobachtenFrühphase, für KMU noch zu unreif oder zu teuer

Kategorien (Quadranten)

Modelle & Plattformen
Werkzeuge & Agenten
Daten & Infrastruktur
Methoden & Praxis

Bewegung

AufsteigendAbsteigendStabilNeu

Du willst wissen, welche Technologien zu deinem Unternehmen passen?

Lass uns sprechen.

Alle Technologien im Überblick

Stand: Q2-2026. 20 kuratierte Technologien, bewertet nach KMU-Relevanz und Reifegrad.

Etabliert

LLM Cloud APIs

Sprachmodelle als API-Service (OpenAI, Anthropic, Google). Grundbaustein für fast jede KI-Anwendung.

Kategorie: Modelle & PlattformenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

LLM-APIs sind 2026 Commodity. Die Kosten sind dramatisch gefallen (Gemini 2.5 Flash: 0,30 USD/1M Token) [1]. Laut Bitkom hat sich der KI-Einsatz in deutschen Unternehmen 2026 mehr als verdoppelt [2]. Jedes KMU kann sofort damit starten, ohne eigene Infrastruktur aufzubauen.

Gemini 2.5 Flash

Googles Preis-Leistungs-Flaggschiff: Reasoning-Modell mit 1M-Token-Kontext ab 0,30 USD/1M Token.

Kategorie: Modelle & PlattformenKMU-Relevanz: 4/5Kosten: Gering (<50 €/Monat)Techn. Hürde: medium

Gemini 2.5 Flash kostet 0,30 USD pro 1M Input-Token und 2,50 USD pro 1M Output-Token [1]. Das einstellbare Denkbudget erlaubt präzise Kostenkontrolle [2]. Für Kundensupport-Automatisierung, Dokumentenanalyse oder E-Mail-Drafting sofort produktiv einsetzbar.

KI-Bildgenerierung

Bild-KI für Marketing, Produktfotos und Content. Midjourney, DALL-E und Flux führen 2026.

Kategorie: Modelle & PlattformenKMU-Relevanz: 4/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

KI-Bildgenerierung spart KMU 75-85% der Kosten pro Bild gegenüber klassischer Produktion. Teams berichten von 3x Content-Output [1]. Midjourney führt bei Qualität (ab 10 USD/Monat), DALL-E ist im ChatGPT Plus-Abo enthalten [2].

RAG (Retrieval Augmented Generation)

Firmenwissen an Sprachmodelle anbinden, ohne Fine-Tuning. Der Standard für wissensbasierte KI.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: medium

RAG hat sich als Standardmethode etabliert, um Unternehmenswissen KI-zugänglich zu machen [1]. pgvector in PostgreSQL reicht für 80% der KMU-Anwendungsfälle [2]. Separate Vektordatenbanken sind für KMU meist überflüssig.

EU AI Act Compliance

Ab August 2026 Hochrisiko-Pflichten. KI-Kompetenzpflicht (Art. 4) gilt für JEDES Unternehmen seit Feb. 2025.

Kategorie: Methoden & PraxisKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: medium

Am 2. August 2026 treten die Hochrisiko-Pflichten in Kraft [1]. Die KI-Kompetenzpflicht (Art. 4) gilt bereits seit Februar 2025: Jedes Unternehmen, das KI nutzt, muss Mitarbeitende schulen und dies dokumentieren [2]. KMU unter 750 Mitarbeitenden haben vereinfachte Pflichten, sind aber nicht ausgenommen [1].

KI-Förderprogramme für KMU

BAFA und KMU-innovativ: Bis zu 50% Zuschuss für KI- und Digitalisierungsprojekte im Mittelstand.

Kategorie: Methoden & PraxisKMU-Relevanz: 5/5Kosten: KostenlosTechn. Hürde: low

Das BMWK fördert 2026 KI-Projekte im Mittelstand mit bis zu 50% Zuschuss über KMU-innovativ [1]. Die BAFA bezuschusst Unternehmensberatung (inkl. Digitalisierung) mit bis zu 80% in strukturschwachen Regionen [2]. Das Forschungszentrum Jülich bietet zusätzlich öffentlich geförderte KI-Beratung für KMU und Start-ups [3]. Hinweis: Das Programm go-digital ist Ende 2024 ausgelaufen.

Praxistauglich

Open-Source LLMs (Llama, Mistral, Qwen)

Frei verfügbare Sprachmodelle zum Self-Hosting. Llama 4, Mistral Large 2 und Qwen 3 führen das Feld an.

Kategorie: Modelle & PlattformenKMU-Relevanz: 3/5Kosten: HochTechn. Hürde: high

Open-Source-Modelle haben 2026 das Niveau proprietärer Modelle erreicht [1]. Llama 4 bietet 10M-Token-Kontext, Mistral ist stark für europäische DSGVO-Szenarien [2]. Aber: Self-Hosting erfordert GPU-Server (ab ca. 5.000 EUR für kleinere Modelle, 50.000+ EUR für die großen; oder 500-5.000 EUR/Monat Cloud-GPU-Miete). Für die meisten KMU ist die API-Nutzung derselben Modelle über Anbieter wie Together AI oder Mistral deutlich pragmatischer und günstiger als eigene Infrastruktur.

KI-Videoproduktion

KI-generierte Videos für Marketing, Schulung und E-Commerce. Avatar-Tools und generative Video-Modelle.

Kategorie: Modelle & PlattformenKMU-Relevanz: 4/5Kosten: MittelTechn. Hürde: low

Der KI-Video-Markt wächst mit 34% CAGR [1]. Avatar-Tools (HeyGen, Synthesia) reduzieren Produktionszeit von 30-60 auf unter 5 Minuten [2]. Generative Video-Modelle (Runway, Veo) nähern sich Broadcast-Qualität, nachdem Sora wegen zu hoher Kosten eingestellt wurde [1].

KI-Workflow-Automatisierung

No-Code/Low-Code Plattformen mit nativer KI-Integration. n8n, Make und Zapier als führende Tools.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 5/5Kosten: KostenlosTechn. Hürde: medium

n8n hat sich mit nativer LangChain-Integration und Self-Hosting als DSGVO-konforme Alternative zu Zapier und Make etabliert [1][2]. Typische KMU-Anwendungsfälle: Lead-Qualifizierung, Rechnungsverarbeitung, RAG-Agenten über die eigene Wissensdatenbank.

Agentic Coding IDEs

KI-gestützte Entwicklungsumgebungen mit autonomen Agenten. Cursor, Windsurf, Copilot und Claude Code.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 3/5Kosten: Gering (<50 €/Monat)Techn. Hürde: high

2026 ist die Ära der agentischen IDEs: Cursor (Cloud Agents, ab 20 USD/Monat), Copilot (Coding Agent für GitHub Issues, ab 10 USD/Monat), Windsurf (Cascade, ab 15 USD/Monat) und Claude Code (Terminal-Agent mit 1M-Kontext) [1][2]. Für Tech-KMU und Agenturen ein massiver Produktivitätshebel.

KI-gestützte Buchhaltung

Cloud-Buchhaltung mit KI-Belegerkennung und automatischer Buchung. sevdesk, Lexware Office, BuchhaltungsButler.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

Deutsche Cloud-Buchhaltungstools setzen 2026 verstärkt auf KI: automatische Belegerkennung, Buchungsvorschläge, DATEV-Export. sevdesk ist Testsieger im Vergleich von 12 Tools [1]. Lexware Office ab 7,90 EUR/Monat [1]. BuchhaltungsButler punktet bei EÜR und Bilanz/GuV [1].

KI-Agenten

Autonome KI-Systeme, die mehrstufige Aufgaben selbstständig planen und ausführen.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 4/5Kosten: MittelTechn. Hürde: high

LLMs sind 2026 faktisch zu Agenten-Betriebssystemen geworden [1]. Für klar umrissene Aufgaben funktionieren sie zuverlässig. Framework-Auswahl (LangChain, CrewAI, eigene Agenten) hängt vom Anwendungsfall ab [2]. Für KMU am pragmatischsten über n8n oder ähnliche No-Code-Tools.

Lokale Inferenz-Server

LLM-Inferenz auf eigener Hardware ohne Cloud. Ollama, LM Studio und vLLM als führende Tools.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 4/5Kosten: KostenlosTechn. Hürde: medium

Ollama (250k+ GitHub Stars) ist der De-facto-Standard für lokale LLM-Inferenz [1]. Das MLX-Backend beschleunigt Apple Silicon um bis zu 93% [2]. LM Studio ergänzt mit GUI für weniger technische Nutzer [1]. Für KMU mit sensiblen Daten die einzige Möglichkeit, LLMs DSGVO-konform zu nutzen.

Vektorsuche in PostgreSQL

RAG direkt in PostgreSQL via pgvector. Keine separate Vektordatenbank nötig für die meisten KMU-Fälle.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 4/5Kosten: KostenlosTechn. Hürde: medium

pgvector + pgvectorscale erreicht 471 QPS bei 99% Recall auf 50 Mio. Vektoren [1]. Wer PostgreSQL nutzt (Supabase, Neon), braucht keine separate Vektordatenbank. Supabase bietet Row Level Security für RAG-Dokumente, sodass Zugriffsrechte direkt in Vektorabfragen greifen [2].

Context Engineering

Die Weiterentwicklung von Prompt Engineering: Gestaltung des gesamten Kontextfensters als Informationsarchitektur.

Kategorie: Methoden & PraxisKMU-Relevanz: 4/5Kosten: KostenlosTechn. Hürde: medium

Anthropic hat den Ansatz populär gemacht: Nicht einzelne Prompts optimieren, sondern das gesamte Kontextfenster als Informationsarchitektur gestalten [1]. System-Instruktionen, Tool-Schemas, Dokumente, Beispiele als Interface-Vertrag. Alle großen Anbieter konvergieren auf diese Methodik [2]. Für KMU die wichtigste Grundkompetenz im Umgang mit KI.

RAG vs. Fine-Tuning (Architekturentscheidung)

Wann RAG, wann Fine-Tuning, wann beides? Die wichtigste Architekturentscheidung für KI-Projekte.

Kategorie: Methoden & PraxisKMU-Relevanz: 3/5Kosten: KostenlosTechn. Hürde: high

RAG für dynamisches Wissen (4-8 Wochen Setup), Fine-Tuning für konsistenten Stil und Spezialwissen (8-16 Wochen) [1]. Die besten Systeme kombinieren beides: Fine-Tuned Models mit RAG-Retrieval [2]. Für KMU ist RAG fast immer der richtige Einstieg.

Vielversprechend

GraphRAG / Knowledge Graphs

Wissensgraphen als RAG-Erweiterung: Beziehungen zwischen Daten verstehen, nicht nur Texte durchsuchen.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 2/5Kosten: MittelTechn. Hürde: high

GraphRAG verbessert klassisches RAG durch Beziehungswissen und reduziert Halluzinationen [1]. Der Graph-Datenbankmarkt wächst auf 12,8 Mrd. USD [2]. Für die meisten KMU noch zu komplex, aber relevant für Unternehmen mit vernetzten Datenstrukturen (z.B. Supply Chain, CRM).

LLM-Observability & Evaluation

Monitoring, Testing und Qualitätssicherung für KI-Anwendungen in Produktion. Langfuse, Braintrust, Arize.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 2/5Kosten: KostenlosTechn. Hürde: high

2026 dominieren fünf Frameworks die LLM-Evaluation: Langfuse (Open-Source), Braintrust (80M Series B), Arize, LangSmith und DeepEval [1]. Der Standard ist 90% automatisierte LLM-as-Judge-Evaluation plus 10% menschliche Kalibrierung [2]. Für KMU erst relevant, wenn eigene KI-Anwendungen in Produktion laufen.

Small Language Models (SLMs)

Kompakte KI-Modelle (1-14B Parameter) für Edge-Geräte und ressourcenschonenden Einsatz. Phi-4, Gemma 3.

Kategorie: Modelle & PlattformenKMU-Relevanz: 3/5Kosten: Gering (<50 €/Monat)Techn. Hürde: high

Small Language Models wie Phi-4 (14B, 84.8% MMLU) und Gemma 3 übertreffen ältere Modelle mit der Hälfte der Parameter [1]. Die Modellgewichte sind frei verfügbar, aber für die größeren Varianten (7-14B) wird eine GPU mit mindestens 8-10 GB VRAM benötigt [2]. Die kleinsten Modelle (1-4B) laufen auch auf Laptops ohne dedizierte GPU. Für KMU realistisch, wenn passende Hardware ohnehin vorhanden ist, sonst sind Cloud-APIs günstiger.

Beobachten

Autonome KI-Agenten-Teams

Mehrere KI-Agenten, die als Team zusammenarbeiten: planen, delegieren, prüfen. Noch Frühphase.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 1/5Kosten: HochTechn. Hürde: high

Multi-Agenten-Systeme sind mächtig, erfordern aber Entwickler-Know-how und erhebliches Debugging [1]. Laut Camundas State of Agentic Orchestration Report 2026 sehen 73% der Unternehmen eine Kluft zwischen KI-Agenten-Vision und Realität, nur 11% der Anwendungsfälle haben Produktion erreicht [2]. Für KMU unter 10 Mitarbeitenden nicht empfohlen.