Unternehmens-KI, die das europäische Recht nicht gegen Sie verwendet.
Ein laufender Corporate-LLM-Gateway zu GPT, Claude, Gemini und EU-eigenen Modellen. Jede Anfrage passiert einen EU-Residenz-Chokepoint und landet im Audit-Log. Jede Behauptung auf dieser Seite ist live nachprüfbar.
In einem Satz
Was ist mini-corporatellm — und warum?
Bevor das Dossier ins Detail geht: das Wichtigste in vier Fragen, ohne Fachjargon.
- Was ist das?
- Ein firmeneigener, kontrollierter Zugang zu KI-Modellen wie GPT und Claude — mit Protokoll, EU-Datenhaltung und Rechte-Verwaltung.
- Welches Problem löst es?
- Mitarbeiter nutzen KI längst heimlich mit Kundendaten. Ein Verbot verlagert das Risiko nur; dieses System holt es in einen kontrollierten Kanal zurück.
- Wie soll ich es mir vorstellen?
- Wie eine Schleuse am Werkstor: Jede Anfrage wird geprüft, registriert und bleibt in der EU — nichts verlässt unbemerkt das Haus.
- Für wen?
- Mittelständische Unternehmen, die KI erlauben wollen, ohne DSGVO, Betriebsrat und Haftung zu riskieren.
Das Problem
Der Mittelstand will KI — und darf sie nicht so nutzen, wie sie da ist.
Der Engpass ist nicht die Technik. Er ist organisatorisch: KI rechtssicher in den Betrieb zu bekommen, während Datenschutz, Betriebsrat und fehlende Compliance-Kapazität jeden Schritt bremsen.
Die Nachfrage beschleunigt sich (Adoption 17 % → 41 % in einem Jahr), aber die größte Hürde ist nicht „Können wir KI?“, sondern „Dürfen wir KI mit unseren Daten?“. Datenschutz ist die meistgenannte Barriere, dicht gefolgt von Fachkräftemangel und rechtlicher Unsicherheit.1
| Schatten-KI (privater Account) | Governter Zugang (mini-corporatellm) | |
|---|---|---|
| Vertrag | keiner | Auftragsverarbeitung mit dem Anbieter |
| Protokoll | keines | Audit-Log je Anfrage |
| Datenort | unbekannt | EU-Region, technisch erzwungen |
| Löschung | unmöglich | nachweisbar (Art. 17) |
| Kontrolle | keine | RBAC + Rate-Limit + Rollen |
Das ist „Schatten-KI“ — das Leck, das ein Corporate LLM schließen soll: nicht ein neues Werkzeug zusätzlich, sondern die sanktionierte Alternative, die den Anreiz zum heimlichen Privat-Account beseitigt und den Datenfluss in einen kontrollierten, protokollierten Kanal zurückholt.
Der eigentliche Blocker ist Kapazität. Ohne Inhouse-Juristen bleibt die Rechtsgrundlagen-Prüfung liegen, ohne KI-Fachkräfte der governte Betrieb. Selbst ein williges Unternehmen kann DSGVO, BetrVG, NIS2 und den AI Act nicht gleichzeitig inhouse stemmen.1
Die Rechtslage
Was ein deutsches Unternehmen 2026 wirklich beachten muss.
Drei Ebenen stapeln sich: der EU AI Act, die DSGVO mit dem Drittlandtransfer-Problem, und die deutsche Ebene (NIS2, DORA, BSI, Betriebsrat). Jede Aussage hier ist mit Quelle hinterlegt.
▸ EU AI Act — Rollen und Pflichten
Ein normaler unternehmensinterner KI-Assistent ist kein Hochrisiko-System. Er fällt standardmäßig in die Transparenz-Stufe (limited risk): die zentrale produktbezogene Pflicht ist die Offenlegung nach Art. 50, dass Nutzer mit KI interagieren bzw. dass Inhalte KI-generiert sind. Hinzu kommt — unabhängig von der Risiko-Stufe — die KI-Kompetenzpflicht nach Art. 4, die seit dem 02.02.2025 jeden Betreiber trifft (Personal muss im kompetenten KI-Einsatz geschult sein; Durchsetzung ab 08/2026). Sie ist organisatorisch: der Gateway flankiert sie über Audit und Offenlegung, erfüllt sie aber nicht.3,4
Hochrisiko ist use-case-getrieben, nicht technologie-getrieben (Anhang III): erst wenn der Assistent z. B. Bewerber vorselektiert oder Kreditwürdigkeit bewertet, greifen die vollen Betreiberpflichten aus Art. 26 — menschliche Aufsicht, Protokollaufbewahrung ≥ 6 Monate, Information der Betroffenen.5,6
Sanktionen: bis 35 Mio. € / 7 % (verbotene Praktiken), bis 15 Mio. € / 3 % (sonstige Verstöße), bis 7,5 Mio. € / 1 % (falsche Angaben gegenüber Behörden — hierunter fällt auch ein Verstoß gegen die KI-Kompetenzpflicht) — für KMU gilt jeweils der niedrigere der beiden Beträge. In Deutschland koordiniert die Bundesnetzagentur als zentrale Stelle die Marktüberwachung (Hybrid-Modell: sektorspezifische Behörden wie die BaFin bleiben für ihren Bereich zuständig); das Durchführungsgesetz zur KI-VO ist kabinettsbeschlossen (11.02.2026), aber noch nicht verabschiedet.9,10
▸ DSGVO + Drittlandtransfer — ein Stapel, kein Schalter
Personenbezogene Daten an ein LLM zu senden ist erlaubt — aber nur, wenn der rechtliche Stapel gleichzeitig hält: eine Rechtsgrundlage (Art. 6, bei Beschäftigten- und Kundendaten mit dokumentierter Interessenabwägung), ein Auftragsverarbeitungs-Vertrag mit dem Anbieter (Art. 28), ein Übermittlungsmechanismus für jeden US-Schritt (Kapitel V: DPF, SCCs oder BCRs), ein Verzeichnis von Verarbeitungstätigkeiten und in den meisten LLM-Unternehmensfällen eine DSFA (Art. 35). Ein einziger fehlender Baustein macht den ganzen Fluss unrechtmäßig. Die EU-Region ist dabei kein Rechts-Baustein, sondern die technische Maßnahme, die den Kapitel-V-Schritt überhaupt erst vermeidbar macht.11,12,13,14,15
▸ Deutsche Ebene — und der Betriebsrat
- NIS-2 weitet den Kreis betroffener Unternehmen massiv aus — ~29.500 in 18 Sektoren, viele Mittelständler neu im Anwendungsbereich und oft ohne es zu wissen. Nach langer Verzögerung (die EU-Frist Okt 2024 wurde verpasst) ist das deutsche NIS-2-Umsetzungsgesetz seit dem 06.12.2025 in Kraft; die BSI-Registrierungsfrist ist am 06.03.2026 abgelaufen — wer im Anwendungsbereich liegt, ist bereits in der Pflicht.
- DORA: für den Finanzsektor und dessen IT-Dienstleister direkt anwendbar seit 01/2025 — ein LLM-Gateway in dieser Kette ist mitbetroffen.
- BSI C5 / AIC4: der De-facto-Standard für Cloud- bzw. KI-Cloud-Sicherheit in Deutschland; die Posture, die Käufer und Auditoren erwarten.
- BetrVG § 87 Abs. 1 Nr. 6: die Einführung von KI-Tools löst echte Mitbestimmung aus, sobald das Tool zur Verhaltens-/Leistungskontrolle objektiv geeignet ist — Maßstab ist die objektive Eignung, nicht die Absicht des Arbeitgebers; dass er Nutzungsdaten einsehen kann, ist das entscheidende Indiz.
Der ehrliche Kern
EU-Datenresidenz ist eine Standort-Kontrolle, kein Gerichtsbarkeits-Schutz.
Der DACH-Markt verkauft „DSGVO-konform / deutsche Server“ als Differenzierer. Das ist ein Hygienefaktor, kein Vorsprung — und es verschweigt die eigentliche Grenze.
Zwei verschiedene US-Instrumente greifen auf Daten US-kontrollierter Anbieter zu — auch wenn diese auf EU-Servern liegen. FISA § 702 erlaubt US-Geheimdiensten den Zugriff ohne Richterspruch (der primäre Risiko-Vektor; keine bilateralen Ausnahmen). Der CLOUD Act verpflichtet US-Anbieter auf behördliche Anfrage zur Herausgabe, lässt aber bilaterale Abkommen als Korrektiv zu. Gerichtsbarkeit folgt dem Konzern, nicht dem Server-Standort. Eine „EU-Region“ reduziert die Routine-Exposition, hebt diesen rechtlichen Zwangszugriff aber nicht auf.24
Die Lösung
Ein Kontrollpunkt, der die Pflichten in Technik übersetzt.
Compliance ist hier das Produkt, nicht ein Feature. Jede Fähigkeit des Gateways erfüllt eine konkrete rechtliche Pflicht — das Governance-Werkzeug IST die Nachweis-Schicht.
Ehrlich gesagt: ja, ein Corporate LLM ist ein Wrapper über mehreren Anbietern. Sein Wert steckt in dem, was der Gateway erzwingt: verifizierte Identität, einen Residenz-Chokepoint vor jedem Egress, ein Audit-Log über jede Anfrage und eine nachweisbare Löschung. Und darin, dass dieses System hier läuft und sich Stück für Stück nachprüfen lässt.
| Fähigkeit im Gateway | Erfüllte Pflicht |
|---|---|
| Unveränderliches Logging (Metadaten) | Art. 26(6) Protokollaufbewahrung ≥ 6 Monate |
| RBAC + verifizierte Identität | Art. 26(1) Nutzung gemäß Vorgaben; verhindert Art.-25-Umklassifizierung |
| Menschliche-Aufsicht-Haken | Art. 14 wirksame Aufsicht |
| KI-Offenlegung am Output | Art. 50 Transparenzpflicht |
| Fähigkeit im Gateway | DSGVO-Baustein |
|---|---|
| EU-Region-Erzwingung (451-Chokepoint) | Kap. V Übermittlung minimiert; Datenresidenz |
| Provable Löschung (erase-vs-retain) | Art. 17 + Art. 17(3): Inhalt gelöscht, Audit/Billing pseudonymisiert |
| Auftragsverarbeitung am Anbieter | Art. 28 AVV + Sub-Prozessor-Kette |
| Mandanten-Isolation | Zweckbindung, Vertraulichkeit (DSK-Gewährleistungsziele) |
Gemessen an der Corporate-LLM-Definition des Marktes (Rechtssicheres Hosting · Multi-Modell-Aggregator · RAG mit eigener Vektor-Datenbank · Wissens-Bot · Workspace) deckt dieses System den technischen Kern ab: den Multi-Modell-Gateway, die eigene Vektor-DB-RAG (ausdrücklich gegen „PDF ins Custom-GPT laden“), EU-Hosting und eine Agenten-Runtime. Was fehlt, steht ehrlich unter „Grenzen“.
Live-Demo
Jede Behauptung ist klickbar.
Kein Screenshot-Theater. Die Konsole spricht mit dem echten, deployten System über einen rate-limitierten Demo-Mandanten.
- Gateway + 451-Chokepoint: EU-Modell antwortet; ein US-Direkt-Endpunkt wird vor dem Egress mit HTTP 451 blockiert.
- Agent: Plan → Tool-Aufruf → Ergebnis → Antwort, jeder Schritt durch den Residenz-Gate.
- RAG: eine deutsche Frage, beantwortet aus hochgeladenem Firmendokument mit Quellen-Zitat.
- Audit + Löschung: eine Anfrage erzeugt eine Metadaten-Zeile; eine Löschung entfernt Inhalt und behält den Art.-30-Nachweis.
- Admin-Konsole: Login mit API-Key → Mandant, Nutzer, Token-Verbrauch, Audit-Log, Rollen.
wartet...
wartet...
Bereit.
Grenzen & Härtung
Was für Produktion fehlt — ohne Schönfärberei.
Ein Demo-System ehrlich von einem Produkt zu trennen ist selbst ein Vertrauens-Signal. Hier sind die offenen Punkte aus dem Build-Logbuch.
- Quota ist ein nachlaufender Circuit-Breaker (Audit-Log-SUM), keine echte atomare Quote — bei Lastspitzen kann sie kurz überschießen.
- Metering-Rollup + Durability für Abrechnung in großem Maßstab stehen aus.
- Sub-Prozessor-Kaskade (vollständige AVV-Kette bis zum US-Anbieter) ist dokumentiert, nicht durchverhandelt.
- Backups / Point-in-Time-Recovery, Observability-PII-Scrubbing und Session-Owner-SPOF sind benannte, offene Härtungspunkte.
- Anthropic-Live-Routing ist code-fertig, aber nicht live verifiziert (kein API-Key; Claude EU-resident nur über Bedrock/Vertex).
Der Weg zur Produktion ist Härtung, nicht Neubau: echte atomare Quota, durable Metering, vollständige Sub-Prozessor-Verträge, Backups/PITR — und für den Verkauf die Zertifizierungen, die der Markt verlangt (ISO 27001, SOC 2, BSI C5).21
Vom Demo zum Produkt
Was aus diesem Beweis ein verkaufbares Produkt macht.
Das hier ist ein gebauter Beweis, kein fertiges Produkt. Was bis dorthin fehlt, ist Härtung und Zertifizierung — die Architektur dafür steht bereits. So sieht die Zielarchitektur aus.
Der Kern steht: vier Module sind live und einzeln nachprüfbar. Was ein verkaufbares Produkt zusätzlich braucht, ist bekannt und benannt: Härtung, Verträge und Audits. Das ist solides Handwerk.
| Modul (heute live) | Produktisiert |
|---|---|
| Gateway | Mandanten-Self-Service, Modell-Katalog, SLA-gestütztes Routing |
| Agent + RAG | Wissens-Bot-Oberfläche, Dokument-Connectoren, Auswertungen |
| EU-Datenschicht | Multi-Region-EU, Backups/PITR, durable Metering |
| Multi-Mandant + Governance | Admin-Self-Service, Reporting, Zertifikats-Nachweise |
Geschäftsmodell
Der productized Corporate LLM — verkauft wird Compliance, nicht Tokens.
Token-Preise fielen 2025→2026 um rund 80 %. Wer auf Token-Marge setzt, verliert ein Rennen gegen null. Die belastbare Marge sitzt in der Governance- und Compliance-Schicht.
Die strategische Gabel ist die Risiko-Haltung, nicht das Volumen. Pass-through-plus-Marge ist dünn und risikolos, kommodifiziert aber schnell. Committed-Capacity-Arbitrage bringt echte Marge, trägt dafür Auslastungsrisiko und braucht Skala. Wer dem Kunden einen Festpreis gibt und oben metered einkauft, betreibt genau diese Arbitrage.29
Hygienefaktor-Warnung: „DSGVO-konform / deutsche Server / kein Vendor-Lock-in“ ist im DACH-Markt der universelle Basis-Claim — dadurch kein Differenzierer. Der Vorsprung ist ein gebautes, nachprüfbares System plus die ehrliche L1/L2-Einordnung. Der Souveränitäts-Slogan allein genügt nicht. Scharfes Segment mit echtem Bedarf: Schweigepflicht-Berufe (Kanzleien, Steuerberatung, Praxen).30
Kosten im Betrieb
Die Infrastruktur ist nicht die Kostenfrage — die Tokens sind es.
Auf Cloudflare Workers liegt die Gateway-Infrastruktur bei jeder Mandantenzahl unter ~1 % der Token-Kosten. Die Marge lebt im Sitz-Preis, nicht im Pass-through.
| Skala | Infra/Monat (Cloudflare) | Token-Kosten/Monat (Pass-through, GPT-4o) | Infra-Anteil |
|---|---|---|---|
| 10 Mandanten (400 Mio. Tok.) | ~5 € (im Basis-Kontingent) | ~1.900 $ | < 0,3 % |
| 100 Mandanten (4 Mrd. Tok.) | ~5–15 € | ~19.000 $ | < 0,1 % |
| 1.000 Mandanten (40 Mrd. Tok.) | ~10–30 € | ~190.000 $ | < 0,02 % |
Unit-Preise (offizielle Cloudflare-Docs, 2026): Workers Paid 5 $/Monat inkl. 10 Mio. Requests; D1 25 Mrd. gelesene Zeilen inkl.; R2 mit kostenlosem Egress (Durable-Object-Requests werden separat gemessen). Selbst bei 1.000 Mandanten bleibt der Infra-Posten — getrieben von D1-Writes (Audit-Logs) und Durable-Object-Dauer — zweistellig im Euro-Bereich und verschwindet gegen die Token-Kosten.31,32,33
Roadmap zur Produktreife
Vom L1-Beweis zum verkaufbaren Produkt.
- Härtung: echte atomare Quota, durable Metering, Backups/PITR, Observability-PII-Scrubbing, Session-SPOF beseitigen.
- Verträge: vollständige AVV-/Sub-Prozessor-Kette bis zum Modell-Anbieter; ROPA-Vorlagen je Use-Case.
- Zertifizierung: ISO 27001, SOC 2 Type II, BSI C5 — die Kaufkriterien des Marktes.
- L1→L2-Option: EU-eigenes Modell (Mistral/Aleph Alpha) + EU-Cloud + kundengehaltene Schlüssel als Konfigurations-Schalter für Souveränitäts-Kunden.
- Produkt-Oberfläche: Workspace, Wissens-Bot in Schulungs-Tools, Self-Service-Onboarding für den Mittelstand.
Über dieses Projekt
Gebaut, nicht behauptet.
mini-corporatellm ist eine eigenständige, von Grund auf selbst gebaute Implementierung — original-Code auf einem produktionstauglichen Stack: Bun, TypeScript, Hono auf Cloudflare Workers, D1, R2, Durable Objects. Das ist eine von mehreren tragfähigen Wahlen — Python/FastAPI, Go, Node oder AWS/Azure lösen dieselbe Aufgabe; hier fiel die Entscheidung auf EU-Residenz und niedrige Betriebskosten. Vier Module (Gateway, Agent + RAG, EU-Datenschicht, Multi-Mandant + Governance) sind live und einzeln nachprüfbar.
Die Gegenachse zum Markt-Standard ist bewusst: nicht „wir haben die Kategorie erfunden“, sondern „hier ist das gebaute System — sieh es dir an und brich es“. Jede Zahl auf dieser Seite trägt eine Quelle; jede Fähigkeit eine Live-Probe.
Gezeigter Beweis statt Standort und Druck.
Nachweise
Quellen
- Bitkom KI-Studie 2026 — 2026 — https://www.bitkom.org/Presse/Presseinformation/Unternehmen-KI-Einsatz-zahlen
- Proliance — Schatten-KI für KMU — 2026 — https://www.proliance.ai/blog/schatten-ki
- EU AI Act, Art. 50 (Transparenz) — 2024/1689 — https://artificialintelligenceact.eu/article/50/
- EU AI Act, Art. 4 (KI-Kompetenz) — 2024/1689 — https://artificialintelligenceact.eu/article/4/
- EU AI Act, Art. 6 + Anhang III (Hochrisiko) — 2024/1689 — https://artificialintelligenceact.eu/article/6/
- EU AI Act, Art. 26 (Pflichten der Betreiber) — 2024/1689 — https://artificialintelligenceact.eu/article/26/
- EU AI Act — Anwendungs-Zeitplan — 2026 — https://artificialintelligenceact.eu/implementation-timeline/
- EU Digital Omnibus (AI) — Kommissionsvorschlag — 2025-11-19 — https://digital-strategy.ec.europa.eu/en/library/digital-omnibus-ai-regulation-proposal
- EU AI Act, Art. 99 (Sanktionen) — 2024/1689 — https://artificialintelligenceact.eu/article/99/
- Bundesregierung — Durchführungsgesetz zur KI-VO (KI-MIG) — 2026-02-11 — https://bmds.bund.de/service/gesetzgebungsverfahren/gesetz-zur-durchfuehrung-der-ki-verordnung
- DSGVO Art. 28 (Auftragsverarbeitung) — DSGVO — https://dsgvo-gesetz.de/art-28-dsgvo/
- DSGVO Art. 44 ff. (Drittlandübermittlung) — DSGVO — https://dsgvo-gesetz.de/art-44-dsgvo/
- DSGVO Art. 17 (Recht auf Löschung) — DSGVO — https://dsgvo-gesetz.de/art-17-dsgvo/
- EDPB — Stellungnahme 28/2024 (KI-Modelle) — 2024-12-17 — https://www.edpb.europa.eu/our-work-tools/our-documents/opinion-board-art-64/opinion-282024-certain-data-protection-aspects_en
- DSK — Orientierungshilfe KI und Datenschutz — 2024-05-06 — https://www.datenschutzkonferenz-online.de/media/oh/20240506_DSK_Orientierungshilfe_KI_und_Datenschutz.pdf
- IAPP — EuG weist Latombe-Klage ab, DPF bestätigt — 2025-09-03 — https://iapp.org/news/a/european-general-court-dismisses-latombe-challenge-upholds-eu-us-data-privacy-framework
- CDT — Folgen der PCLOB-Entlassungen für das DPF — 2025 — https://cdt.org/insights/what-the-pclob-firings-mean-for-the-eu-us-data-privacy-framework/
- EuGH C-311/18 (Schrems II) — 2020-07-16 — https://curia.europa.eu/juris/liste.jsf?num=C-311/18
- Bundesregierung — NIS-2-Umsetzungsgesetz — 2025-12-06 — https://www.bundesregierung.de/breg-de/aktuelles/nis-2-richtlinie-deutschland-2373174
- BaFin — DORA Überblick — 2025-01-17 — https://www.bafin.de/DE/unternehmen-maerkte/aufsicht/alle-unternehmen/dora/ueberblick/ueberblick_node.html
- BSI — Kriterienkatalog C5 — 2026 — https://www.bsi.bund.de/DE/Themen/Unternehmen-und-Organisationen/Informationen-und-Empfehlungen/Empfehlungen-nach-Angriffszielen/Cloud-Computing/Kriterienkatalog-C5/c5_node.html
- BSI — Generative KI-Modelle: Chancen und Risiken — 2026-01-21 — https://www.bsi.bund.de/SharedDocs/Downloads/DE/BSI/KI/Generative_KI-Modelle.pdf
- Bird & Bird — erstes Urteil zu Betriebsrats-Rechten bei KI — 2024 — https://www.twobirds.com/de/insights/2024/germany/erstes-urteil-zu-rechten-des-betriebsrats-bei-einsatz-von-kuenstlicher-intelligenz
- EuroToolKit — US CLOUD Act + FISA 702 — 2025 — https://www.eurotoolkit.eu/blog/us-cloud-act-fisa-702
- Anthropic — Data residency (API us/global) — 2026 — https://platform.claude.com/docs/en/build-with-claude/data-residency
- ki-company.ai — Langdock im Test (Preise) — 2026 — https://www.ki-company.ai/en/blog-beitraege/langdock-put-to-the-test-the-privacy-compliant-ai-tool-for-companies
- SiliconData — LLM cost per token (Preisverfall) — 2026 — https://www.silicondata.com/blog/llm-cost-per-token
- Requesty — Pricing (EU, +5%) — 2026 — https://www.requesty.ai/pricing
- Microsoft Learn — Azure OpenAI Provisioned Throughput — 2026 — https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/provisioned-throughput
- T-Systems AI Foundation Services — Plans — 2026 — https://docs.llmhub.t-systems.net/plans/
- Cloudflare Workers — Pricing — 2026 — https://developers.cloudflare.com/workers/platform/pricing/
- Cloudflare D1 — Pricing — 2026 — https://developers.cloudflare.com/d1/platform/pricing/
- Cloudflare R2 — Pricing (Egress frei) — 2026 — https://developers.cloudflare.com/r2/pricing/