● live · EU-resident (Cloudflare WEUR)

Unternehmens-KI, die das europäische Recht nicht gegen Sie verwendet.

Ein laufender Corporate-LLM-Gateway zu GPT, Claude, Gemini und EU-eigenen Modellen. Jede Anfrage passiert einen EU-Residenz-Chokepoint und landet im Audit-Log. Jede Behauptung auf dieser Seite ist live nachprüfbar.

In einem Satz

Was ist mini-corporatellm — und warum?

Bevor das Dossier ins Detail geht: das Wichtigste in vier Fragen, ohne Fachjargon.

Was ist das?
Ein firmeneigener, kontrollierter Zugang zu KI-Modellen wie GPT und Claude — mit Protokoll, EU-Datenhaltung und Rechte-Verwaltung.
Welches Problem löst es?
Mitarbeiter nutzen KI längst heimlich mit Kundendaten. Ein Verbot verlagert das Risiko nur; dieses System holt es in einen kontrollierten Kanal zurück.
Wie soll ich es mir vorstellen?
Wie eine Schleuse am Werkstor: Jede Anfrage wird geprüft, registriert und bleibt in der EU — nichts verlässt unbemerkt das Haus.
Für wen?
Mittelständische Unternehmen, die KI erlauben wollen, ohne DSGVO, Betriebsrat und Haftung zu riskieren.

Das Problem

Der Mittelstand will KI — und darf sie nicht so nutzen, wie sie da ist.

Der Engpass ist nicht die Technik. Er ist organisatorisch: KI rechtssicher in den Betrieb zu bekommen, während Datenschutz, Betriebsrat und fehlende Compliance-Kapazität jeden Schritt bremsen.

41 %1 der deutschen Firmen (ab 20 MA) nutzen 2026 KI — von 17 % in 2025
77 %1 nennen Datenschutz als Adoptionsbarriere Nr. 1
bis 90 %2 der Wissensarbeiter nutzen KI heimlich trotz Verbot (Schatten-KI)
70 %1 nennen den Fachkräftemangel — niemand zum Aufbauen einer Governance

Die Nachfrage beschleunigt sich (Adoption 17 % → 41 % in einem Jahr), aber die größte Hürde ist nicht „Können wir KI?“, sondern „Dürfen wir KI mit unseren Daten?“. Datenschutz ist die meistgenannte Barriere, dicht gefolgt von Fachkräftemangel und rechtlicher Unsicherheit.1

Schatten-KI (heute) vs. governter Zugang
Schatten-KI (privater Account)Governter Zugang (mini-corporatellm)
VertragkeinerAuftragsverarbeitung mit dem Anbieter
ProtokollkeinesAudit-Log je Anfrage
DatenortunbekanntEU-Region, technisch erzwungen
Löschungunmöglichnachweisbar (Art. 17)
KontrollekeineRBAC + Rate-Limit + Rollen

Das ist „Schatten-KI“ — das Leck, das ein Corporate LLM schließen soll: nicht ein neues Werkzeug zusätzlich, sondern die sanktionierte Alternative, die den Anreiz zum heimlichen Privat-Account beseitigt und den Datenfluss in einen kontrollierten, protokollierten Kanal zurückholt.

Der eigentliche Blocker ist Kapazität. Ohne Inhouse-Juristen bleibt die Rechtsgrundlagen-Prüfung liegen, ohne KI-Fachkräfte der governte Betrieb. Selbst ein williges Unternehmen kann DSGVO, BetrVG, NIS2 und den AI Act nicht gleichzeitig inhouse stemmen.1

Die Rechtslage

Was ein deutsches Unternehmen 2026 wirklich beachten muss.

Drei Ebenen stapeln sich: der EU AI Act, die DSGVO mit dem Drittlandtransfer-Problem, und die deutsche Ebene (NIS2, DORA, BSI, Betriebsrat). Jede Aussage hier ist mit Quelle hinterlegt.

▸ EU AI Act — Rollen und Pflichten

Ein normaler unternehmensinterner KI-Assistent ist kein Hochrisiko-System. Er fällt standardmäßig in die Transparenz-Stufe (limited risk): die zentrale produktbezogene Pflicht ist die Offenlegung nach Art. 50, dass Nutzer mit KI interagieren bzw. dass Inhalte KI-generiert sind. Hinzu kommt — unabhängig von der Risiko-Stufe — die KI-Kompetenzpflicht nach Art. 4, die seit dem 02.02.2025 jeden Betreiber trifft (Personal muss im kompetenten KI-Einsatz geschult sein; Durchsetzung ab 08/2026). Sie ist organisatorisch: der Gateway flankiert sie über Audit und Offenlegung, erfüllt sie aber nicht.3,4

Hochrisiko ist use-case-getrieben, nicht technologie-getrieben (Anhang III): erst wenn der Assistent z. B. Bewerber vorselektiert oder Kreditwürdigkeit bewertet, greifen die vollen Betreiberpflichten aus Art. 26 — menschliche Aufsicht, Protokollaufbewahrung ≥ 6 Monate, Information der Betroffenen.5,6

Sanktionen: bis 35 Mio. € / 7 % (verbotene Praktiken), bis 15 Mio. € / 3 % (sonstige Verstöße), bis 7,5 Mio. € / 1 % (falsche Angaben gegenüber Behörden — hierunter fällt auch ein Verstoß gegen die KI-Kompetenzpflicht) — für KMU gilt jeweils der niedrigere der beiden Beträge. In Deutschland koordiniert die Bundesnetzagentur als zentrale Stelle die Marktüberwachung (Hybrid-Modell: sektorspezifische Behörden wie die BaFin bleiben für ihren Bereich zuständig); das Durchführungsgesetz zur KI-VO ist kabinettsbeschlossen (11.02.2026), aber noch nicht verabschiedet.9,10

▸ DSGVO + Drittlandtransfer — ein Stapel, kein Schalter

Personenbezogene Daten an ein LLM zu senden ist erlaubt — aber nur, wenn der rechtliche Stapel gleichzeitig hält: eine Rechtsgrundlage (Art. 6, bei Beschäftigten- und Kundendaten mit dokumentierter Interessenabwägung), ein Auftragsverarbeitungs-Vertrag mit dem Anbieter (Art. 28), ein Übermittlungsmechanismus für jeden US-Schritt (Kapitel V: DPF, SCCs oder BCRs), ein Verzeichnis von Verarbeitungstätigkeiten und in den meisten LLM-Unternehmensfällen eine DSFA (Art. 35). Ein einziger fehlender Baustein macht den ganzen Fluss unrechtmäßig. Die EU-Region ist dabei kein Rechts-Baustein, sondern die technische Maßnahme, die den Kapitel-V-Schritt überhaupt erst vermeidbar macht.11,12,13,14,15

▸ Deutsche Ebene — und der Betriebsrat

  • NIS-2 weitet den Kreis betroffener Unternehmen massiv aus — ~29.500 in 18 Sektoren, viele Mittelständler neu im Anwendungsbereich und oft ohne es zu wissen. Nach langer Verzögerung (die EU-Frist Okt 2024 wurde verpasst) ist das deutsche NIS-2-Umsetzungsgesetz seit dem 06.12.2025 in Kraft; die BSI-Registrierungsfrist ist am 06.03.2026 abgelaufen — wer im Anwendungsbereich liegt, ist bereits in der Pflicht.
  • DORA: für den Finanzsektor und dessen IT-Dienstleister direkt anwendbar seit 01/2025 — ein LLM-Gateway in dieser Kette ist mitbetroffen.
  • BSI C5 / AIC4: der De-facto-Standard für Cloud- bzw. KI-Cloud-Sicherheit in Deutschland; die Posture, die Käufer und Auditoren erwarten.
  • BetrVG § 87 Abs. 1 Nr. 6: die Einführung von KI-Tools löst echte Mitbestimmung aus, sobald das Tool zur Verhaltens-/Leistungskontrolle objektiv geeignet ist — Maßstab ist die objektive Eignung, nicht die Absicht des Arbeitgebers; dass er Nutzungsdaten einsehen kann, ist das entscheidende Indiz.

Der ehrliche Kern

EU-Datenresidenz ist eine Standort-Kontrolle, kein Gerichtsbarkeits-Schutz.

Der DACH-Markt verkauft „DSGVO-konform / deutsche Server“ als Differenzierer. Das ist ein Hygienefaktor, kein Vorsprung — und es verschweigt die eigentliche Grenze.

Drei Stufen von Datenresidenz zu SouveränitätStufe 1 Datenresidenz (hier: mini-corporatellm), Stufe 2 operative Souveränität, Stufe 3 technische Souveränität — mit zunehmendem Schutz und zunehmenden Kosten.zunehmende SouveränitätStufe 1 — DatenresidenzBytes in EU-Region (Azure-EU, Vertex-EU, OpenAI-EU)✓ Routine-Exposition, Latenz ✗ US-Zugriffszwang◀ Sie sind hierStufe 2 — Operative SouveränitätEU-Rechtsträger, EU-Personal (AWS ESC, T-Systems, Delos)✓ extraterritorialer Zwang ✗ keine Frontier-Modelle (noch)Stufe 3 — Technische Souveränitäteigene Gewichte + Infrastruktur (Self-Hosting EU-GPU)✓ alles Kosten: Betrieb, kein Frontier-Reasoning
mini-corporatellm ist Stufe 1 (Datenresidenz). Der Sprung auf Stufe 2 oder 3 ist im Design vorgesehen, kein Neubau.

Zwei verschiedene US-Instrumente greifen auf Daten US-kontrollierter Anbieter zu — auch wenn diese auf EU-Servern liegen. FISA § 702 erlaubt US-Geheimdiensten den Zugriff ohne Richterspruch (der primäre Risiko-Vektor; keine bilateralen Ausnahmen). Der CLOUD Act verpflichtet US-Anbieter auf behördliche Anfrage zur Herausgabe, lässt aber bilaterale Abkommen als Korrektiv zu. Gerichtsbarkeit folgt dem Konzern, nicht dem Server-Standort. Eine „EU-Region“ reduziert die Routine-Exposition, hebt diesen rechtlichen Zwangszugriff aber nicht auf.24

Die Lösung

Ein Kontrollpunkt, der die Pflichten in Technik übersetzt.

Compliance ist hier das Produkt, nicht ein Feature. Jede Fähigkeit des Gateways erfüllt eine konkrete rechtliche Pflicht — das Governance-Werkzeug IST die Nachweis-Schicht.

Anfrage-Fluss durch den Gateway mit EU-451-Residenz-ChokepointVertikaler Fluss: Mitarbeiter/App über verifizierte Identität, den 451-Residenz-Chokepoint, Rate-Limit und Audit-Log zum EU-residenten Modell; ein US-Direkt-Endpunkt wird vor dem Egress mit HTTP 451 blockiert.Mitarbeiter / AppOpenAI-kompatibel · GPT · Claude · Gemini · MistralAPI-Key → SHA-256 → Tenant / RolleIdentität verifiziert — kein spoofbarer Header451-Residenz-Chokepointkein Byte verlässt die EU ungeprüftUS-Direkt-EndpunktHTTP 451 — blockiert451Rate-Limit · Adapter · Retry · FallbackDurable Object in der EU-RegionAudit-Log — nur Metadaten (EU-D1)jede Anfrage protokolliertEU-residentes ModellAntwort auf OpenAI-Shape normalisiert■ EU-Pfad (blau/grün) ■ blockierter US-Egress (rot)
Jede Anfrage passiert verifizierte Identität, den 451-Residenz-Chokepoint, Rate-Limit und Audit-Log, bevor sie ein EU-residentes Modell erreicht. Ein US-Direkt-Endpunkt wird vor dem Egress mit HTTP 451 blockiert.

Ehrlich gesagt: ja, ein Corporate LLM ist ein Wrapper über mehreren Anbietern. Sein Wert steckt in dem, was der Gateway erzwingt: verifizierte Identität, einen Residenz-Chokepoint vor jedem Egress, ein Audit-Log über jede Anfrage und eine nachweisbare Löschung. Und darin, dass dieses System hier läuft und sich Stück für Stück nachprüfen lässt.

Fähigkeit → erfüllte AI-Act-Pflicht
Fähigkeit im GatewayErfüllte Pflicht
Unveränderliches Logging (Metadaten)Art. 26(6) Protokollaufbewahrung ≥ 6 Monate
RBAC + verifizierte IdentitätArt. 26(1) Nutzung gemäß Vorgaben; verhindert Art.-25-Umklassifizierung
Menschliche-Aufsicht-HakenArt. 14 wirksame Aufsicht
KI-Offenlegung am OutputArt. 50 Transparenzpflicht
Fähigkeit → DSGVO-Baustein
Fähigkeit im GatewayDSGVO-Baustein
EU-Region-Erzwingung (451-Chokepoint)Kap. V Übermittlung minimiert; Datenresidenz
Provable Löschung (erase-vs-retain)Art. 17 + Art. 17(3): Inhalt gelöscht, Audit/Billing pseudonymisiert
Auftragsverarbeitung am AnbieterArt. 28 AVV + Sub-Prozessor-Kette
Mandanten-IsolationZweckbindung, Vertraulichkeit (DSK-Gewährleistungsziele)

Gemessen an der Corporate-LLM-Definition des Marktes (Rechtssicheres Hosting · Multi-Modell-Aggregator · RAG mit eigener Vektor-Datenbank · Wissens-Bot · Workspace) deckt dieses System den technischen Kern ab: den Multi-Modell-Gateway, die eigene Vektor-DB-RAG (ausdrücklich gegen „PDF ins Custom-GPT laden“), EU-Hosting und eine Agenten-Runtime. Was fehlt, steht ehrlich unter „Grenzen“.

Multi-Mandanten-IsolationJeder Mandant wird über verifizierte Identität auf seine eigenen, isolierten D1-Zeilen, R2-Dokumente und Audit-Logs beschränkt; mandantenübergreifender Zugriff ist blockiert.Mandant AMandant BMandant CVerifizierte Identität — API-Key → SHA-256 → {Mandant, Nutzer, Rolle}isoliert · Mandant AD1 (tenant-scoped)R2-DokumenteAudit-Logisoliert · Mandant BD1 (tenant-scoped)R2-DokumenteAudit-Logisoliert · Mandant CD1 (tenant-scoped)R2-DokumenteAudit-LogCross-Tenant-Zugriff blockiert — live nachgewiesen
Jeder Mandant ist über verifizierte Identität auf eigene, isolierte Daten beschränkt; mandantenübergreifender Zugriff ist blockiert — live nachgewiesen.

Live-Demo

Jede Behauptung ist klickbar.

Kein Screenshot-Theater. Die Konsole spricht mit dem echten, deployten System über einen rate-limitierten Demo-Mandanten.

  • Gateway + 451-Chokepoint: EU-Modell antwortet; ein US-Direkt-Endpunkt wird vor dem Egress mit HTTP 451 blockiert.
  • Agent: Plan → Tool-Aufruf → Ergebnis → Antwort, jeder Schritt durch den Residenz-Gate.
  • RAG: eine deutsche Frage, beantwortet aus hochgeladenem Firmendokument mit Quellen-Zitat.
  • Audit + Löschung: eine Anfrage erzeugt eine Metadaten-Zeile; eine Löschung entfernt Inhalt und behält den Art.-30-Nachweis.
  • Admin-Konsole: Login mit API-Key → Mandant, Nutzer, Token-Verbrauch, Audit-Log, Rollen.
RAG-Pipeline: von der Frage zur quellenbelegten AntwortEine deutsche Frage wird eingebettet, gegen eine EU-residente Vektor-Datenbank des Firmenwissens gesucht, der Kontext augmentiert und vom LLM mit Quellen-Zitat beantwortet.FrageEmbedVektor-SucheRetrieveAugmentLLMAntwort + QuellenVektor-DBFirmenwissen, EUaus hochgeladenemFirmendokument
Eine deutsche Frage wird gegen das EU-residente Firmenwissen beantwortet — mit Quellen-Zitat.
Agent-Runtime-Loop durch den Residenz-GateDer Agent plant, ruft Werkzeuge auf, wertet Ergebnisse aus und iteriert zurück zum Planer, bis er antwortet — jeder Schritt passiert den EU-Residenz-Gate.Planer (LLM)Reasoning-LoopTool-AufrufAPI · Suche · CodeErgebnisgeparstAntwortan Mitarbeiterplant Schrittführt ausiteriertfertiggestrichelter Rahmen = jeder Schritt durch den EU-Residenz-Gate
Der Agent plant, ruft Werkzeuge auf und iteriert zurück zum Planer — jeder Schritt passiert den EU-Residenz-Gate.
Health wartet...
Residenz wartet...
Bereit.

Grenzen & Härtung

Was für Produktion fehlt — ohne Schönfärberei.

Ein Demo-System ehrlich von einem Produkt zu trennen ist selbst ein Vertrauens-Signal. Hier sind die offenen Punkte aus dem Build-Logbuch.

  • Quota ist ein nachlaufender Circuit-Breaker (Audit-Log-SUM), keine echte atomare Quote — bei Lastspitzen kann sie kurz überschießen.
  • Metering-Rollup + Durability für Abrechnung in großem Maßstab stehen aus.
  • Sub-Prozessor-Kaskade (vollständige AVV-Kette bis zum US-Anbieter) ist dokumentiert, nicht durchverhandelt.
  • Backups / Point-in-Time-Recovery, Observability-PII-Scrubbing und Session-Owner-SPOF sind benannte, offene Härtungspunkte.
  • Anthropic-Live-Routing ist code-fertig, aber nicht live verifiziert (kein API-Key; Claude EU-resident nur über Bedrock/Vertex).

Der Weg zur Produktion ist Härtung, nicht Neubau: echte atomare Quota, durable Metering, vollständige Sub-Prozessor-Verträge, Backups/PITR — und für den Verkauf die Zertifizierungen, die der Markt verlangt (ISO 27001, SOC 2, BSI C5).21

Vom Demo zum Produkt

Was aus diesem Beweis ein verkaufbares Produkt macht.

Das hier ist ein gebauter Beweis, kein fertiges Produkt. Was bis dorthin fehlt, ist Härtung und Zertifizierung — die Architektur dafür steht bereits. So sieht die Zielarchitektur aus.

Vollprodukt-Zielarchitektur — vom Demo zum verkaufbaren ProduktAuf dem gebauten 4-Modul-Kern (durchgezogen) setzen die Produkt-Schichten auf (gestrichelt = Vision): Produkt-Oberfläche, Härtung, der L1-nach-L2-Schalter und Zertifizierungen.durchgezogen = heute gebaut gestrichelt = Produkt-VisionProdukt-OberflächeSelf-Service-Onboarding · Billing · Workspace · Wissens-BotGebauter Kern — heute liveGateway451 · Multi-ModellAgent + RAGLoop · Vektor-RAGEU-DatenschichtD1 · R2 · DO (WEUR)GovernanceRBAC · Audit · LöschungHärtungatomare Quota · durable Metering · Backups/PITR · Observability-PII-ScrubbingL1 → L2-Schalter (Konfiguration, kein Rewrite)EU-eigenes Modell (Mistral / Aleph Alpha) + EU-Cloud + kundengehaltene SchlüsselZertifizierungen — die Kaufkriterien des MarktesISO 27001 · SOC 2 Type II · BSI C5Der Weg zur Produktion ist Härtung, nicht Neubau.
Der gebaute Kern (durchgezogen) trägt die Produkt-Schichten (gestrichelt = Vision).

Der Kern steht: vier Module sind live und einzeln nachprüfbar. Was ein verkaufbares Produkt zusätzlich braucht, ist bekannt und benannt: Härtung, Verträge und Audits. Das ist solides Handwerk.

Jedes Modul — vom Demo-Beweis zum Produkt
Modul (heute live)Produktisiert
GatewayMandanten-Self-Service, Modell-Katalog, SLA-gestütztes Routing
Agent + RAGWissens-Bot-Oberfläche, Dokument-Connectoren, Auswertungen
EU-DatenschichtMulti-Region-EU, Backups/PITR, durable Metering
Multi-Mandant + GovernanceAdmin-Self-Service, Reporting, Zertifikats-Nachweise

Geschäftsmodell

Der productized Corporate LLM — verkauft wird Compliance, nicht Tokens.

Token-Preise fielen 2025→2026 um rund 80 %. Wer auf Token-Marge setzt, verliert ein Rennen gegen null. Die belastbare Marge sitzt in der Governance- und Compliance-Schicht.

~25 €26 pro Sitz/Monat (Plattform, Tokens separat) — der Marktanker (Langdock Business)
~80 %27 Token-Preisverfall allein 2025 (modellklassen-abhängig) — Markup-Modelle kommodifizieren
+5 %28 Pass-through-Markup (Requesty, vgl. OpenRouter) = der kommodifizierte Boden

Die strategische Gabel ist die Risiko-Haltung, nicht das Volumen. Pass-through-plus-Marge ist dünn und risikolos, kommodifiziert aber schnell. Committed-Capacity-Arbitrage bringt echte Marge, trägt dafür Auslastungsrisiko und braucht Skala. Wer dem Kunden einen Festpreis gibt und oben metered einkauft, betreibt genau diese Arbitrage.29

Hygienefaktor-Warnung: „DSGVO-konform / deutsche Server / kein Vendor-Lock-in“ ist im DACH-Markt der universelle Basis-Claim — dadurch kein Differenzierer. Der Vorsprung ist ein gebautes, nachprüfbares System plus die ehrliche L1/L2-Einordnung. Der Souveränitäts-Slogan allein genügt nicht. Scharfes Segment mit echtem Bedarf: Schweigepflicht-Berufe (Kanzleien, Steuerberatung, Praxen).30

Kosten im Betrieb

Die Infrastruktur ist nicht die Kostenfrage — die Tokens sind es.

Auf Cloudflare Workers liegt die Gateway-Infrastruktur bei jeder Mandantenzahl unter ~1 % der Token-Kosten. Die Marge lebt im Sitz-Preis, nicht im Pass-through.

Modell: „modester“ Mandant = 20 Nutzer, ~40 Mio. Tokens/Monat, ~13,2k Gateway-Requests, Pass-through zum GPT-4o-Listenpreis (~4,75 $/1 Mio. Tokens, blended 70/30). Eine gemeinsame Worker-Deployment.
SkalaInfra/Monat (Cloudflare)Token-Kosten/Monat (Pass-through, GPT-4o)Infra-Anteil
10 Mandanten (400 Mio. Tok.)~5 € (im Basis-Kontingent)~1.900 $< 0,3 %
100 Mandanten (4 Mrd. Tok.)~5–15 €~19.000 $< 0,1 %
1.000 Mandanten (40 Mrd. Tok.)~10–30 €~190.000 $< 0,02 %

Unit-Preise (offizielle Cloudflare-Docs, 2026): Workers Paid 5 $/Monat inkl. 10 Mio. Requests; D1 25 Mrd. gelesene Zeilen inkl.; R2 mit kostenlosem Egress (Durable-Object-Requests werden separat gemessen). Selbst bei 1.000 Mandanten bleibt der Infra-Posten — getrieben von D1-Writes (Audit-Logs) und Durable-Object-Dauer — zweistellig im Euro-Bereich und verschwindet gegen die Token-Kosten.31,32,33

Roadmap zur Produktreife

Vom L1-Beweis zum verkaufbaren Produkt.

  1. Härtung: echte atomare Quota, durable Metering, Backups/PITR, Observability-PII-Scrubbing, Session-SPOF beseitigen.
  2. Verträge: vollständige AVV-/Sub-Prozessor-Kette bis zum Modell-Anbieter; ROPA-Vorlagen je Use-Case.
  3. Zertifizierung: ISO 27001, SOC 2 Type II, BSI C5 — die Kaufkriterien des Marktes.
  4. L1→L2-Option: EU-eigenes Modell (Mistral/Aleph Alpha) + EU-Cloud + kundengehaltene Schlüssel als Konfigurations-Schalter für Souveränitäts-Kunden.
  5. Produkt-Oberfläche: Workspace, Wissens-Bot in Schulungs-Tools, Self-Service-Onboarding für den Mittelstand.

Über dieses Projekt

Gebaut, nicht behauptet.

Vier-Modul-Systemarchitektur von mini-corporatellmVier live nachprüfbare Module innerhalb der EU-residenten Cloudflare-Umgebung: Gateway, Agent und RAG, EU-Datenschicht, Multi-Mandant und Governance.mini-corporatellm — EU-resident (Cloudflare WEUR)GatewayMulti-Modell · OpenAI-kompatibel451-Chokepoint · Rate-LimitAgent + RAGPlan → Tool → Antwort-LoopVektor-RAG aus FirmenwissenEU-DatenschichtD1 + R2 + Durable Objectsalles WEUR-gepinntMulti-Mandant + GovernanceRBAC · Audit-Log · QuotaDSGVO-Löschung (erase / retain)
Vier live nachprüfbare Module in der EU-residenten Cloudflare-Umgebung.

mini-corporatellm ist eine eigenständige, von Grund auf selbst gebaute Implementierung — original-Code auf einem produktionstauglichen Stack: Bun, TypeScript, Hono auf Cloudflare Workers, D1, R2, Durable Objects. Das ist eine von mehreren tragfähigen Wahlen — Python/FastAPI, Go, Node oder AWS/Azure lösen dieselbe Aufgabe; hier fiel die Entscheidung auf EU-Residenz und niedrige Betriebskosten. Vier Module (Gateway, Agent + RAG, EU-Datenschicht, Multi-Mandant + Governance) sind live und einzeln nachprüfbar.

Die Gegenachse zum Markt-Standard ist bewusst: nicht „wir haben die Kategorie erfunden“, sondern „hier ist das gebaute System — sieh es dir an und brich es“. Jede Zahl auf dieser Seite trägt eine Quelle; jede Fähigkeit eine Live-Probe.

Gezeigter Beweis statt Standort und Druck.

Die Leitlinie dieses Projekts

Nachweise

Quellen

  1. Bitkom KI-Studie 2026 — 2026 — https://www.bitkom.org/Presse/Presseinformation/Unternehmen-KI-Einsatz-zahlen
  2. Proliance — Schatten-KI für KMU — 2026 — https://www.proliance.ai/blog/schatten-ki
  3. EU AI Act, Art. 50 (Transparenz) — 2024/1689 — https://artificialintelligenceact.eu/article/50/
  4. EU AI Act, Art. 4 (KI-Kompetenz) — 2024/1689 — https://artificialintelligenceact.eu/article/4/
  5. EU AI Act, Art. 6 + Anhang III (Hochrisiko) — 2024/1689 — https://artificialintelligenceact.eu/article/6/
  6. EU AI Act, Art. 26 (Pflichten der Betreiber) — 2024/1689 — https://artificialintelligenceact.eu/article/26/
  7. EU AI Act — Anwendungs-Zeitplan — 2026 — https://artificialintelligenceact.eu/implementation-timeline/
  8. EU Digital Omnibus (AI) — Kommissionsvorschlag — 2025-11-19 — https://digital-strategy.ec.europa.eu/en/library/digital-omnibus-ai-regulation-proposal
  9. EU AI Act, Art. 99 (Sanktionen) — 2024/1689 — https://artificialintelligenceact.eu/article/99/
  10. Bundesregierung — Durchführungsgesetz zur KI-VO (KI-MIG) — 2026-02-11 — https://bmds.bund.de/service/gesetzgebungsverfahren/gesetz-zur-durchfuehrung-der-ki-verordnung
  11. DSGVO Art. 28 (Auftragsverarbeitung) — DSGVO — https://dsgvo-gesetz.de/art-28-dsgvo/
  12. DSGVO Art. 44 ff. (Drittlandübermittlung) — DSGVO — https://dsgvo-gesetz.de/art-44-dsgvo/
  13. DSGVO Art. 17 (Recht auf Löschung) — DSGVO — https://dsgvo-gesetz.de/art-17-dsgvo/
  14. EDPB — Stellungnahme 28/2024 (KI-Modelle) — 2024-12-17 — https://www.edpb.europa.eu/our-work-tools/our-documents/opinion-board-art-64/opinion-282024-certain-data-protection-aspects_en
  15. DSK — Orientierungshilfe KI und Datenschutz — 2024-05-06 — https://www.datenschutzkonferenz-online.de/media/oh/20240506_DSK_Orientierungshilfe_KI_und_Datenschutz.pdf
  16. IAPP — EuG weist Latombe-Klage ab, DPF bestätigt — 2025-09-03 — https://iapp.org/news/a/european-general-court-dismisses-latombe-challenge-upholds-eu-us-data-privacy-framework
  17. CDT — Folgen der PCLOB-Entlassungen für das DPF — 2025 — https://cdt.org/insights/what-the-pclob-firings-mean-for-the-eu-us-data-privacy-framework/
  18. EuGH C-311/18 (Schrems II) — 2020-07-16 — https://curia.europa.eu/juris/liste.jsf?num=C-311/18
  19. Bundesregierung — NIS-2-Umsetzungsgesetz — 2025-12-06 — https://www.bundesregierung.de/breg-de/aktuelles/nis-2-richtlinie-deutschland-2373174
  20. BaFin — DORA Überblick — 2025-01-17 — https://www.bafin.de/DE/unternehmen-maerkte/aufsicht/alle-unternehmen/dora/ueberblick/ueberblick_node.html
  21. BSI — Kriterienkatalog C5 — 2026 — https://www.bsi.bund.de/DE/Themen/Unternehmen-und-Organisationen/Informationen-und-Empfehlungen/Empfehlungen-nach-Angriffszielen/Cloud-Computing/Kriterienkatalog-C5/c5_node.html
  22. BSI — Generative KI-Modelle: Chancen und Risiken — 2026-01-21 — https://www.bsi.bund.de/SharedDocs/Downloads/DE/BSI/KI/Generative_KI-Modelle.pdf
  23. Bird & Bird — erstes Urteil zu Betriebsrats-Rechten bei KI — 2024 — https://www.twobirds.com/de/insights/2024/germany/erstes-urteil-zu-rechten-des-betriebsrats-bei-einsatz-von-kuenstlicher-intelligenz
  24. EuroToolKit — US CLOUD Act + FISA 702 — 2025 — https://www.eurotoolkit.eu/blog/us-cloud-act-fisa-702
  25. Anthropic — Data residency (API us/global) — 2026 — https://platform.claude.com/docs/en/build-with-claude/data-residency
  26. ki-company.ai — Langdock im Test (Preise) — 2026 — https://www.ki-company.ai/en/blog-beitraege/langdock-put-to-the-test-the-privacy-compliant-ai-tool-for-companies
  27. SiliconData — LLM cost per token (Preisverfall) — 2026 — https://www.silicondata.com/blog/llm-cost-per-token
  28. Requesty — Pricing (EU, +5%) — 2026 — https://www.requesty.ai/pricing
  29. Microsoft Learn — Azure OpenAI Provisioned Throughput — 2026 — https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/provisioned-throughput
  30. T-Systems AI Foundation Services — Plans — 2026 — https://docs.llmhub.t-systems.net/plans/
  31. Cloudflare Workers — Pricing — 2026 — https://developers.cloudflare.com/workers/platform/pricing/
  32. Cloudflare D1 — Pricing — 2026 — https://developers.cloudflare.com/d1/platform/pricing/
  33. Cloudflare R2 — Pricing (Egress frei) — 2026 — https://developers.cloudflare.com/r2/pricing/