mini-corporatellm — Unternehmens-KI nach europäischem Recht

In einem Satz

Was ist mini-corporatellm — und warum?

Bevor das Dossier ins Detail geht: das Wichtigste in vier Fragen, ohne Fachjargon.

Was ist das?: Ein firmeneigener, kontrollierter Zugang zu KI-Modellen wie GPT und Claude — mit Protokoll, EU-Datenhaltung und Rechte-Verwaltung.
Welches Problem löst es?: Mitarbeiter nutzen KI längst heimlich mit Kundendaten. Ein Verbot verlagert das Risiko nur; dieses System holt es in einen kontrollierten Kanal zurück.
Wie soll ich es mir vorstellen?: Wie eine Schleuse am Werkstor: Jede Anfrage wird geprüft, registriert und bleibt in der EU — nichts verlässt unbemerkt das Haus.
Für wen?: Mittelständische Unternehmen, die KI erlauben wollen, ohne DSGVO, Betriebsrat und Haftung zu riskieren.

Das Problem

Der Mittelstand will KI — und darf sie nicht so nutzen, wie sie da ist.

Der Engpass ist nicht die Technik. Er ist organisatorisch: KI rechtssicher in den Betrieb zu bekommen, während Datenschutz, Betriebsrat und fehlende Compliance-Kapazität jeden Schritt bremsen.

41 %¹ der deutschen Firmen (ab 20 MA) nutzen 2026 KI — von 17 % in 2025

77 %¹ nennen Datenschutz als Adoptionsbarriere Nr. 1

bis 90 %² der Wissensarbeiter nutzen KI heimlich trotz Verbot (Schatten-KI)

70 %¹ nennen den Fachkräftemangel — niemand zum Aufbauen einer Governance

Die Nachfrage beschleunigt sich (Adoption 17 % → 41 % in einem Jahr), aber die größte Hürde ist nicht „Können wir KI?“, sondern „Dürfen wir KI mit unseren Daten?“. Datenschutz ist die meistgenannte Barriere, dicht gefolgt von Fachkräftemangel und rechtlicher Unsicherheit.¹

Schatten-KI (heute) vs. governter Zugang
	Schatten-KI (privater Account)	Governter Zugang (mini-corporatellm)
Vertrag	keiner	Auftragsverarbeitung mit dem Anbieter
Protokoll	keines	Audit-Log je Anfrage
Datenort	unbekannt	EU-Region, technisch erzwungen
Löschung	unmöglich	nachweisbar (Art. 17)
Kontrolle	keine	RBAC + Rate-Limit + Rollen

Das ist „Schatten-KI“ — das Leck, das ein Corporate LLM schließen soll: nicht ein neues Werkzeug zusätzlich, sondern die sanktionierte Alternative, die den Anreiz zum heimlichen Privat-Account beseitigt und den Datenfluss in einen kontrollierten, protokollierten Kanal zurückholt.

Der eigentliche Blocker ist Kapazität. Ohne Inhouse-Juristen bleibt die Rechtsgrundlagen-Prüfung liegen, ohne KI-Fachkräfte der governte Betrieb. Selbst ein williges Unternehmen kann DSGVO, BetrVG, NIS2 und den AI Act nicht gleichzeitig inhouse stemmen.¹

Die Rechtslage

Was ein deutsches Unternehmen 2026 wirklich beachten muss.

Drei Ebenen stapeln sich: der EU AI Act, die DSGVO mit dem Drittlandtransfer-Problem, und die deutsche Ebene (NIS2, DORA, BSI, Betriebsrat). Jede Aussage hier ist mit Quelle hinterlegt.

▸ EU AI Act — Rollen und Pflichten

Ein normaler unternehmensinterner KI-Assistent ist kein Hochrisiko-System. Er fällt standardmäßig in die Transparenz-Stufe (limited risk): die zentrale produktbezogene Pflicht ist die Offenlegung nach Art. 50, dass Nutzer mit KI interagieren bzw. dass Inhalte KI-generiert sind. Hinzu kommt — unabhängig von der Risiko-Stufe — die KI-Kompetenzpflicht nach Art. 4, die seit dem 02.02.2025 jeden Betreiber trifft (Personal muss im kompetenten KI-Einsatz geschult sein; Durchsetzung ab 08/2026). Sie ist organisatorisch: der Gateway flankiert sie über Audit und Offenlegung, erfüllt sie aber nicht.^3,4

Hochrisiko ist use-case-getrieben, nicht technologie-getrieben (Anhang III): erst wenn der Assistent z. B. Bewerber vorselektiert oder Kreditwürdigkeit bewertet, greifen die vollen Betreiberpflichten aus Art. 26 — menschliche Aufsicht, Protokollaufbewahrung ≥ 6 Monate, Information der Betroffenen.^5,6

Sanktionen: bis 35 Mio. € / 7 % (verbotene Praktiken), bis 15 Mio. € / 3 % (sonstige Verstöße), bis 7,5 Mio. € / 1 % (falsche Angaben gegenüber Behörden — hierunter fällt auch ein Verstoß gegen die KI-Kompetenzpflicht) — für KMU gilt jeweils der niedrigere der beiden Beträge. In Deutschland koordiniert die Bundesnetzagentur als zentrale Stelle die Marktüberwachung (Hybrid-Modell: sektorspezifische Behörden wie die BaFin bleiben für ihren Bereich zuständig); das Durchführungsgesetz zur KI-VO ist kabinettsbeschlossen (11.02.2026), aber noch nicht verabschiedet.^9,10

▸ DSGVO + Drittlandtransfer — ein Stapel, kein Schalter

Personenbezogene Daten an ein LLM zu senden ist erlaubt — aber nur, wenn der rechtliche Stapel gleichzeitig hält: eine Rechtsgrundlage (Art. 6, bei Beschäftigten- und Kundendaten mit dokumentierter Interessenabwägung), ein Auftragsverarbeitungs-Vertrag mit dem Anbieter (Art. 28), ein Übermittlungsmechanismus für jeden US-Schritt (Kapitel V: DPF, SCCs oder BCRs), ein Verzeichnis von Verarbeitungstätigkeiten und in den meisten LLM-Unternehmensfällen eine DSFA (Art. 35). Ein einziger fehlender Baustein macht den ganzen Fluss unrechtmäßig. Die EU-Region ist dabei kein Rechts-Baustein, sondern die technische Maßnahme, die den Kapitel-V-Schritt überhaupt erst vermeidbar macht.^{11,12,13,14,15}

▸ Deutsche Ebene — und der Betriebsrat

NIS-2 weitet den Kreis betroffener Unternehmen massiv aus — ~29.500 in 18 Sektoren, viele Mittelständler neu im Anwendungsbereich und oft ohne es zu wissen. Nach langer Verzögerung (die EU-Frist Okt 2024 wurde verpasst) ist das deutsche NIS-2-Umsetzungsgesetz seit dem 06.12.2025 in Kraft; die BSI-Registrierungsfrist ist am 06.03.2026 abgelaufen — wer im Anwendungsbereich liegt, ist bereits in der Pflicht.
DORA: für den Finanzsektor und dessen IT-Dienstleister direkt anwendbar seit 01/2025 — ein LLM-Gateway in dieser Kette ist mitbetroffen.
BSI C5 / AIC4: der De-facto-Standard für Cloud- bzw. KI-Cloud-Sicherheit in Deutschland; die Posture, die Käufer und Auditoren erwarten.
BetrVG § 87 Abs. 1 Nr. 6: die Einführung von KI-Tools löst echte Mitbestimmung aus, sobald das Tool zur Verhaltens-/Leistungskontrolle objektiv geeignet ist — Maßstab ist die objektive Eignung, nicht die Absicht des Arbeitgebers; dass er Nutzungsdaten einsehen kann, ist das entscheidende Indiz.

Der ehrliche Kern

EU-Datenresidenz ist eine Standort-Kontrolle, kein Gerichtsbarkeits-Schutz.

Der DACH-Markt verkauft „DSGVO-konform / deutsche Server“ als Differenzierer. Das ist ein Hygienefaktor, kein Vorsprung — und es verschweigt die eigentliche Grenze.

mini-corporatellm ist Stufe 1 (Datenresidenz). Der Sprung auf Stufe 2 oder 3 ist im Design vorgesehen, kein Neubau.

Zwei verschiedene US-Instrumente greifen auf Daten US-kontrollierter Anbieter zu — auch wenn diese auf EU-Servern liegen. FISA § 702 erlaubt US-Geheimdiensten den Zugriff ohne Richterspruch (der primäre Risiko-Vektor; keine bilateralen Ausnahmen). Der CLOUD Act verpflichtet US-Anbieter auf behördliche Anfrage zur Herausgabe, lässt aber bilaterale Abkommen als Korrektiv zu. Gerichtsbarkeit folgt dem Konzern, nicht dem Server-Standort. Eine „EU-Region“ reduziert die Routine-Exposition, hebt diesen rechtlichen Zwangszugriff aber nicht auf.²⁴

Die Lösung

Ein Kontrollpunkt, der die Pflichten in Technik übersetzt.

Compliance ist hier das Produkt, nicht ein Feature. Jede Fähigkeit des Gateways erfüllt eine konkrete rechtliche Pflicht — das Governance-Werkzeug IST die Nachweis-Schicht.

Jede Anfrage passiert verifizierte Identität, den 451-Residenz-Chokepoint, Rate-Limit und Audit-Log, bevor sie ein EU-residentes Modell erreicht. Ein US-Direkt-Endpunkt wird vor dem Egress mit HTTP 451 blockiert.

Ehrlich gesagt: ja, ein Corporate LLM ist ein Wrapper über mehreren Anbietern. Sein Wert steckt in dem, was der Gateway erzwingt: verifizierte Identität, einen Residenz-Chokepoint vor jedem Egress, ein Audit-Log über jede Anfrage und eine nachweisbare Löschung. Und darin, dass dieses System hier läuft und sich Stück für Stück nachprüfen lässt.

Fähigkeit → erfüllte AI-Act-Pflicht
Fähigkeit im Gateway	Erfüllte Pflicht
Unveränderliches Logging (Metadaten)	Art. 26(6) Protokollaufbewahrung ≥ 6 Monate
RBAC + verifizierte Identität	Art. 26(1) Nutzung gemäß Vorgaben; verhindert Art.-25-Umklassifizierung
Menschliche-Aufsicht-Haken	Art. 14 wirksame Aufsicht
KI-Offenlegung am Output	Art. 50 Transparenzpflicht

Fähigkeit → DSGVO-Baustein
Fähigkeit im Gateway	DSGVO-Baustein
EU-Region-Erzwingung (451-Chokepoint)	Kap. V Übermittlung minimiert; Datenresidenz
Provable Löschung (erase-vs-retain)	Art. 17 + Art. 17(3): Inhalt gelöscht, Audit/Billing pseudonymisiert
Auftragsverarbeitung am Anbieter	Art. 28 AVV + Sub-Prozessor-Kette
Mandanten-Isolation	Zweckbindung, Vertraulichkeit (DSK-Gewährleistungsziele)

Gemessen an der Corporate-LLM-Definition des Marktes (Rechtssicheres Hosting · Multi-Modell-Aggregator · RAG mit eigener Vektor-Datenbank · Wissens-Bot · Workspace) deckt dieses System den technischen Kern ab: den Multi-Modell-Gateway, die eigene Vektor-DB-RAG (ausdrücklich gegen „PDF ins Custom-GPT laden“), EU-Hosting und eine Agenten-Runtime. Was fehlt, steht ehrlich unter „Grenzen“.

Jeder Mandant ist über verifizierte Identität auf eigene, isolierte Daten beschränkt; mandantenübergreifender Zugriff ist blockiert — live nachgewiesen.

Live-Demo

Jede Behauptung ist klickbar.

Kein Screenshot-Theater. Die Konsole spricht mit dem echten, deployten System über einen rate-limitierten Demo-Mandanten.

Gateway + 451-Chokepoint: EU-Modell antwortet; ein US-Direkt-Endpunkt wird vor dem Egress mit HTTP 451 blockiert.
Agent: Plan → Tool-Aufruf → Ergebnis → Antwort, jeder Schritt durch den Residenz-Gate.
RAG: eine deutsche Frage, beantwortet aus hochgeladenem Firmendokument mit Quellen-Zitat.
Audit + Löschung: eine Anfrage erzeugt eine Metadaten-Zeile; eine Löschung entfernt Inhalt und behält den Art.-30-Nachweis.
Admin-Konsole: Login mit API-Key → Mandant, Nutzer, Token-Verbrauch, Audit-Log, Rollen.

Eine deutsche Frage wird gegen das EU-residente Firmenwissen beantwortet — mit Quellen-Zitat.

Der Agent plant, ruft Werkzeuge auf und iteriert zurück zum Planer — jeder Schritt passiert den EU-Residenz-Gate.

Health wartet...

Residenz wartet...

Bereit.

Grenzen & Härtung

Was für Produktion fehlt — ohne Schönfärberei.

Ein Demo-System ehrlich von einem Produkt zu trennen ist selbst ein Vertrauens-Signal. Hier sind die offenen Punkte aus dem Build-Logbuch.

Quota ist ein nachlaufender Circuit-Breaker (Audit-Log-SUM), keine echte atomare Quote — bei Lastspitzen kann sie kurz überschießen.
Metering-Rollup + Durability für Abrechnung in großem Maßstab stehen aus.
Sub-Prozessor-Kaskade (vollständige AVV-Kette bis zum US-Anbieter) ist dokumentiert, nicht durchverhandelt.
Backups / Point-in-Time-Recovery, Observability-PII-Scrubbing und Session-Owner-SPOF sind benannte, offene Härtungspunkte.
Anthropic-Live-Routing ist code-fertig, aber nicht live verifiziert (kein API-Key; Claude EU-resident nur über Bedrock/Vertex).

Der Weg zur Produktion ist Härtung, nicht Neubau: echte atomare Quota, durable Metering, vollständige Sub-Prozessor-Verträge, Backups/PITR — und für den Verkauf die Zertifizierungen, die der Markt verlangt (ISO 27001, SOC 2, BSI C5).²¹

Vom Demo zum Produkt

Was aus diesem Beweis ein verkaufbares Produkt macht.

Das hier ist ein gebauter Beweis, kein fertiges Produkt. Was bis dorthin fehlt, ist Härtung und Zertifizierung — die Architektur dafür steht bereits. So sieht die Zielarchitektur aus.

Der gebaute Kern (durchgezogen) trägt die Produkt-Schichten (gestrichelt = Vision).

Der Kern steht: vier Module sind live und einzeln nachprüfbar. Was ein verkaufbares Produkt zusätzlich braucht, ist bekannt und benannt: Härtung, Verträge und Audits. Das ist solides Handwerk.

Jedes Modul — vom Demo-Beweis zum Produkt
Modul (heute live)	Produktisiert
Gateway	Mandanten-Self-Service, Modell-Katalog, SLA-gestütztes Routing
Agent + RAG	Wissens-Bot-Oberfläche, Dokument-Connectoren, Auswertungen
EU-Datenschicht	Multi-Region-EU, Backups/PITR, durable Metering
Multi-Mandant + Governance	Admin-Self-Service, Reporting, Zertifikats-Nachweise

Geschäftsmodell

Der productized Corporate LLM — verkauft wird Compliance, nicht Tokens.

Token-Preise fielen 2025→2026 um rund 80 %. Wer auf Token-Marge setzt, verliert ein Rennen gegen null. Die belastbare Marge sitzt in der Governance- und Compliance-Schicht.

~25 €²⁶ pro Sitz/Monat (Plattform, Tokens separat) — der Marktanker (Langdock Business)

~80 %²⁷ Token-Preisverfall allein 2025 (modellklassen-abhängig) — Markup-Modelle kommodifizieren

+5 %²⁸ Pass-through-Markup (Requesty, vgl. OpenRouter) = der kommodifizierte Boden

Die strategische Gabel ist die Risiko-Haltung, nicht das Volumen. Pass-through-plus-Marge ist dünn und risikolos, kommodifiziert aber schnell. Committed-Capacity-Arbitrage bringt echte Marge, trägt dafür Auslastungsrisiko und braucht Skala. Wer dem Kunden einen Festpreis gibt und oben metered einkauft, betreibt genau diese Arbitrage.²⁹

Hygienefaktor-Warnung: „DSGVO-konform / deutsche Server / kein Vendor-Lock-in“ ist im DACH-Markt der universelle Basis-Claim — dadurch kein Differenzierer. Der Vorsprung ist ein gebautes, nachprüfbares System plus die ehrliche L1/L2-Einordnung. Der Souveränitäts-Slogan allein genügt nicht. Scharfes Segment mit echtem Bedarf: Schweigepflicht-Berufe (Kanzleien, Steuerberatung, Praxen).³⁰

Kosten im Betrieb

Die Infrastruktur ist nicht die Kostenfrage — die Tokens sind es.

Auf Cloudflare Workers liegt die Gateway-Infrastruktur bei jeder Mandantenzahl unter ~1 % der Token-Kosten. Die Marge lebt im Sitz-Preis, nicht im Pass-through.

Modell: „modester“ Mandant = 20 Nutzer, ~40 Mio. Tokens/Monat, ~13,2k Gateway-Requests, Pass-through zum GPT-4o-Listenpreis (~4,75 $/1 Mio. Tokens, blended 70/30). Eine gemeinsame Worker-Deployment.
Skala	Infra/Monat (Cloudflare)	Token-Kosten/Monat (Pass-through, GPT-4o)	Infra-Anteil
10 Mandanten (400 Mio. Tok.)	~5 € (im Basis-Kontingent)	~1.900 $	< 0,3 %
100 Mandanten (4 Mrd. Tok.)	~5–15 €	~19.000 $	< 0,1 %
1.000 Mandanten (40 Mrd. Tok.)	~10–30 €	~190.000 $	< 0,02 %

Unit-Preise (offizielle Cloudflare-Docs, 2026): Workers Paid 5 $/Monat inkl. 10 Mio. Requests; D1 25 Mrd. gelesene Zeilen inkl.; R2 mit kostenlosem Egress (Durable-Object-Requests werden separat gemessen). Selbst bei 1.000 Mandanten bleibt der Infra-Posten — getrieben von D1-Writes (Audit-Logs) und Durable-Object-Dauer — zweistellig im Euro-Bereich und verschwindet gegen die Token-Kosten.^31,32,33

Roadmap zur Produktreife

Vom L1-Beweis zum verkaufbaren Produkt.

Härtung: echte atomare Quota, durable Metering, Backups/PITR, Observability-PII-Scrubbing, Session-SPOF beseitigen.
Verträge: vollständige AVV-/Sub-Prozessor-Kette bis zum Modell-Anbieter; ROPA-Vorlagen je Use-Case.
Zertifizierung: ISO 27001, SOC 2 Type II, BSI C5 — die Kaufkriterien des Marktes.
L1→L2-Option: EU-eigenes Modell (Mistral/Aleph Alpha) + EU-Cloud + kundengehaltene Schlüssel als Konfigurations-Schalter für Souveränitäts-Kunden.
Produkt-Oberfläche: Workspace, Wissens-Bot in Schulungs-Tools, Self-Service-Onboarding für den Mittelstand.

Über dieses Projekt

Gebaut, nicht behauptet.

Vier live nachprüfbare Module in der EU-residenten Cloudflare-Umgebung.

mini-corporatellm ist eine eigenständige, von Grund auf selbst gebaute Implementierung — original-Code auf einem produktionstauglichen Stack: Bun, TypeScript, Hono auf Cloudflare Workers, D1, R2, Durable Objects. Das ist eine von mehreren tragfähigen Wahlen — Python/FastAPI, Go, Node oder AWS/Azure lösen dieselbe Aufgabe; hier fiel die Entscheidung auf EU-Residenz und niedrige Betriebskosten. Vier Module (Gateway, Agent + RAG, EU-Datenschicht, Multi-Mandant + Governance) sind live und einzeln nachprüfbar.

Die Gegenachse zum Markt-Standard ist bewusst: nicht „wir haben die Kategorie erfunden“, sondern „hier ist das gebaute System — sieh es dir an und brich es“. Jede Zahl auf dieser Seite trägt eine Quelle; jede Fähigkeit eine Live-Probe.

Gezeigter Beweis statt Standort und Druck.
Die Leitlinie dieses Projekts

Nachweise

Quellen

Bitkom KI-Studie 2026 — 2026 — https://www.bitkom.org/Presse/Presseinformation/Unternehmen-KI-Einsatz-zahlen
Proliance — Schatten-KI für KMU — 2026 — https://www.proliance.ai/blog/schatten-ki
EU AI Act, Art. 50 (Transparenz) — 2024/1689 — https://artificialintelligenceact.eu/article/50/
EU AI Act, Art. 4 (KI-Kompetenz) — 2024/1689 — https://artificialintelligenceact.eu/article/4/
EU AI Act, Art. 6 + Anhang III (Hochrisiko) — 2024/1689 — https://artificialintelligenceact.eu/article/6/
EU AI Act, Art. 26 (Pflichten der Betreiber) — 2024/1689 — https://artificialintelligenceact.eu/article/26/
EU AI Act — Anwendungs-Zeitplan — 2026 — https://artificialintelligenceact.eu/implementation-timeline/
EU Digital Omnibus (AI) — Kommissionsvorschlag — 2025-11-19 — https://digital-strategy.ec.europa.eu/en/library/digital-omnibus-ai-regulation-proposal
EU AI Act, Art. 99 (Sanktionen) — 2024/1689 — https://artificialintelligenceact.eu/article/99/
Bundesregierung — Durchführungsgesetz zur KI-VO (KI-MIG) — 2026-02-11 — https://bmds.bund.de/service/gesetzgebungsverfahren/gesetz-zur-durchfuehrung-der-ki-verordnung
DSGVO Art. 28 (Auftragsverarbeitung) — DSGVO — https://dsgvo-gesetz.de/art-28-dsgvo/
DSGVO Art. 44 ff. (Drittlandübermittlung) — DSGVO — https://dsgvo-gesetz.de/art-44-dsgvo/
DSGVO Art. 17 (Recht auf Löschung) — DSGVO — https://dsgvo-gesetz.de/art-17-dsgvo/
EDPB — Stellungnahme 28/2024 (KI-Modelle) — 2024-12-17 — https://www.edpb.europa.eu/our-work-tools/our-documents/opinion-board-art-64/opinion-282024-certain-data-protection-aspects_en
DSK — Orientierungshilfe KI und Datenschutz — 2024-05-06 — https://www.datenschutzkonferenz-online.de/media/oh/20240506_DSK_Orientierungshilfe_KI_und_Datenschutz.pdf
IAPP — EuG weist Latombe-Klage ab, DPF bestätigt — 2025-09-03 — https://iapp.org/news/a/european-general-court-dismisses-latombe-challenge-upholds-eu-us-data-privacy-framework
CDT — Folgen der PCLOB-Entlassungen für das DPF — 2025 — https://cdt.org/insights/what-the-pclob-firings-mean-for-the-eu-us-data-privacy-framework/
EuGH C-311/18 (Schrems II) — 2020-07-16 — https://curia.europa.eu/juris/liste.jsf?num=C-311/18
Bundesregierung — NIS-2-Umsetzungsgesetz — 2025-12-06 — https://www.bundesregierung.de/breg-de/aktuelles/nis-2-richtlinie-deutschland-2373174
BaFin — DORA Überblick — 2025-01-17 — https://www.bafin.de/DE/unternehmen-maerkte/aufsicht/alle-unternehmen/dora/ueberblick/ueberblick_node.html
BSI — Kriterienkatalog C5 — 2026 — https://www.bsi.bund.de/DE/Themen/Unternehmen-und-Organisationen/Informationen-und-Empfehlungen/Empfehlungen-nach-Angriffszielen/Cloud-Computing/Kriterienkatalog-C5/c5_node.html
BSI — Generative KI-Modelle: Chancen und Risiken — 2026-01-21 — https://www.bsi.bund.de/SharedDocs/Downloads/DE/BSI/KI/Generative_KI-Modelle.pdf
Bird & Bird — erstes Urteil zu Betriebsrats-Rechten bei KI — 2024 — https://www.twobirds.com/de/insights/2024/germany/erstes-urteil-zu-rechten-des-betriebsrats-bei-einsatz-von-kuenstlicher-intelligenz
EuroToolKit — US CLOUD Act + FISA 702 — 2025 — https://www.eurotoolkit.eu/blog/us-cloud-act-fisa-702
Anthropic — Data residency (API us/global) — 2026 — https://platform.claude.com/docs/en/build-with-claude/data-residency
ki-company.ai — Langdock im Test (Preise) — 2026 — https://www.ki-company.ai/en/blog-beitraege/langdock-put-to-the-test-the-privacy-compliant-ai-tool-for-companies
SiliconData — LLM cost per token (Preisverfall) — 2026 — https://www.silicondata.com/blog/llm-cost-per-token
Requesty — Pricing (EU, +5%) — 2026 — https://www.requesty.ai/pricing
Microsoft Learn — Azure OpenAI Provisioned Throughput — 2026 — https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/provisioned-throughput
T-Systems AI Foundation Services — Plans — 2026 — https://docs.llmhub.t-systems.net/plans/
Cloudflare Workers — Pricing — 2026 — https://developers.cloudflare.com/workers/platform/pricing/
Cloudflare D1 — Pricing — 2026 — https://developers.cloudflare.com/d1/platform/pricing/
Cloudflare R2 — Pricing (Egress frei) — 2026 — https://developers.cloudflare.com/r2/pricing/