Microsoft Foundry verstehen: GPT-5, Reasoning-Modelle und der Agent-Stack im Überblick

Microsoft Foundry (bis Anfang 2026 noch Azure AI Foundry) hat sich in zwei Jahren von einer Modell-Spielwiese zu Microsofts zentraler Enterprise-KI-Plattform entwickelt. Dieser Post erklärt die GPT-5-Reihe, die Reasoning-Modelle und den Agent Service — ohne Marketing-Filter, mit realistischen Mittelstand-Anwendungsfällen.

Wer sich mit KI in Microsoft-Umgebungen beschäftigt, kennt das Tempo: Was im November 2023 als „Azure AI Studio“ startete, hieß ein Jahr später „Azure AI Foundry“ — und trägt seit dem 1. Januar 2026 den offiziellen Namen Microsoft Foundry. Mit jedem Umbau kamen substanzielle Funktionserweiterungen dazu. Heute ist Foundry nicht mehr nur ein Tooling-Bündel rund um OpenAI-Modelle, sondern Microsofts zentrale Plattform für alles, was über einen einfachen Chat-Bot hinausgeht.

Für mittelständische Unternehmen, die KI ernsthaft einsetzen wollen — nicht nur als Spielerei in Word oder Teams — wird Foundry damit relevant. Dieser Post erklärt, was die Plattform heute kann, welche Modelle aktuell verfügbar sind und wann sich der Einsatz tatsächlich lohnt.

Was Microsoft Foundry heute ist

Im Kern ist Foundry eine Plattform, die drei Dinge bündelt: einen breiten Modell-Katalog, einen Agent-Stack für autonome KI-Anwendungen und die Enterprise-Werkzeuge drumherum — Governance, Sicherheit, Observability, Deployment-Optionen.

Microsoft beschreibt die Plattform als „einheitliche, interoperable Umgebung für KI-Anwendungen und Agenten“. Hinter dieser Marketing-Formulierung steckt eine konkrete Realität: Wer mit Foundry arbeitet, hat Zugriff auf

den Modell-Katalog mit Modellen von OpenAI, Microsoft selbst, Meta, Mistral und seit Ende 2025 auch Anthropic
den Foundry Agent Service für persistente, werkzeugfähige KI-Agenten
Prompt Flow für die orchestrierte Komposition komplexer KI-Workflows
Content Safety zur Absicherung gegen Prompt Injection, Jailbreaks und unerwünschte Ausgaben
Evaluierungs- und Observability-Werkzeuge für systematische Qualitätsmessung
Foundry IQ und Foundry Tools für strukturierte Integration mit Unternehmensdaten und externen Systemen

Mit der Umbenennung zu „Microsoft Foundry“ hat Microsoft auch eine architektonische Neuordnung vollzogen. Die ältere Variante existiert weiter als „Microsoft Foundry Classic“ — wer bestehende Projekte hat, sollte den Migrationspfad kennen. Neue Vorhaben sollten direkt auf der neuen Architektur aufsetzen.

Der Modell-Katalog: Wo die GPT-5-Reihe heute steht

Der größte Sprung in den letzten Monaten ist die GPT-5-Reihe. Im Unterschied zur GPT-4-Generation, in der Reasoning- und Standardmodelle noch getrennt waren (gpt-4o vs. o1 vs. o3), führt GPT-5 beide Welten zusammen — mit konfigurierbarer Reasoning-Tiefe.

GPT-5 (Basisversion) — Der Einstieg in die GPT-5-Reihe, GA seit 2025. Frontier-Modell mit eingebauten Agentic-Fähigkeiten: mehrstufige Werkzeugnutzung, lange Aktionsketten, transparente und auditierbare Zwischenschritte. Sinnvoll als Standardmodell für anspruchsvolle Aufgaben.

GPT-5.1 (verfügbar seit November 2025) — Erweitert die Reihe um einen Kontext von 400.000 Token Input und 128.000 Token Output. gpt-5.1 selbst kommt mit Reasoning standardmäßig aus, gpt-5.1-chat aktiviert Reasoning-Fähigkeiten zusätzlich. Die Variante gpt-5.1-codex-max ist speziell für Coding-Aufgaben gebaut und unterstützt eine erweiterte Reasoning-Intensität (reasoning_effort: xhigh).

GPT-5.2 — Auf Enterprise-Agent-Szenarien zugeschnitten: strukturierte, auditierbare Ausgaben, verlässliche Werkzeugnutzung, gut integrierte Steuerung. Wer Agenten produktiv einsetzen will, beginnt häufig hier.

GPT-5.4 (verfügbar seit März 2026) — Kombination aus stärkerem Reasoning und eingebauter Computer-Use-Fähigkeit. Kann mehrstufige Engineering-Aufgaben durchführen, Werkzeuge orchestrieren und über Sitzungen hinweg konsistent arbeiten. Für Automatisierungs-Szenarien mit echter Aktion (nicht nur Antwort-Generierung) ist das die aktuell interessanteste Stufe.

GPT-5.5 und GPT-5.5 Pro — Aktuelle Frontier-Stufe. GPT-5.5 ist auf nachhaltige, hochwertige Workflows in Profi-Kontexten ausgelegt — lange Dokumente, große Codebasen, Multi-Session-Verläufe ohne Kontextverlust. GPT-5.5 Pro erweitert die Reasoning-Tiefe für die anspruchsvollsten Aufgaben.

Daneben bleiben die separaten Reasoning-Modelle (o3, o3-mini, o4-mini, o3-deep-research) verfügbar — letzteres ausschließlich über den Foundry Agent Service. Diese Modelle haben weiterhin ihre Berechtigung, etwa für Szenarien, in denen man eine ganz bestimmte Reasoning-Charakteristik gegenüber breiter Allzweck-Performance bevorzugt.

Über OpenAI hinaus. Seit Ende 2025 sind auch Anthropic-Modelle (Claude-Familie) im Foundry-Katalog. Dazu kommen Phi-4 und neuere Phi-Modelle aus dem Hause Microsoft (Small Language Models, sehr günstig für interne Aufgaben), Llama-Modelle von Meta und Mistral-Modelle. Insgesamt umfasst der Katalog mehrere tausend Modelle — die Auswahl ist real, kein Marketing.

Welches Modell für welchen Zweck?

Die schiere Anzahl wirkt erst überfordernd. In der Praxis lassen sich die meisten Szenarien einer überschaubaren Anzahl Kategorien zuordnen:

Anwendungsfall	Empfohlene Modellklasse
Allgemeine Textaufgaben, Chat, Zusammenfassung	GPT-5 oder GPT-5.1 (Standard)
Tool-nutzende Agenten, strukturierte Ausgaben	GPT-5.2
Komplexe mehrstufige Aufgaben mit Aktionen	GPT-5.4
Höchste Qualität, anspruchsvolle Workflows	GPT-5.5 / 5.5 Pro
Coding und Engineering	GPT-5.1-codex-max
Reine Reasoning-Aufgaben (Mathematik, Logik)	o3 / o4-mini
Tiefenrecherche mit Web-Abfragen	o3-deep-research (Agent Service)
Interne Aufgaben mit knappem Budget	Phi-4 oder Llama
Anthropic-Stilbevorzugung	Claude-Modelle

Die Faustregel: Anfangen mit dem für den Use Case naheliegendsten GPT-5-Modell, dann anhand realer Evaluierung optimieren. Foundry liefert die Evaluierungs-Werkzeuge dafür mit.

Der Agent Service: Was die Plattform produktiv macht

Der Foundry Agent Service ist die Komponente, die Microsoft Foundry von einer reinen Modell-API abhebt. Seit der Umstellung auf die neue Architektur basiert er auf der Responses-API — einem Aufrufmuster, das speziell für mehrstufige, werkzeugnutzende Agenten gebaut ist.

Konkret leistet der Agent Service:

Persistente Agenten. Anders als bei Einzel-API-Aufrufen behält ein Agent seinen Zustand über Sessions hinweg — Konversationshistorie, abgerufene Dateien, vorherige Werkzeugausgaben.

Werkzeugnutzung mit Auditierbarkeit. Agenten können auf definierte Werkzeuge zugreifen: Azure Functions, externe REST-APIs, Bing Search, Wissensdatenbanken, eigene Vector Stores. Jeder Werkzeugaufruf ist protokolliert und nachvollziehbar.

Computer Use (Preview). Eine spezialisierte Modellvariante kann mit Anwendungsoberflächen interagieren — Formulare ausfüllen, durch Web-Anwendungen navigieren, in Office-Anwendungen arbeiten. Das ist weiterhin Preview, aber die Möglichkeiten gehen deutlich über klassische API-Automatisierung hinaus.

MCP-Integration. Foundry unterstützt das Model Context Protocol einschließlich OAuth-Passthrough. Das bedeutet: Externe Tools, die nach MCP-Standard angebunden sind, können direkt im Agent-Kontext verwendet werden — mit korrekter Authentifizierung im Namen des Endnutzers.

Voice Live (Preview). Echtzeit-Sprachinteraktion für Agenten — relevant für Service- und Support-Szenarien.

Integrierte Memory-Funktion. Kurzzeit- und Langzeitgedächtnis als verwaltete Bausteine, abrufbar über die Agent-API. (Kostet ab Juni 2026 extra; Details siehe Preise.)

Ein konkretes Beispiel: Ein Agent, der jeden Morgen die eingegangenen Lieferantenrechnungen aus SharePoint liest, mit den offenen Bestellungen im ERP abgleicht, Abweichungen markiert und einen kurzen Bericht in einen Teams-Kanal postet. Vor zwei Jahren hätte das ein klassisches Integrationsprojekt erfordert. Mit Foundry und einem GPT-5.2- oder GPT-5.4-basierten Agenten ist es eine Konfigurationsaufgabe — kein Engineering-Projekt.

Was sich mit Foundry alles bauen lässt — vom Chatbot bis zur eigenen Plattform

Der entscheidende Unterschied zu fertigen KI-Produkten: Foundry liefert die Bausteine, nicht die fertige Anwendung. Was Sie damit bauen, ist eine Frage Ihrer Anforderungen und Ihrer Entwicklungsbereitschaft — nicht eine Frage der Plattformgrenzen. Im Grunde lässt sich alles entwickeln, was mit Sprache, Wissen und Aktion zu tun hat. Eine Auswahl der Klassen, die in der Praxis tatsächlich relevant werden:

Foundry als API-Plattform für Eigenentwicklungen — Der grundlegende Modus: Foundry stellt die Modelle, Agenten und Werkzeuge über REST-APIs und SDKs (Python, .NET, JavaScript, Java) bereit. Eigene Anwendungen — Web-Apps, mobile Apps, Backend-Services, Integrationen — sprechen Foundry direkt an. Sie behalten die volle Kontrolle über Frontend, Datenmodell und Architektur und nutzen Foundry als Inferenz- und Agent-Backend. Authentifizierung über Entra ID, Abrechnung über Azure, Governance über Ihre bestehenden Azure-Richtlinien. Das ist die Variante, mit der die meisten ernsthaften Projekte starten.

Interne Chatbots und Q&A-Assistenten — Der klassische Einstieg. Ein Bot, der Mitarbeiterfragen zu Richtlinien, IT-Themen, HR-Prozessen oder Branchenwissen beantwortet. Aufgebaut auf eigenen Dokumenten, mit Quellenangabe, ohne dass Daten den Azure-Tenant verlassen. Erste Version oft in zwei bis vier Wochen produktiv.

RAG-basierte Wissens-Systeme — Die nächste Stufe: Das System indiziert SharePoint, Confluence, technische Dokumentation, Vertragsarchive, Wikis und externe Datenquellen. Antworten kommen mit Bezug auf konkrete Quellen und Vertrauensbewertung. Foundry IQ stellt die Konnektoren, Vector Stores die Indizierung, GPT-5 die Antwortqualität.

Eigene branchenspezifische Copilots — Microsoft liefert Copilot für Office, Sales und Service. Wer mehr braucht, baut sich seinen eigenen: den „Stadtwerke-Copilot“ für Netzbetriebs-Mitarbeitende, den „Servicetechniker-Copilot“ mit Anbindung an Wartungsverläufe und Ersatzteilkataloge, den „Einkaufs-Copilot“ mit Lieferantendaten und Vertragshistorie. Eingebettet in Teams, in eigene Web-Anwendungen oder in mobile Apps.

Agenten und Agentic AI — die zentrale neue Kategorie — Der Unterschied zu klassischen Chatbots ist fundamental. Ein Agent antwortet nicht nur, er handelt. Er plant mehrstufige Aufgaben, ruft Werkzeuge auf, prüft Zwischenergebnisse, korrigiert sich selbst und arbeitet auf ein definiertes Ziel hin. Foundry liefert mit dem Agent Service die Laufzeitumgebung, mit GPT-5.2 und GPT-5.4 die Modelle und mit der Responses-API die Orchestrierungs-Logik. Beispiele:

Ein Bestell-Agent, der eine Anforderung erhält, im ERP die Verfügbarkeit prüft, beim Lieferanten ein Angebot anfragt, das Ergebnis im Genehmigungssystem vorbereitet und den Antragsteller informiert
Ein Support-Triage-Agent, der eingehende Tickets klassifiziert, eine erste Diagnose stellt, ähnliche Vorfälle aus der Wissensdatenbank zieht und an die richtige Fachgruppe weiterleitet
Ein Vertriebs-Recherche-Agent, der zu einem Lead aktuelle Informationen aus Web, CRM und internen Quellen zusammenträgt und ein strukturiertes Briefing-Dokument erzeugt

Multi-Agent-Systeme — Agenten, die zusammenarbeiten — Die nächste Komplexitätsstufe: mehrere spezialisierte Agenten, die kooperieren. Ein Recherche-Agent sammelt Informationen, ein Analyse-Agent bewertet sie, ein Schreib-Agent formuliert das Ergebnis, ein Review-Agent prüft auf Konsistenz. Jeder Agent hat seine Rolle, seine Werkzeuge und seine Zugriffsrechte. Über den Foundry Agent Service lassen sich solche Konstellationen aufbauen, orchestrieren und beobachten — mit vollständigem Audit-Trail für jede einzelne Entscheidung.

Autonom arbeitende, persistente Agenten — Agenten, die nicht erst auf Anstoß warten, sondern eigenständig laufen. Sie überwachen Posteingänge, prüfen Datenquellen, reagieren auf Ereignisse und führen Aktionen aus, ohne dass jedes Mal eine menschliche Auslösung nötig ist. Mit der integrierten Memory-Funktion behalten sie Kontext über lange Zeiträume — Wochen, Monate, projektbezogen.

Dokumenten-Verarbeitungs-Pipelines — Automatisierte Verarbeitung großer Mengen unstrukturierter Dokumente: Rechnungen, Verträge, Schadensmeldungen, technische Berichte, Behördenanträge. Document Intelligence für die Vorverarbeitung, GPT-5.2 für die strukturierte Extraktion, definierte Ausgabeschemata für die Weiterverarbeitung in ERP, DMS oder Datenwarenhaus.

Voice-Assistenten und Sprach-Anwendungen — Mit Voice Live lassen sich Sprachassistenten bauen, die für Hotline-Vorqualifizierung, interne Servicedesks oder Außendienst-Szenarien geeignet sind. Echtzeitfähig, mit Tool-Calling und Kontextkontinuität über mehrere Gesprächsabschnitte hinweg.

Computer-Use-Automatisierungen — Agenten, die mit Anwendungsoberflächen interagieren statt mit APIs. Genau dort, wo klassische RPA an ihre Grenzen kommt — bei dynamischen Web-Anwendungen ohne API, bei Spezialsoftware ohne Schnittstellen, bei manuellen Routinetätigkeiten — kann ein Computer-Use-Agent (mit GPT-5.4) die nächste Generation der Prozessautomatisierung übernehmen.

Coding-Assistenten und Entwickler-Werkzeuge — Eigene Coding-Assistenten, die auf interne Code-Basen, Architekturentscheidungen und Coding-Standards zugeschnitten sind. Mit GPT-5.1-codex-max steht ein Modell zur Verfügung, das speziell auf Engineering-Aufgaben optimiert ist — und das, ohne Quellcode an externe Anbieter zu schicken.

Eigene KI-Plattformen und SaaS-Produkte — Wer KI nicht nur intern einsetzen, sondern in eigene Produkte einbauen will, kann auf Foundry aufsetzen. Eine Branchenlösung, ein internes Werkzeug für Tochterunternehmen, ein eigenes SaaS-Angebot mit KI-Kern — Foundry bietet die Modelle, das Inferenz-Hosting, die Sicherheits- und Governance-Werkzeuge. Was Sie als Anbieter darum herumbauen, ist Ihre Wertschöpfung.

Multimodale Anwendungen — Die GPT-5-Modelle verarbeiten nicht nur Text, sondern auch Bilder, Audio und perspektivisch Video. Schadensaufnahmen analysieren, Qualitätskontrolle auf Basis von Fotos, Sprachprotokolle transkribieren und auswerten, Marketing-Visuals generieren — alles innerhalb derselben Plattform.

Eigene Fine-Tunes für Spezialanwendungen — Wo allgemeine Modelle nicht genau genug sind, lassen sich auf Foundry eigene Fine-Tunes erstellen: auf branchenspezifischer Terminologie, internen Stilrichtlinien, regulatorischen Vorgaben oder bestimmten Antwortmustern. Damit lassen sich Modelle für sehr enge Anwendungsfelder gezielt schärfen.

Embedded-Intelligence in bestehende Produkte — Wer bereits eine Anwendung oder ein Produkt im Markt hat, kann KI-Funktionen über Foundry integrieren — als zusätzliche Schicht, ohne die bestehende Architektur umzubauen. Inferenz-Aufrufe, Agent-Orchestrierung und Governance laufen in Azure, die eigene Anwendung bleibt unverändert.

Die zentrale Aussage: Foundry ist eine Entwicklungsplattform, keine zugekaufte Funktion. Wer KI als strategisches Werkzeug betrachtet — nicht als externes Produkt, das man monatlich lizenziert — findet hier die Bausteine, um eigene Lösungen passgenau zu bauen. Mit allen Implikationen: mehr Gestaltungsspielraum, aber auch mehr Verantwortung für Konzeption, Betrieb und Weiterentwicklung.

Abgrenzung zu Azure OpenAI Classic und Microsoft 365 Copilot

Drei Begriffe, drei verschiedene Dinge — die Verwirrung ist Standard.

Aspekt	Foundry (neu)	Foundry Classic / Azure OpenAI	M365 Copilot
Was es ist	Plattform für eigene KI-Apps und Agenten	Direkter API-Zugriff auf Modelle	Fertige KI-Assistenten in Office-Apps
Zielgruppe	Entwickler, IT-Architekten	Entwickler, schnelle API-Integration	Endnutzer
Modelle	Mehrere tausend, Multi-Vendor	Primär OpenAI	GPT-Modelle im Hintergrund
Governance	Vollständig konfigurierbar	Basis	Über M365-Tenant geregelt
Eigene Daten	Über Foundry IQ und Vector Stores	Manuell, eigenverantwortlich	Automatisch über Graph

Eine einfache Entscheidungsregel:

M365 Copilot ist die richtige Wahl, wenn die Anwender im Vordergrund stehen und Office-, Teams- oder Outlook-Integration der Hauptanwendungsfall ist
Foundry Classic / Azure OpenAI reicht für einzelne Anwendungen mit klar definiertem Modell-Bedarf
Microsoft Foundry (neu) wird relevant, sobald mehrere KI-Anwendungen koordiniert werden sollen, eigene Agenten gebaut werden oder Governance über mehrere Use Cases hinweg gleich aussehen muss

Typische Anwendungsszenarien für den Mittelstand

Wo lohnt sich Foundry konkret? Vier Szenarien, die in der Beratungspraxis regelmäßig auftauchen:

Internes Wissenssystem (RAG) — Mitarbeitende fragen in natürlicher Sprache, das System durchsucht SharePoint, Confluence, das Intranet oder eigene Datenbanken und liefert Antworten mit Quellenangabe. Foundry IQ stellt dafür die nötigen Konnektoren bereit, der Agent Service orchestriert Abruf und Antwortgenerierung.

Dokumentenanalyse im großen Stil — Rechnungen, Verträge, Protokolle, technische Spezifikationen. Foundry kombiniert klassische Document-Intelligence-Dienste mit GPT-5.2-basierter Extraktion. Skalierbar, auditierbar, mit klar definierten Ausgabeschemata.

Erweiterung von M365 Copilot — M365 Copilot ist mächtig, kennt aber nicht die internen Prozesse, das ERP oder das Branchenfachsystem. Mit Foundry lassen sich eigene Agenten bauen, die über die Graph-API auf M365-Daten zugreifen und Copilot erweitern — gleiche Anwenderoberfläche, eigene Logik dahinter.

Automatisierungsagenten mit echten Aktionen — Anders als reine Chat-Anwendungen können GPT-5.4-Agenten Aktionen ausführen: Bestellungen vorbereiten, Ticketsysteme bedienen, Reports erzeugen, Benachrichtigungen koordinieren. Computer Use bringt das in Bereiche, die vorher klassischer RPA-Aufgaben waren.

Was Microsoft Foundry realistisch kostet

Hier wird oft beschönigt. Eine ehrliche Einordnung:

Modellzugriff (Pay-per-Token).

GPT-5-Reihe: Preise variieren je nach Variante; GPT-5 Standard liegt in der Größenordnung von 2–5 USD pro Million Input-Token und 8–15 USD pro Million Output-Token. Reasoning-Aufrufe konsumieren zusätzlich Reasoning-Token, die ebenfalls abgerechnet werden.
Phi-4 und Small Language Models: deutlich günstiger — für viele interne Aufgaben mit moderaten Qualitätsanforderungen die wirtschaftlichste Option
Anthropic-Modelle: vergleichbares Preismodell, je nach Variante

Foundry-Workspace und Foundry-native Agenten sind selbst kostenfrei. Kosten entstehen durch Modell-Aufrufe, Storage und gegebenenfalls Compute.

Hosted Agents (verwaltete Laufzeit): aktuell ca. 0,10 USD pro vCPU-Stunde und ca. 0,012 USD pro GiB-Stunde Arbeitsspeicher. Für einen kleineren Dauerbetrieb realistisch im niedrigen dreistelligen Bereich pro Monat.

Memory-Funktion (Kurzzeit- und Langzeitgedächtnis): Abrechnung beginnt im Juni 2026. Ca. 0,25 USD pro 1.000 Kurzzeit-Events, 0,25 USD pro 1.000 gespeicherten Langzeit-Erinnerungen pro Monat, 0,50 USD pro 1.000 Memory-Abrufe.

Managed Endpoints (dedizierte GPU-Instanzen): Ab ca. 1.500 EUR pro Monat. Nur bei konstantem Hochvolumen wirtschaftlich.

Für einen internen Wissens-Chatbot mit ca. 50 Nutzern und moderater Nutzungsintensität liegen die laufenden Modell- und Plattform-Kosten typischerweise im Bereich von 200 bis 600 EUR pro Monat — abhängig von Modellauswahl und Reasoning-Anteil.

Wann sich Foundry lohnt — und wann nicht

Foundry ist die richtige Wahl, wenn:

Mehrere KI-Anwendungen unter einer Governance-Struktur betrieben werden sollen
Compliance, Auditierbarkeit oder regulatorische Anforderungen nicht verhandelbar sind
Modellflexibilität wichtig ist (verschiedene Modelle je Use Case, eigene Fine-Tunes)
Agenten mit Werkzeugnutzung gebaut werden sollen
Daten den Azure-Tenant nicht verlassen dürfen (DSGVO, BNetzA, branchenspezifische Vorgaben)

Eine einfachere Lösung reicht, wenn:

Genau ein Use Case mit einem klaren Modell-Bedarf existiert
Schneller API-Zugriff genügt, ohne Governance-Schicht
Kein Azure-Know-how im Haus ist und keine Lust auf Infrastruktur-Aufbau besteht

Foundry ist die falsche Antwort, wenn:

Die eigentliche Anforderung mit M365 Copilot für Office, Teams und Outlook gelöst wäre
Die Anwender im Vordergrund stehen, nicht die eigene Entwicklung
Kein interner Use Case existiert, sondern nur „Wir sollten mal was mit KI machen“

Was ich für Sie entwickle

Ich begleite mittelständische Unternehmen bei der Evaluierung und Einführung von Microsoft Foundry — pragmatisch, mit Fokus auf nachweisbaren Geschäftsnutzen statt Plattform-Selbstzweck.

Use-Case-Bewertung — Welche internen Prozesse profitieren tatsächlich von einer KI-Lösung? Welche Modellklasse passt? Welche Daten müssen wie zugänglich sein?

Pilotprojekt-Konzept — Aufbau eines klar abgegrenzten Pilotprojekts, das innerhalb von vier bis acht Wochen erste produktive Ergebnisse liefert. Häufiger Einstieg: ein internes Wissenssystem oder ein konkreter Agent für einen wiederkehrenden Prozess.

Architektur und Modellauswahl — Entscheidung zwischen Foundry-Workspace, Agent Service, RAG-Architekturen und der konkreten Modellwahl aus der GPT-5-Reihe.

Governance, Sicherheit, Kostenkontrolle — Aufbau der notwendigen Schutzmechanismen vor Produktivnahme: Identitäts- und Zugriffssteuerung, Audit-Logging, Content-Safety-Filter, Budget-Limits.

Wissenstransfer ins eigene Team — Damit Foundry nicht als externes Geheimwissen bleibt, sondern intern verstanden und weitergeführt werden kann.

Fazit

Microsoft Foundry ist heute kein Experimentier-Tool mehr. Mit der GPT-5-Reihe, dem produktionsreifen Agent Service und der zunehmenden Modellvielfalt — einschließlich Anthropic-Modellen seit Ende 2025 — ist die Plattform für mittelständische Unternehmen erstmals eine ernsthafte Option, eigene KI-Anwendungen aufzubauen, ohne externe Black-Box-Dienste nutzen zu müssen.

Der Reiz liegt nicht in einer einzelnen Funktion, sondern in der Kombination: Frontier-Modelle, Reasoning-Fähigkeit, Werkzeugnutzung, Computer Use, Governance und Compliance — alles unter einer Plattform, alles im eigenen Azure-Tenant.

Wer evaluieren möchte, ob Foundry zur eigenen Microsoft-Infrastruktur und zu konkreten Anwendungsfällen passt, sollte mit einem klar umrissenen Pilotprojekt beginnen — nicht mit einer Plattform-Migration. Ein 30-minütiges Gespräch reicht meist, um die richtige erste Frage zu identifizieren. Sprechen Sie mich gerne an.