Was wäre, wenn die KI nicht nur antwortet, sondern dabei entscheidet, wie diese Antwort aussieht? Nicht als Text, sondern als vollständige, interaktive Oberfläche - generiert zur Laufzeit, passend zur Anfrage. Das ist der Grundgedanke hinter Agentic UI. Ich wollte wissen, ob das über ein konkretes Protokoll schon heute funktioniert und habe es ausprobiert. Als Fußballfan wollte ich wissen, ob mir eine KI auf Abfrage eine Oberfläche bauen kann, die mir Vereinswappen nach Farben ausspuckt, Statistiken anzeigt oder Details zu einem Verein aufbereitet, ohne dass ich dafür eine klassische App bauen muss.
Möglich macht das Agent to User Interface (A2UI), ein von Google initiertes Open-Source Protokoll, das KI-Agenten ermöglicht, vollständige Oberflächen zu generieren, ohne den Code zu manipulieren. Google definiert A2UI wie folgt:
A2UI enables AI agents to generate rich, interactive user interfaces that render natively across web, mobile, and desktop - without executing arbitrary code.
Dabei bewegt es sich im Spektrum der Agentic UI neben Ansätzen wie AGUI oder ChatKit, die sich ebenfalls mit der Generierung von Benutzeroberflächen durch LLMs beschäftigen. Während viele dieser Lösungen UI aus LLM-Antworten ableiten, unterscheidet sich A2UI durch seinen strikt deklarativen Ansatz. Anstatt ausführbaren Code oder Framework-spezifische Komponenten zu generieren, beschreibt das LLM die entstehende Benutzeroberfläche ausschließlich als strukturiertes JSON.
Im Unterschied zu anderen Ansätzen, die dem LLM mehr Freiheit bei der Gestaltung der UI einräumen, verfolgt A2UI bewusst einen restriktiveren Ansatz. Diese Einschränkung reduziert zwar die Flexibilität der generierten UI, schafft jedoch klare Vorteile in Bezug auf Sicherheit, Wartbarkeit und Kontrolle über das Designsystem.
Das JSON fungiert hier als UI-Protokoll, das vom Client in native Komponenten übersetzt wird. Dadurch entsteht eine klare Trennung zwischen Beschreibung und Rendering. Das LLM definiert zwar, was dargestellt wird, aber die Anwendung kontrolliert, wie dies konkret umgesetzt wird. Im Vergleich zu den anderen Ansätzen ermöglicht dies eine höhere Sicherheit, da kein ausführbarer Code generiert wird, sowie hat man selbst Kontrolle über Designprinzipien, Accessibility und Performance. Gleichzeitig ist JSON plattformübergreifend und kann sowohl im Web als auch in nativen Umgebungen eingesetzt werden.
Um das Konzept zu veranschaulichen und greifbarer zu machen, habe ich einen MVP entwickelt, der das Prinzip von A2UI in der Praxis demonstrieren soll. Als Fußballfan möchte ich schnell Informationen zu meinem Lieblingsverein erhalten, ohne mich durch mehrere Seiten klicken zu müssen. Stattdessen soll mir eine KI direkt eine passende Oberfläche für meine Anfrage generieren. Die Anwendung funktioniert dabei ziemlich einfach: Die Anfrage wird an das Backend weitergeleitet, das analysiert, was benötigt wird. Auf Basis der gesammelten Daten generiert das Modell ein strukturiertes JSON, das sowohl die UI-Komponentenbeschreibung als auch die eigentlichen Daten enthält, die visualisiert werden sollen.
Technisch fungiert das Backend als Vermittlungsschicht zwischen Frontend, LLM und externen Datenquellen. Über OpenAI Function Calling erhält das Modell Zugriff auf mehrere Funktionen, darunter eine lokale Vereinsdatenbank für Farb-, Land- und Ligasuchen sowie Schnittstellen zu einer Fußball API (https://www.api-football.com/) für Vereins- und Statistikdaten. Das Frontend setzt dabei auf React, Next.js und Typescript und rendert die Oberfläche dynamisch auf Basis der vom LLM generierten JSON-Struktur. Die größte Herausforderung war, Halluzinationen zu vermeiden, da das Modell vereinzelt Statistiken, Vereinsnamen oder Logo-URLs erfand, statt reale Daten aus den Tools zu verwenden. Gelöst wurde das durch stringente Prompt-Vorgaben, die Aufrufe vorschreiben und präzisere Schema-Definitionen.
Die eigentliche Stärke des Ansatzes zeigte sich trotzdem klar, indem neue Oberflächen entstanden, ohne dass die KI dafür Code generieren musste. Das Frontend wurde weniger eine Sammlung einzelner Seiten und mehr eine Art Runtime, die deklarativ beschriebene UIs interpretiert und rendert. Was der MVP letztendlich zeigt, ist, dass sich selbst mit einem kleinen Komponenten-Set überraschend unterschiedliche Oberflächen dynamisch erzeugen ließen, zumindest für datengetriebene, stark strukturierte Anwendungsfälle wie diesen. Die Qualität stand und fiel dabei mit den klar definierten Schemata.
Durch die KI-generierte UI entfällt die mühsame Suche über verschiedene Seiten hinweg. Suche ich etwa nach einem Hotel oder Restaurant in meiner Nähe, läuft der gesamte Prozess in einer einzigen Konversation ab, statt wie zuvor erst zu googlen, eine Seite zu besuchen, Angebote zu vergleichen und den Buchungsprozess zu durchlaufen. Die KI liefert passende Ergebnisse direkt auf meine Anfrage und ermöglicht weiterführende Aktionen wie Buchungen unmittelbar in der generierten Oberfläche. Eine erste Verschiebung in diese Richtung hat allerdings bereits durch KI Search und sogenannte Answer Engines begonnen. Systeme wie ChatGPT Search, Perplexity oder Googles AI Overviews reduzieren bereits heute die Notwendigkeit, klassische Suchergebnisseiten überhaupt noch zu besuchen, indem Informationen direkt aggregiert und innerhalb der Konversation beantwortet werden. Der eigentliche Unterschied bei Agentic UI und A2UI liegt daher weniger nur in der Suche selbst, sondern darin, dass zusätzlich die passende Oberfläche und Interaktion direkt mitgeneriert wird.
Seiten, auf denen Vergleich und Buchung im Vordergrund stehen, wurden bereits durch Vergleichsportale für den/die Nutzer*in vereinfacht. Die eigentliche Verschiebung durch A2UI trifft daher weniger die Nutzerseite als die Angebotsseite. Unternehmen, deren Geschäftsmodell darauf basiert, Angebote zu vergleichen und auf das eigentliche Angebot weiterzuleiten, verlieren genau diesen Kanal. Die KI übernimmt nicht nur die Suche, sondern auch die Oberfläche und damit das, was solche Portale bislang zu einem unverzichtbaren Zwischenschritt gemacht hat. Das Potenzial geht aber noch weit über die Suche hinaus. Mit dieser Herangehensweise verändern sich nicht mehr nur Suchprozesse, sondern generell das, was der/die Nutzer*in überhaupt zu sehen bekommt. Views werden dynamisch generiert, da sich die Oberfläche an das jeweilige Ziel des Besuchers anpasst. Statt einer typischerweise eher starren Navigation entsteht eine individuelle Nutzererfahrung.Man stelle sich einen Möbel-Onlineshop vor: Anstatt sich durch Kategorien wie Schreibtische, Regale und Bürostühle zu klicken, gibt man der KI die Anweisung, ein 14m² großes Arbeitszimmer im minimalistischen Stil für unter 800 Euro einzurichten und erhält direkt eine kuratierte Zusammenstellung - abgestimmt auf Raumgröße, Stil und Budget - inklusive Gesamtpreis und der Möglichkeit, einzelne Teile direkt auszutauschen. Cross-Selling und Produktentdeckung passieren dabei ganz natürlich im Dialog, anstelle über manuell platzierter Banner wie “Kunden kauften auch” oder “Hey, das passt auch noch dazu”.
Und die Einsatzmöglichkeiten gehen noch weiter. Ein Analyst, der eine Übersicht über Quartalszahlen nach Region und Produktkategorie benötigt, muss kein BI-Tool mehr öffnen und konfigurieren. Er beschreibt, was er sehen möchte, und erhält das passende Dashboard direkt. Auch Support-Prozesse auf Webseiten können stärker in Richtung Self-Service gehen. Niemand muss mehr durch ein generisches Kontaktformular geführt werden, um an die richtige Stelle weitergeleitet zu werden. Stattdessen erkennt die KI das Anliegen und stellt direkt das passende Interface bereit. Und das sind nur einige Beispiele dafür, wie individuell sich digitale Produkte und Oberflächen künftig an Nutzerbedürfnisse anpassen könnten.
So vielversprechend das klingt, birgt der Ansatz auch Risiken, die nicht unterschätzt werden dürfen. Der User verliert die Kontrolle über die Auswahl und die Entscheidung. Heute entscheidet man meist selbst, welche Suchergebnisse angeklickt werden, welchen Shop man besucht, welchem Anbieter man vertraut. In einer KI-generierten Oberfläche trifft die KI diese Entscheidung. Sie wählt aus, welche Hotels, welche Restaurants, welche Produkte angezeigt werden und welche eben auch nicht. Der Nutzer sieht nur noch das, was die KI für relevant hält. Das verschiebt die Machtverhältnisse von Plattformen und Nutzern hin zum Modell und dessen Trainingsdaten.
Vor diesem Hintergrund könnte in Zukunft SEO an Bedeutung verlieren oder sich grundlegend verändern. Schon heute klicken laut Backlinko weniger als 1% der Nutzer*innen auf Ergebnisse der zweiten Seite. Diese Seite ist damit für die große Mehrheit schlicht irrelevant. Wenn eine KI zusätzlich nur noch die Ergebnisse der besten Treffer rendert, verschärft sich das Problem weiter. Kleinere Anbieter, die heute über Nischen-SEO oder Long Tail Keywords sichtbar sind, könnten komplett aus dem Sichtfeld verschwinden. Deep Links in Unterseiten zu spezifischen Produktkategorien, FAQ-Bereiche oder Blogartikel verlieren eventuell ihren Wert, wenn die KI nur Top-Level-Ergebnisse verarbeitet.
Ebenfalls werden UX-Design und E-Commerce-Strategien entwertet: Onlineshops investieren heute in Nutzerführung, strategisch platzierte Calls-to-Action und Layouts. Wenn die KI eine eigene Oberfläche generiert, wird diese gesamte Arbeit umgangen. Cross-Selling Strategien, Upselling Pfade und sorgfältig gestaltete Checkout-Prozesse greifen nicht mehr, wenn direkt über die KI gekauft wird. Shops verlieren damit nicht nur Traffic, sondern auch die Kontrolle über das Kauferlebnis. Nicht nur der E-Commerce ist davon getroffen. Auch Unternehmen mit komplexen Themen oder einem breiten Portfolio investieren gezielt in Themencluster und Content-Tiefe, um User schrittweise durch ihr Angebot zu führen. Ein gut rankende Glossarseite bringt nichts, wenn niemand darauf landet und damit auch die weiterführenden Links, vertiefenden Inhalte und internen Verknüpfungen zu sehen bekommt. Die KI liefert die Antwort direkt, der Weg durch die eigene Website entfällt.
User müssen der KI vollumfänglich vertrauen, die aber nachweislich noch Fehler macht. Sucht man beispielsweise ein Hotel mit dem Namen "Hotel Krone" könnte die KI-Ergebnisse aus Zürich, München und Wien vermischen, ohne klar zu kennzeichnen, welcher Standort gemeint ist. Im schlimmsten Fall wird das falsche Hotel gebucht. Auch ein ungenauer Prompt reicht aus, um zu einem falschen Ergebnis zu führen. Das verschiebt einen Teil der Verantwortung auf den/die Nutzer*in, der/die lernen muss, präzise zu formulieren, um verlässliche Ergebnisse zu bekommen. Bei medizinischen Informationen, Finanzprodukten oder rechtlichen Fragen wären solche Fehler noch weitaus gravierender.
Und nicht zuletzt stellen Sicherheitsrisiken durch manipulierte Datenquellen ein Problem dar. Bindet die KI externe Daten als JSON ein und rendert daraus UI, entsteht ein neues Einfallstor. Manipulierte Webseiten könnten gezielt Inhalte bereitstellen, die von der KI als valide Daten interpretiert werden. So kann es passieren, dass gefälschte Produktbewertungen, falsche Preisangaben oder Phishing-Formulare in einer bekannten und vertrauenswürdig wirkenden Oberfläche dargestellt werden. Der User hat kaum eine Möglichkeit, diese Quelle zu überprüfen.
KI generierte Oberflächen sind keine reine Zukunftsmusik mehr. Das zeigt uns auch ein kürzlich erteiltes Patent (US12536233B1, „AI-generated content page tailored to a specific user") von Google. Es beschreibt ein System, in dem Google bei jeder Suchanfrage einen Landing Page Score berechnet, basierend auf Konversionsrate, Absprungrate und Klickrate der Zielseite. Wird eine Seite als unzureichend bewertet, soll Google eine eigenständig KI basierte Landingpage mit personalisierten Inhalten generieren.
Als Beispiel: Sucht eine Person nach "wasserdichte Wanderstiefel für breite Füße", könnte Google eine vorgefilterte Produktseite generieren, statt zur generischen Homepage eines Online-Shops zu verlinken (SearchEngineLand) - im Grunde das gleiche Prinzip wie im A2UI Protokoll. Die KI entscheidet über Struktur und Inhalt der Oberfläche, ohne dass der Seitenbetreiber Einfluss darauf hat.
Das Patent bezieht sich ausschließlich auf E-Commerce und Shopping Ads und erwähnt keine redaktionellen Inhalte, Blogs oder Nachrichtenseiten. Das Patent ist zudem noch kein fertiges Produkt (SearchEngineJournal). Google reicht regelmäßig Patente ein, die nicht umgesetzt werden. Dennoch zeigt es, in welche Richtung gedacht wird.
Die Risiken sind für mich zunächst kein Grund, die Idee komplett zu verteufeln, aber es macht deutlich, dass es bei KI-generierten Interfaces nicht nur um Technik geht, sondern auch darum, wie man künftig mit Daten, Vertrauen und Kontrolle im Web umgehen soll.
Wichtig zu betrachten ist der Kontext. Die meisten dieser Risiken entstehen vor allem dort, wo KI im Umfeld von Suchmaschinen arbeitet und sich eigenständig externe Datenquellen zusammensucht und aufbereitet. In geschlossenen Systemen sieht das Ganze etwas anders aus. Wenn wir als Entwickler*innen die Datenquellen selbst kontrollieren wie bei meinem Fußball Beispiel, sind viele dieser Probleme deutlich entschärft.
Für mich liegt der eigentliche Mehrwert weniger im Hype um generative UIs, sondern in der Frage, wie kontrollierbar und verlässlich diese Systeme in der Praxis sind. Zunächst ist A2UI eine saubere und strukturierte Möglichkeit, KI-generierte Oberflächen darzustellen, ohne dass die KI direkten Zugriff auf den Code bekommt. Am Ende wird entscheidend sein, wie sich Standards, Regulierung und Vertrauen rund um diese Technologie entwickeln. Davon hängt ab auch ab, ob sich KI-generierte Interfaces durchsetzen oder eher ein Spezialthema bleiben.