Agent Washing im Marketing: Echter KI-Growth-Team oder umgelabelter Chatbot?
„Agent Washing“ bezeichnet die Praxis, bestehende Software – einen Chatbot, ein RPA-Skript oder einen dünnen LLM-Wrapper – ohne jede Substanz als „KI-Agent“ oder „KI-Mitarbeiter“ zu relabeln. Der Begriff stammt von Gartner, das in einer Pressemitteilung vom 25. Juni 2025 schätzte, dass von den Tausenden von Anbietern, die „agentische KI“ vermarkten, nur rund 130 tatsächlich etwas wirklich Agentisches tun. Wenn du als Gründer*in ein echtes KI-Wachstumsteam von einem umgelabelten Bot unterscheiden willst, ist genau diese Lücke dein Problem.
Die Einsätze sind nicht abstrakt. In derselben Meldung prognostizierte Gartner, dass über 40 % der agentischen KI-Projekte bis Ende 2027 eingestellt werden – mit Verweis auf steigende Kosten, unklaren Mehrwert und unzureichende Risikokontrollen. Ein Teil dieser Misserfolgsquote geht darauf zurück, eine Demo zu kaufen und dann festzustellen, dass das eigentliche Produkt ein Chatbot mit Namensschildchen war.
Dieser Beitrag gibt dir eine Checkliste, mit der du Echtes von Umgelabeltem trennst – und läuft dann, weil eine Checkliste, die man nicht auf sich selbst anwendet, bloß Marketing ist, Ceres durch dieselben vier Fragen, ehrlich, einschließlich der Stelle, wo wir eine Aktion ausführen, ohne dich vorher zu fragen. Die Kriterien stammen von Gartner und Microsoft, nicht von unserer Feature-Liste. Das ist der Punkt.
Was ist Agent Washing genau?
Agent Washing verhält sich zu KI wie Greenwashing zur Nachhaltigkeit: Der Anspruch überholt die Fähigkeit. Gartners Formulierung ist präzise – Anbieter nehmen einen KI-Assistenten, einen RPA-Workflow oder einen regelbasierten Chatbot, kleben „agentisch“ auf die Box und liefern ihn aus. Das Wort „Agent“ impliziert, dass die Software eine Situation wahrnehmen, entscheiden kann, was zu tun ist, und eigenständig auf ein Ziel hinarbeitet. Ein umgelabelter Chatbot tut davon nichts; er antwortet, wenn man mit ihm spricht, und hört dann auf.
Das Verrätsel liegt meistens in den Verben. Echte agentische Systeme werden in Begriffen des Tuns beschrieben – diagnostizieren, entwerfen, vorschlagen, nach einem Plan handeln. Gewaschene Produkte werden in Begriffen von Vibes beschrieben – „KI-gestützt“, „intelligent“, „autonom“, ohne jede Erklärung, was das Ding eigentlich tut, wenn man es alleine lässt. Gartners eigene Daten unterstreichen, wie früh wir noch sind: In einer Umfrage unter 3.412 Webinar-Teilnehmern im Januar 2025 gaben nur 19 % an, ihre Organisation habe erhebliche Investitionen in agentische KI getätigt; der Rest war zurückhaltend, abwartend oder unsicher. Der Hype ist der Realität um Jahre voraus.
- Agent Washing (Gartners Begriff) = Chatbots, RPA oder LLM-Wrapper als „Agenten“ relabeln, ohne die Substanz.
- Gartner schätzt, dass nur ~130 von Tausenden „agentischer“ Anbieter wirklich agentisch sind, und prognostiziert, dass 40 %+ der agentischen KI-Projekte bis Ende 2027 eingestellt werden.
- Vier Käuferfragen durchschauen das: Zitiert es Belege? Genehmigt ein Mensch Outbound-Aktionen? Ist der Scope je Spezialist eng? Ist es managed und auditierbar?
- Die ehrliche, zeitgemäße Position ist Human-in-the-Loop – du bist der „Agent Boss“ (Microsofts Begriff), die KI entwirft und schlägt vor, du genehmigst.
- Wende die Checkliste auf jeden Anbieter an, auch auf uns: Ceres gated Outbound, führt aber reversible Mikro-Aktionen (like, follow) ungated-aber-geloggt aus.
Warum ist das für Marketing-Käufer besonders relevant?
Marketing ist der Bereich, in dem Agent Washing den größten Schaden anrichtet, weil die Aktionen öffentlich und oft irreversibel sind. Ein gewaschener „KI-SDR“, der automatisch Cold-Mails verschickt, oder ein „autonomer“ Ads-Manager, der Budgets über Nacht umschichtet, ist kein Produktivitätsgewinn, wenn es schiefläuft – sondern ein Marken-Vorfall mit deinem Namen drauf. Die Kategorie ist voll von kühnen Autonomie-Versprechen, die die Produkte nicht einlösen können.
Schau dir die lautesten Beispiele auf eigene Rechnung an. Artisan vermarktete seinen „KI-SDR“ Ava unter einer „Stop Hiring Humans“-Kampagne; der CEO des Unternehmens räumte später ein, die Kampagne sei „mostly just for attention“ gewesen. Unabhängige Bewertungen stellen fest, dass Ava mit einfachen E-Mail-Antworten zu kämpfen hat, und landet bei rund 3,8/5 auf G2. Das ist kein Vorwurf gegen das Wagen von schwierigen Dingen – es ist ein Beleg dafür, dass die vollautonome Spur heute häufig übertrieben dargestellt wird. Wenn das Marketing sagt „ersetzt dein Team“ und die Bewertungen sagen „kann keine Antwort verarbeiten“, siehst du genau die Lücke, in der Agent Washing lebt.
Der Kontrast, der auffällt: Selbst die gefeiertsten Agenten beschreiben sich vorsichtig. Cognitions Devin nennt sich einen „kollaborativen KI-Teamkollegen“, und als Goldman Sachs ihn als ihren „ersten KI-Mitarbeiter“ beschrieb, war der Workflow dahinter immer noch Review-before-merge – ein Mensch gibt das OK. Das ernsthafte Ende des Marktes konvergiert auf Human-in-the-Loop. Das gewaschene Ende verkauft den Traum und liefert einen Bot. Für die marketingspezifische Version dieses Arguments, siehe Human-in-the-Loop KI-Marketing.
Die Käufer-Checkliste: Vier Fragen, die Echtes von Umgelabeltem trennen
Diese vier Kriterien leiten sich aus Gartners Agent-Washing-Analyse und Microsofts „Agent Boss“-Framing ab – nicht aus dem Datenblatt eines einzelnen Anbieters. Lass jedes Produkt, das du evaluierst, einschließlich dieses hier, alle vier durchlaufen. Ein echtes KI-Marketing-Team sollte inhaltlich bestehen; ein umgelabelter Chatbot scheitert an mindestens einem, meistens still.
| Käuferfrage | So sieht „echt“ aus | So sieht Agent Washing aus |
|---|---|---|
| 1. Zitiert es Belege für seine Empfehlungen? | Jede Empfehlung verlinkt auf die dahinterliegenden Daten – die GA4-Kennzahl, die Suchanfrage, die Konkurrenzseite, die gelesen wurde. | Selbstbewusste Behauptungen ohne Quellenangabe; „unsere KI schlägt X vor“ – und du siehst nicht, warum. |
| 2. Genehmigt ein Mensch Outbound-Aktionen? | Posts, E-Mails, Ad-Budget und Veröffentlichungen werden entworfen und zur Genehmigung zurückgehalten. Du bist der Genehmiger. | „Vollautonomer“ Outbound – er sendet, gibt aus oder veröffentlicht, bevor du es siehst. Fehler sind öffentlich. |
| 3. Ist der Scope je Spezialist eng? | Abgegrenzte, klar definierte Rollen (eine SEO-Rolle, eine Cold-Email-Rolle) mit klaren Inputs und Outputs. | Ein „alles-in-einem“-Agent, der behauptet, das gesamte Marketing zu managen – breite Oberfläche, geringe Tiefe. |
| 4. Ist es managed und auditierbar? | Echte Operatoren dahinter, ein Audit-Log jeder Aktion, verschlüsselte Credentials, keine Infrastruktur, die du betreiben musst. | Ein Self-Serve-Wrapper ohne Audit-Trail und ohne verantwortliche Person, wenn etwas schiefläuft. |
Frage 3 verdient eine Anmerkung: Enger Scope ist ein Feature, keine Einschränkung. Gartners eigene Diagnose lautet, dass „aktuelle Modelle nicht die Reife und Handlungsfähigkeit besitzen, um komplexe Geschäftsziele autonom zu erreichen“, und dass „viele Use Cases, die heute als agentisch positioniert werden, keine agentischen Implementierungen erfordern.“ Ein Team enger, gut überwachter Spezialisten ist ehrlicher – und meist nützlicher – als ein großer „autonomer Marketer“. Deshalb bringt Ceres 11 wählbare Spezialistenrollen mit, anstatt eines einzigen Orakels.
Wie sieht das Autonomie-Spektrum wirklich aus?
„Agentisch“ ist nicht binär – es ist ein Spektrum, und die meisten ernsthaften Deployments liegen tiefer darauf, als das Marketing impliziert. Das Digital Regulation Cooperation Forum des Vereinigten Königreichs (ein gemeinsames Vorausschau-Papier von CMA/FCA/ICO/Ofcom, veröffentlicht am 31. März 2026) legt eine fünfstufige Autonomieskala vor. Die Stufe, die es sich zu merken lohnt, ist Level 4: „User as Approver“ – das System läuft, aber der Nutzer wird bei Blockern und für die Freigabe folgenreicher Aktionen einbezogen. Kaum ein Unternehmen führt Level 5, volle Autonomie, heute in der Produktion.
| Autonomie-Level | Wer entscheidet bei folgenreichen Aktionen | Wo Marketing-Produkte tendenziell angesiedelt sind |
|---|---|---|
| Level 1–2: assistiv | Mensch macht die Arbeit; KI macht Vorschläge. | Die meisten „KI-Copilot“-Schreibtools. |
| Level 3: überwachte Ausführung | KI handelt bei Routineschritten; Mensch beobachtet. | Viele echte Agenten-Produkte. |
| Level 4: User as Approver | KI plant und entwirft; Mensch gibt folgenreiche Aktionen frei. | Wo ernsthafte Human-in-the-Loop-Produkte sitzen – einschließlich Ceres für Outbound. |
| Level 5: volle Autonomie | KI entscheidet und handelt ohne Freigabe. | Lautstark vermarktet; selten in der Produktion eingesetzt. |
Das lässt sich direkt auf das Muster übertragen, das die besten Praktiker als das Gewinnende beschreiben. In Notes on AI Apps in 2026 beschreibt a16z den effektiven Agenten-Loop so: Probleme identifizieren, Ursachen diagnostizieren, Lösungen umsetzen – und erst dann Freigabe einholen – mit einem Product Manager, der „2–3 Features reviewt, die das Modell über Nacht entwickelt hat.“ Das ist: vorschlagen, dann reviewen, dann ausführen. Das ist Level 4, nicht Level 5. Die Autonomie steckt in der Diagnose und im Entwerfen; der Mensch besitzt das folgenreiche Ja.
Ceres am selben Maßstab messen (ehrlich)
Eine Checkliste, von der man sich selbst ausnimmt, ist eine eigene Art von Washing. Deshalb hier Ceres gegen alle vier Fragen – einschließlich der Stelle, wo wir nicht vorher fragen.
- Belege Bestanden, by Design. Jeder Befund, den ein Spezialist aufdeckt, ist belegbasiert – die Kennzahl, die Quelle, die gelesene Seite. Wenn wir dir nicht zeigen können warum, behaupten wir es nicht.
- Mensch genehmigt Outbound Bestanden, mit einer ehrlichen Ausnahme. Social Posts, Cold Mails, Ad-Budget und Veröffentlichungen sind alle approval-gated – ein Mensch genehmigt, bevor irgendetwas rausgeht. Die Ausnahme: reversible Mikro-Aktionen (ein Like, ein Follow) laufen ungated. Sie laufen, werden dann in einem Audit-Trail geloggt und täglich begrenzt. Wir halten ein reversibles Like für eine vertretbare Sache, für die wir dich nicht unterbrechen müssen; wir finden aber auch, dass du ein Recht darauf hast zu wissen, dass es ohne Tippen pro Aktion passiert. Das ist die ehrliche Linie, keine Marketing-Linie.
- Enger Scope je Spezialist Bestanden. Ein KI-Growth Officer orchestriert 11 kundenseitig wählbare Spezialisten, jeder klar abgegrenzt – ein GEO Strategist, eine SEO-Content-Rolle, eine Cold-Email-Rolle und so weiter. (Der Social Media Manager ist eine Rolle, die sowohl X als auch LinkedIn abdeckt, nicht zwei.) Kein einzelner Alles-Könner-Agent.
- Managed und auditierbar Bestanden. „Managed“ bedeutet, dass echte Operatoren den Service betreiben – es gibt keine Infrastruktur, die du aufbauen musst. Credentials sind verschlüsselt im Ruhezustand (AES-GCM), und jede Aktion ist geloggt. Du solltest jeden „Managed“-Anbieter fragen, was „managed“ für ihn bedeutet; für uns bedeutet es Menschen, nicht nur ein gehostetes Binary.
Das Framing, das das kohärent macht, kommt von Microsoft, aus seinem Work Trend Index: Du bist der „Agent Boss“. Die Spezialisten entwerfen und schlagen vor; du leitest und genehmigst. Ceres ist kein „KI-Mitarbeiter, der dein Team ersetzt“ – und wir werden es auch nicht so beschreiben, denn das widerspricht dem Approval Gate und stößt ehrlich gesagt genau den Skeptiker vor den Kopf, für den dieser Beitrag geschrieben ist. Es ist ein managed KI-Marketing-Team, das du führst. Wenn du die längere Version dieser Unterscheidung willst, lies AI Marketing Team vs. KI-Mitarbeiter vs. KI-Agent.
Aber ist „KI ersetzt den Arbeitnehmer“ nicht die ganze Investment-These?
Das ist eine These, und eine einflussreiche – es lohnt sich, sie ehrlich anzugehen, statt ihr auszuweichen. a16z's Alex Rampell hat argumentiert, dass Software „Labor frisst“: die Idee, dass KI Software von einem Werkzeug, das man kauft, in die Arbeit selbst verwandelt („Service-as-Software“), und dabei grob auf ca. 300 Mrd. Dollar jährlicher SaaS-Ausgaben gegenüber rund 13 Billionen Dollar US-Arbeitskosten als Preis verweist. Behandle das als a16z's gerichtionale Aussage über Marktgröße, nicht als verifizierte Zahl – und beachte, dass die Größe des Preises dir nicht verrät, welche Produkte real sind.
Wichtiger: Die Hälfte „ersetzt den Arbeitnehmer“ ist ein Anspruch, den Ceres weder erhebt noch benötigt. Harvard Business Review (Mai 2026) argumentierte, dass die Behandlung von KI-Agenten wie „Mitarbeitern“ die Verantwortlichkeit aktiv mindert – wenn etwas schiefläuft, diffundiert ein „Mitarbeiter“-Frame die Verantwortung. Ein Human-in-the-Loop-Frame tut das Gegenteil: Der genehmigende Mensch ist verantwortlich, das Audit-Log ist der Nachweis, und „die KI hat es getan“ ist nie eine Ausrede. Du kannst glauben, dass Software viel Arbeit wegfressen wird, und glauben, dass der verantwortungsvolle Weg, sie heute auszuliefern, Vorschlagen-Reviewen-Ausführen ist. Das steht nicht im Widerspruch.
Eine Anmerkung zur KI-Suchsichtbarkeit – weil Washing auch dort stattfindet
Eine Spielart des Agent Washings ist der Verkauf „garantierter“ KI-Zitierungen – das Versprechen, dass deine Marke auf Abruf in ChatGPT, Perplexity oder Googles AI Overviews auftaucht. Das kann niemand garantieren; die Modelle und ihr Retrieval ändern sich ständig. Was real ist, ist die Verbesserung deiner Chancen: Inhalte so strukturieren, dass KI-Engines sie extrahieren und zitieren können, Entitätsklarheit aufbauen, die Art von Quellenangaben verdienen, die diese Systeme bevorzugen. Das ist Generative Engine Optimization (GEO), und der ehrliche Pitch lautet „bessere Chancen“, nie „garantierte Platzierung“.
Das ist genau die Art von engem, belegbasiertem Job, den ein echter Spezialist gut macht. Ceres umfasst eine GEO-Strategist-Rolle, und du kannst die Idee testen, bevor du irgendjemanden bezahlst – führe ein kostenloses GEO-Audit auf deiner eigenen Website durch und schau, was es tatsächlich findet. Wenn es Konkretes zitiert, ist das ein kleines Live-Demo von Kriterium Nr. 1.
Was sollte ein Skeptiker als nächstes tun?
Halte die vier Fragen bereit und wende sie auf jede Demo an: Belege, Genehmigung, Scope, Verantwortlichkeit. Wenn ein Anbieter sie nicht klar beantworten kann, ist der „Agent“ wahrscheinlich ein Chatbot mit Namensschildchen – und Gartners 40 %-Abbruchprognose ist zum Teil ein Friedhof von Käufern, die diesen Schritt übersprungen haben. Wenn du bestimmte Produkte anhand dieser Achsen vergleichen willst, legen unsere /vs-Vergleiche Wettbewerber Seite an Seite dar, und die Alternativen-Übersicht ist eine unvoreingenommene Karte der Kategorie.
Und wenn das Human-in-the-Loop, belegzitierte, Du-bist-der-Genehmiger-Modell das ist, was du wirklich willst, ist der risikoärmste Weg, Ceres zu beurteilen, es zu nutzen: Starte den kostenlosen Test – 14 Tage ohne Kreditkarte – oder lies zuerst genau wie es funktioniert. Halte uns in jedem Fall an dieselbe Checkliste, an die du jeden anderen halten würdest. Das ist das einzige Review, das zählt.
FAQ
- Was ist Agent Washing in einfachen Worten?
- Agent Washing bedeutet, dass ein Anbieter bestehende Software – einen Chatbot, ein RPA-Skript oder einen dünnen LLM-Wrapper – ohne die zugrunde liegende Fähigkeit als „KI-Agent“ oder „KI-Mitarbeiter“ relabelt. Der Begriff stammt aus einer Gartner-Pressemitteilung vom 25. Juni 2025, die schätzte, dass von den Tausenden von Anbietern, die „agentische KI“ vermarkten, nur rund 130 tatsächlich agentisch sind. Die Lösung ist, das Verhalten zu beurteilen, nicht das Label.
- Wie erkenne ich einen echten KI-Marketing-Agenten von einem umgelabelten Chatbot?
- Stelle vier Fragen, die von Gartner und Microsoft abgeleitet sind, nicht von einem Anbieter-Datenblatt: (1) Zitiert er Belege für seine Empfehlungen? (2) Genehmigt ein Mensch Outbound-Aktionen wie Posts, E-Mails und Ad-Budget? (3) Ist der Scope je Spezialist eng, statt ein Alles-Könner-Agent? (4) Ist er managed und auditierbar – echte Operatoren, ein Audit-Log, verschlüsselte Credentials? Ein echtes Produkt besteht inhaltlich; ein gewaschenes scheitert an mindestens einem, meist Kriterium 2 oder 4.
- Ist ein vollautonomer KI-Marketer besser als ein Human-in-the-Loop-Modell?
- Heute nicht, für die meisten Marketing-Aufgaben. Gartner stellt fest, dass aktuelle Modelle die Reife fehlt, um komplexe Geschäftsziele autonom zu erreichen, und dass viele Use Cases, die heute als agentisch positioniert werden, keine agentischen Implementierungen erfordern. Das Digital Regulation Cooperation Forum des Vereinigten Königreichs (31. März 2026) ordnet ernsthafte Deployments um Level 4 ein – „User as Approver“, wo die KI plant und entwirft, ein Mensch aber folgenreiche Aktionen freigibt. Ein Human-in-the-Loop-Produkt, das Outbound gated, ist das zeitgemäße, risikoärmere Muster; volle Autonomie wird lautstark vermarktet, aber selten in der Produktion eingesetzt.
- Wo steht Ceres auf dem Autonomie-Spektrum?
- Ceres steht bei Level 4 – „User as Approver“ – für Outbound. Ein KI-Growth Officer orchestriert 11 kundenseitig wählbare Spezialisten, die diagnostizieren, entwerfen und vorschlagen; Social Posts, Cold Mails, Ad-Budget und Veröffentlichungen sind alle approval-gated, sodass ein Mensch genehmigt, bevor irgendetwas rausgeht. Die eine ehrliche Ausnahme sind reversible Mikro-Aktionen (ein Like, ein Follow), die ungated laufen, aber in einem Audit-Trail geloggt und täglich begrenzt werden. Ceres ist ausdrücklich kein „KI-Mitarbeiter, der dein Team ersetzt“ – es ist ein managed KI-Marketing-Team, das du führst.
- Erhöht oder senkt ein „KI-Mitarbeiter“-Frame die Verantwortlichkeit?
- Harvard Business Review (Mai 2026) argumentierte, dass die Behandlung von KI-Agenten wie „Mitarbeitern“ die Verantwortlichkeit aktiv mindert, weil ein „Mitarbeiter“-Frame die Verantwortung diffundiert, wenn etwas schiefläuft. Ein Human-in-the-Loop-Frame tut das Gegenteil: Der genehmigende Mensch ist verantwortlich, das Audit-Log ist der Nachweis, und „die KI hat es getan“ ist nie eine Ausrede. Deshalb verwendet Ceres Microsofts „Agent Boss“-Framing – du leitest und genehmigst; die Spezialisten entwerfen und schlagen vor.
- Kann irgendein Anbieter garantieren, dass meine Marke in ChatGPT oder AI Overviews zitiert wird?
- Nein – und eine Garantie ist selbst eine Form von Agent Washing. Die Modelle und ihr Retrieval ändern sich ständig, sodass niemand eine Platzierung auf Abruf versprechen kann. Was real ist, ist die Verbesserung deiner Chancen durch Generative Engine Optimization (GEO): Inhalte so strukturieren, dass KI-Engines sie extrahieren und zitieren können, Entitätsklarheit aufbauen und die Art von Quellenangaben verdienen, die diese Systeme bevorzugen. Der ehrliche Pitch lautet „bessere Chancen“, nie „garantierte Platzierung“. Du kannst das mit einem kostenlosen GEO-Audit testen, bevor du irgendjemanden bezahlst.