Auch kleine und mittlere Unternehmen (KMU) können in ihrer Region für kleine Budgets Werbekampagnen schalten. Geotargeting macht es möglich, Kampagnen sehr gezielt auszuspielen. Das funktioniert auch für Videowerbung online, oder im Fernsehen via Adressable TV (ATV) und Connected TV (CTV). Das Problem dabei: kleine Unternehmen haben keine geeignete Videowerbung, und die Produktion eines Spots ist mit kleinen Kampagnenbudgets kaum zu realisieren.
Die fehlende Video-Ad
Eine Video-Ad braucht ein Mindestmaß an Gestaltung: Bilder, Texte, Timing, Voice-over, Logo, vielleicht ein paar grafische Elemente, einen Abbinder und die passenden technischen Spezifikationen. Wenn Werbung im Umfeld professioneller Markenkommunikation ausgespielt werden soll, muss das Werbemittel gewissen Qualitätsstandards gereichen.
Professionelle Video Producer:innen und Agenturen können das natürlich leisten. Nur verbrennt schon ein kleiner Dreh oder Fotoshoot plus Schnitt schnell einen erheblichen Teil des Budgets, das eigentlich in die Ausspielung fließen könnte.
Videowerbung soll auch für kleine, regionale Unternehmen erschwinglich sein.
Was also tun?
Der Prototyp
Wir haben uns diese Problemstellung als Prototyp vorgenommen: Mittels KI sollten alle Aspekte einer Video-Ad-Produktion automatisiert werden. KI-Modelle können hochqualitative Videos generieren, aber eben keinen kompletten Spot. Vielmehr müssen die unterschiedlichen Gewerke einer Filmproduktion aus Konzeption, Audio und Video miteinander orchestriert und zu einem Gesamtwerk synthetisiert werden. Das ist eine Aufgabe für einen agentischen Workflow, bei dem die Komplexität der Gesamtaufgabe dadurch heruntergebrochen wird, dass sie auf verschiedene spezialisierte Akteure (Agenten) verteilt wird.
Etablierte Rollenverteilungen waren uns Vorbild: Zusammen mit Profis aus der Werbefilmbranche haben wir uns angeschaut, welche Schritte in einer klassischen Produktion zusammenkommen. Diesem Flow wurde unser Multi-Agenten-System im Prototyp nachempfunden.
Es gibt einen Agenten, der Marke, Angebot und Zielgruppe analysiert. Andere sichten das vorhandene Material, bewerten Bilder und Videos und wählen aus, was sich für die zu erzählende Botschaft eignet. Weitere schreiben Voice-over-Skripte und Onscreen-Texte, planen Szenen, denken über Bewegung und Übergänge nach oder prüfen das Gesamtergebnis. Die Datenklassen im Code tragen ganz anthropomorph die Berufsbezeichnungen ihrer menschlichen Vorbilder:
Am Ende steht eine Video-Ad mit Szenenstruktur, Voice-over, Onscreen-Texten, Logo, Abbinder und gerendertem Ausgabeformat.
Die Website als einziger Input
Wir wollten mit dem Prototyp zeigen, wie weit man kommt, wenn auch kleinste Unternehmen keine eigene Marketing-Abteilung oder Pressematerial mitbringen. Idealerweise sollten die KMU-User:innen selbst so gut wie keine Eigenleistung erbringen müssen, insbesondere keine, die Werbewissen oder gestalterische Skills benötigt. Der einzige Input für den Produktions-Workflow sollte daher sein, was wir als Minimalanforderung für Reichweitenwerbung annahmen: die Website des Unternehmens. Der Inhalt der Website sollte für die geschulten Agenten Aufschluss geben: Was macht das Unternehmen? Wie tritt es auf? Welche Tonalität ist erkennbar? Welche Botschaft könnte funktionieren? Welche Zielgruppe lässt sich ableiten?
Nach der URL-Eingabe bricht der Prototyp und sein implementiertes Agententeam auf: Die Website wird besucht, Texte, Bilder, Videos, Farben, Schriften, Logos und visuelle Hinweise werden gesammelt und zu einem Materialpool zusammengezogen. Das ist das Ausgangsmaterial für die Video-Ad.
Generative KI kann überzeugende Bilder erzeugen. Sie kann Text schreiben, Voice-over synthetisieren, Musik komponieren und einzelne Videoelemente herstellen. Aber wenn man diese Teile nur aneinanderreiht, entsteht noch keine gute Werbung. Es fehlt der gemeinsame gestalterische Rahmen.
Unser Ansatz war deshalb, generative KI mit einem gestalterischen Bausteinsystem zu verbinden. Mithilfe von Motion Graphics Designer:innen haben wir eine Sammlung an Template-Elementen gebaut, die miteinander kombiniert werden können und aus einem gemeinsamen Stil kommen: Szenenlayouts, Textflächen, Bildbereiche, Übergänge, Logo-Setzungen, Abbinder und Animationen.
Die KI entscheidet also nicht völlig frei, wie alles aussieht. Sie analysiert und wählt aus, formuliert und befüllt. Der Workflow und die Leitplanken des Bausteinsystems sorgen dafür, dass daraus kein zufälliger KI-Zusammenschnitt wird, sondern eine konsistente Video-Ad aus einem Guss.
Das Ergebnis
Was wir gelernt haben
Auch hier hat sich eine Erkenntnis bestätigt, die inzwischen nicht mehr ganz neu ist: Der Wert liegt nicht im Large-Language-Model und seinen mächtigen Fähigkeiten. Die eigentliche Wertschöpfung passiert im Aufsetzen des Drumherums, neudeutsch „Agent Harness“, also den Werkzeugen und Fähigkeiten, die die Agenten bekommen, und im Design des Workflows selbst.
Dabei geht es in erster Linie nicht um Technologie. Die Leistung liegt im crossdisziplinären Transfer, also beispielsweise darin, die intuitiven Entscheidungen einer Kameraperson oder das konzeptionelle Vorgehen von Markenberater:innen so zu verstehen und zu beschreiben, dass eine KI sie nachempfinden kann.
KI braucht einen Rahmen, der fachlich, visuell und technisch kontrolliert ist.
Der Weg vor uns
Es ging um die Frage: Lässt sich für KMU automatisiert eine Video-Ad erzeugen, wenn man KI nicht als alleinige Kreativmaschine versteht, sondern als Teil einer strukturierten Produktionskette?
Der Prototyp zeigt: Ja, das kann funktionieren. In dieser Verschränkung von Technologie, Marketing-Expertise und filmischem Handwerk sehen wir großes Potenzial. Am Ende geht es darum, KMU, regionalen Betrieben, Vereinen und kleineren Einrichtungen die Möglichkeit zu geben, mit ihrer Botschaft auch dort sichtbar zu werden, wo sonst vor allem die großen Marken auftreten.
Der nächste Schritt ist die Weiterentwicklung auf Basis des Markt-Feedbacks. Die Liste der Feature-Wünsche und -Ideen ist bereits lang.
Skribble einer UI für ein AI Ad Studio
Interesse am Prototyp?
Wir freuen uns über Feedback aus Medienvermarktung, Agenturarbeit, KMU-Marketing und Video-Produktion und zeigen den Prototyp gerne im Detail.