Künstliche Intelligenz hat keine Fantasie!
Prof. Dr. Thomas Wortmann über die Grenzen generativer KI, die ernüchternde Realität von BIM und eine Branche, die auf Zeit spielt.
Als Leiter der Abteilung Computing in der Architektur am Institut für Computerbasiertes Entwerfen und Baufertigung (ICD/CA) der Universität Stuttgart entwickelt Prof. Dr. Thomas Wortmann computerbasierte Entwurfsmethoden, die material- und energieeffizientes Bauen unterstützen. Ein Schwerpunkt seiner Forschung liegt auf der Optimierung und Visualisierung multikriterieller Lösungsräume – von Energieeffizienz über Tageslichtqualität bis zum Materialverbrauch.
DAB: Prof. Dr. Wortmann, BIM (Building Information Modeling) sollte die Architektur revolutionieren – und wird seit 20 Jahren versprochen. Jetzt entbrennt um KI derselbe Hype. Fangen wir mit BIM an: Wo stehen wir wirklich?
Prof. Dr. Thomas Wortmann: BIM ist auf jeden Fall ein Erfolg, aber nicht auf die Art, wie man es sich erhofft hatte. In der Architekturpraxis läuft es meist auf eines hinaus: die Schlitzplanung, die Koordination von Durchbrüchen. Das ist ernüchternd. Dafür gibt es zwei Gründe: Die Technologie selbst konnte letztlich nicht liefern, was die Softwareindustrie versprochen hatte. Und Deutschland hat BIM nie wirklich tief genug in die Arbeitsprozesse integriert, um den Nutzen daraus zu ziehen. Hinzu kommt, dass wir im internationalen Vergleich schlicht hinterher sind. In Singapur gibt es seit mehr als zehn Jahren den digitalen Bauantrag mit BIM. Deutschland zieht da gerade erst nach.
Brauchen wir BIM dann überhaupt noch, macht KI es nicht schlicht überflüssig?
Das glaube ich nicht. Für KI brauchen wir strukturierte, gut organisierte, maschinenlesbare Daten. Wenn ich mit Architekturbüros spreche, ist das eigentlich immer das Problem: Jahrzehntelang wurden Projektdaten gesammelt, aber eben nicht strukturiert, nicht greifbar. Büros, die schon lange BIM machen, haben inzwischen vielleicht einen ganzen Ordner an Modellen. Die sind aber oft nicht konsistent modelliert – und damit für KI-Training nicht direkt nutzbar. Dabei ist BIM ist eigentlich die naheliegendste Methode, Projektdaten strukturiert zu erfassen. Wer das nicht getan hat, kann von KI kaum profitieren.
Was kann KI in der Architektur heute denn wirklich leisten?
Das Generieren von Bildern hat sich im Büroalltag mehr oder weniger durchgesetzt. Aus Großbritannien kenne ich eine Umfrage, wonach das jeder zweite Architekt nutzt – eine Reihe Softwareanbieter haben es in ihre Software integriert. Aber sobald man verschiedene Ansichten desselben Gebäudes generiert, innen und außen, passt es nicht zusammen. Das ist die aktuelle Grenze dieser Technologie.
KI besitzt kein Verständnis grundlegender räumlicher Konzepte wie oben und unten, links und rechts – und keine Vorstellung von Schwerkraft. Ein Haushaltsroboter tut sich extrem schwer, den Geschirrspüler einzuräumen. Es gibt Videos, in denen ein Roboter 20 Minuten lang versucht, drei Teller hineinzuräumen. Das ist dieselbe Grenze, an der Architektur-KI heute scheitert. Was wirklich funktioniert, ist etwas anderes: Werte vorherzusagen, die sonst zeitintensive Simulationen erfordern – in Echtzeit. Energiebedarf, Tageslichtqualität, Windlasten, Fertigungszeiten. Das erlaubt uns, Entwurfsentscheidungen aufgrund von belastbaren Informationen zu treffen.
Steckt genau dieser Grundgedanke hinter dem Tool Opossum, das Sie im Rahmen Ihrer Promotion entwickelt haben?
Bei meiner Promotion ging es um Optimierung und um eine Erkenntnis, die damals durchaus überraschend war: Für die Berechnung von Energiebedarf oder Tageslicht sind evolutionäre Algorithmen, die bis dahin als Standard galten, gar nicht am besten geeignet. Modellbasierte Algorithmen, die maschinelles Lernen nutzen, sind schneller und liefern bessere Ergebnisse. Wenn man Entwürfe regelbasiert generiert, liegt es nahe, sie auch automatisch zu bewerten – typischerweise mit einer Energiesimulation oder, was aus meiner Sicht grundsätzlich dazugehören sollte, einer Lebenszyklus-Berechnung. Das Problem dabei: Solche Berechnungen dauern.
In der Praxis ist man froh, wenn die Berechnung überhaupt einmal gemacht wurde. Wir sprechen aber davon, 500 oder Tausende Varianten durchzurechnen. Was Opossum macht: möglichst schnell gute Ergebnisse finden. Man sieht: Wenn wir es so lösen, hat der Entwurf einen sehr geringen Energiebedarf. Wenn wir es anders lösen, wird er günstiger, aber weniger nachhaltig und so weiter.
Der Entwerfende behält die Kontrolle, hat aber konkrete Zahlen vor sich statt eines Bauchgefühls. Dazu kommt eine Visualisierungskomponente: Wir stellen nicht nur das Optimum dar, sondern einen Lösungsraum. Man hat fünf Entwürfe auf dem Tisch, alle mit unterschiedlichen Profilen in Bezug auf Kosten und Nachhaltigkeit, und spricht dann darüber, statt den Entwurf iterativ immer wieder anzupassen. Das nennen wir Performance-Informed Design.
Überzeugend – und trotzdem kommt es nicht in der Praxis an. Warum?
Dafür gibt es verschiedene Gründe. Einer ist die Struktur der deutschen Architekturbranche: sehr viele kleine Bürostrukturen, in denen kaum Zeit bleibt, sich neue Kompetenzen anzueignen und Prozesse weiterzuentwickeln. Wenn Büros trotzdem in diese Richtung gehen, liegt es fast immer daran, dass die Gründer oder Eigner das persönlich antreibt.
Wir bilden jedes Jahr rund 30 Leute aus, die das beherrschen – aber selbst das reicht nicht. Denn selbst wenn ein Büro eine solche Person einstellt, stellt sich die Frage: Lässt sie sich wirklich in den Alltag integrieren? Wird ihr Können täglich gebraucht – oder nur alle zwei Monate? Und dann gibt es noch den ganz harten Grund: fehlende Vergütung. Am Ende sagen die Leute: Das finde ich alles spannend – aber ich kann es nicht abrechnen, und deswegen machen wir es nicht.
Letztlich verfolge ich auch ein politisches Ziel: die Architektenschaft zu ermächtigen, ihre eigene Software zu entwickeln – damit sie nicht länger so abhängig ist von der Softwareindustrie.
Das heißt, die Lösung liegt langfristig in der Ausbildung. Sie richten gerade ein neues Bachelorfach ein – was müssen Architekturstudierende heute unbedingt lernen?
Programmieren! Denn das ist nach wie vor die Grundfähigkeit. Man könnte einwenden, dass man das nicht mehr lernen muss, das macht doch die KI. Aber ich erlebe in Bewerbungsgesprächen immer wieder, dass Kandidaten angeben, programmieren zu können, es aber nicht wirklich können, weil sie es ausschließlich mit KI-Unterstützung gelernt haben. An einfachsten Aufgaben scheitern sie dann.
Man braucht die Kompetenz, Programme zu verstehen, zu ändern, zu korrigieren und letztlich algorithmisch denken zu können. Dazu kommt Computational Geometry, also Vektormathematik: Wie beschreibe ich geometrische Objekte so, dass ich im Computer wirklich etwas damit anfangen kann?
Ich glaube tatsächlich, alle sollten das mal gemacht haben – so wie man Tragwerke oder Taupunkte berechnen lernt, auch wenn man es am Ende nicht täglich braucht, sondern einfach als Hintergrundwissen mitnimmt. Es geht auch nicht darum, dass alle im Büro Anwendungen programmieren. Aber alle sollten verstehen, wie das funktioniert und was man von KI erwarten kann und was nicht.
Wie erleben Sie das in der Praxis der Lehre?
Im Master habe ich ein KI-Seminar, in dem Studierende, die bereits programmieren können, kleine eigene KI-Projekte entwickeln, immer mit konkreten Anwendungen. Selbst Kollegen aus der Informatik sagen, das sei bemerkenswert, weil dort vieles eher theoretisch und methodisch bleibt.
Architekturstudierende denken von Anfang an in Anwendungen, das ist eine echte Stärke. Ein besonders eindrückliches Beispiel war ein Masterprojekt, in dem wir KI-Modelle mit Bauten der klassischen Moderne trainiert haben. Die Wahl war bewusst: Diese Architektur ist geometrisch beherrschbar, klare 90-Grad-Winkel, vertikale und horizontale Flächen. Heraus kamen neue Grundrisse, die erkennbar in dieser Tradition standen, aber so nie existiert hatten.
Und was treibt Sie in Ihrer eigenen Forschung gerade an?
Was mich antreibt, ist seit Jahren dieselbe Frage: Kann KI dreidimensionale Architekturzusammenhänge wirklich generieren? Diffusionsmodelle, also die Modelle hinter den Bildgeneratoren, funktionieren so: Sie fügen einem Bild schrittweise Rauschen hinzu, bis nur noch Rauschen übrig ist, und lernen dann, dieses Rauschen strategisch wieder zu entfernen, sodass neue Bilder entstehen. Dieselbe Methode lässt sich grundsätzlich auch auf dreidimensionale Geometrie anwenden. Allerdings ist das im Moment auf dem Level einer Schraube oder eines Tisches, aber auf keinen Fall in der Komplexität eines Gebäudes. Wir haben das bereits mit einem Datensatz aus Bauten der klassischen Moderne versucht. Das hat kaum funktioniert, weil Diffusionsmodelle für 3D sehr komplex sind und dem ein entsprechend großer Datensatz gegenüberstehen muss.
Was mit einem einfachen Modell und einem kleinen Datensatz funktioniert hat, war ein anderer Ansatz: ein BIM-Assistent, der beim Modellieren mitdenkt. Man platziert eine Decke, und das System schlägt vor, eine Stütze darunter zu setzen. Das funktioniert erstaunlich gut.
Nun haben wir im Rahmen des Exzellenzclusters Integratives computerbasiertes Planen und Bauen für eine transformative Architektur (IntCDC) ein Forschungsprojekt, das nächsten Monat beginnt und genau diese Lücke schließen soll. Wir wollen mit Diffusionsmodellen dreidimensionale Protogebäude generieren, bezogen auf das Holzbausystem, das am IntCDC entwickelt wird. Man gibt eine Parzelle in der Stadt vor, das System generiert einen sinnvollen Holzbau.
Neben der Architektur, vertreten durch Achim Menges, ist mit Jan Knippers auch die Tragwerksplanung dabei, weil das Ergebnis auch statisch Sinn machen muss. Und wir haben mit Mathias Niepert einen KI-Experten im Team, der für die chemische Industrie Moleküle generiert. Dazu kommt Daniel Weiskopf, der neuartige Interaktionsmethoden mit diesem KI-System entwickelt. Wir haben jetzt dreieinhalb Jahre Zeit dafür und die richtigen Partner. Der Durchbruch wäre, wenn das Ergebnis erkennbar Architektur ist. Nicht unbedingt etwas, das man sofort bauen kann, aber nicht mehr nur Stuhl und Tisch, sondern tatsächlich komplexere Strukturen.
Aber eines bleibt dabei klar: Künstliche Intelligenz hat keine Fantasie. Sie kann kombinieren, optimieren, vorschlagen. Was sie nicht kann, ist Architektur, die in den Kontext integriert ist, in die kulturelle Bedeutungen eingewoben sind, die man körperlich erlebt. Das bleibt in der Hand des Entwerfers.
DAB Redaktion
BerlinDas könnte Sie auch interessieren
Neues Wissen,
smarte Projekte und
inspirierende Ideen
Entdecken Sie die Welt der Architektur –
jetzt im exklusiven DAB Update!