Interview mit Jürgen Schön, ServiceNow, zu Physical AI

„Roboter entwickeln sich vom starren Automaten zum lernfähigen System“

Roboter, die nicht nur vorprogrammierte Abläufe ausführen, sondern ihre Umgebung wahrnehmen, aus sprachbasierten Informationen lernen und sich flexibel an veränderte Bedingungen anpassen, stehen für einen neuen Entwicklungsansatz in der Automatisierung: Physical AI. Was genau darunter zu verstehen und wie weit ist diese Technologie tatsächlich ist, erklärt Jürgen Schön von ServiceNow.

6 min
Physical AI verbindet künstliche Intelligenz mit Sensorik und Aktorik: Roboter können ihre Umgebung wahrnehmen, Informationen interpretieren und daraus eigenständig Handlungen ableiten.

Herr Schön, der Begriff Physical AI taucht derzeit immer häufiger auf. Was genau versteht man darunter?
Jürgen Schön: Physical AI beschreibt KI-Systeme, die nicht auf rein digitale Anwendungen beschränkt sind, sondern direkt mit der physischen Welt interagieren. Im Unterschied zur klassischen KI, die vor allem Daten analysiert, Muster erkennt oder Inhalte generiert, verbindet Physical AI algorithmische Intelligenz mit Sensorik, Aktorik und Echtzeitverarbeitung. Sie kann ihre Umgebung erfassen, Informationen kontextualisieren und daraus situativ angemessene Handlungen ableiten. Im Fokus stehen dabei nicht mehr abstrakte Informationen, sondern reale Objekte, Prozesse und Umgebungen, etwa in der Produktion, Logistik oder im Service. Physical AI ermöglicht es Maschinen, dynamisch auf Veränderungen zu reagieren und Entscheidungen auf Basis aktueller Umgebungsdaten zu treffen.

Jürgen Schön, Head of Manufacturin Industry GTM EMEA bei ServiceNow.

Wo liegen aus industrieller Sicht die entscheidenden Unterschiede zur klassischen Robotik?
Schön: Der zentrale Unterschied liegt im Grad der Autonomie und in der Fähigkeit, mit Variabilität und Unsicherheit umzugehen. Klassische Robotik folgt festen Regeln. Sie funktioniert hervorragend in stabilen, standardisierten Umgebungen, etwa an Montagelinien mit klar definierten Abläufen. Sobald jedoch Abweichungen auftreten – ein Bauteil liegt anders, ein Mensch greift ein, Materialien variieren – stoßen diese regelbasierten Systeme an ihre Grenzen. Physical AI verfolgt einen anderen Ansatz: Statt jede mögliche Situation vorab zu definieren, wird das System in die Lage versetzt, seine Umgebung kontinuierlich wahrzunehmen, Situationen eigenständig zu interpretieren und daraus geeignete Handlungen abzuleiten.

Das klingt nach einem großen technologischen Sprung. Was macht ihn möglich?
Schön: Ein wesentlicher Treiber sind sogenannte Vision-Language-Action-Modelle. Sie verbinden visuelle Wahrnehmung, Sprachverarbeitung und Entscheidungslogik in einer gemeinsamen Architektur. Ein Roboter soll seine Umgebung nicht nur sensorisch erfassen, sondern diese Informationen mit sprachlichen Eingaben und kontextuellem Wissen kombinieren. Anweisungen werden nicht mehr als isolierte Befehle interpretiert, sondern als Beschreibung eines Ziels oder einer Absicht. Auf dieser Basis plant das System eigenständig geeignete Handlungsschritte. Das ist ein fundamentaler Unterschied zu bisherigen Systemen.

Warum ist diese Entwicklung gerade jetzt relevant?
Schön: Zum einen, weil die Rechenleistung und die Modellarchitekturen inzwischen so weit sind, dass diese Ansätze überhaupt praktikabel werden. Zum anderen, weil industrielle Umgebungen immer komplexer werden. Variantenvielfalt, kürzere Produktlebenszyklen, volatile Lieferketten und steigende Anforderungen an Sicherheit und Effizienz stellen Unternehmen vor neue Herausforderungen. Physical AI verspricht, mit dieser Dynamik besser umgehen zu können als bisherige Systeme.

Was bedeutet das konkret für Produktionsumgebungen?
Schön: In der Praxis bedeutet das vor allem eine höhere Robustheit gegenüber Abweichungen vom Idealprozess. Produktionsumgebungen sind selten so stabil und vorhersehbar, wie es klassische Planungsmodelle unterstellen. Verzögerte Materialanlieferungen, leichte Variationen bei Bauteilen, manuelle Eingriffe oder ungeplante Stillstände gehören zum Alltag. Physical AI kann hier einen anderen Umgang ermöglichen. Durch die kontinuierliche Auswertung von Umgebungsdaten und Prozessinformationen ist das System in der Lage, Situationen neu zu bewerten und alternative Handlungsoptionen abzuleiten.

Mehr Flexibilität in der Produktion: Physical AI ermöglicht Maschinen, auf Abweichungen im Prozess zu reagieren und auch in dynamischen industriellen Umgebungen autonom zu agieren.

Sie haben bereits angesprochen, dass Physical AI vor allem dort interessant wird, wo Prozesse komplex und dynamisch sind. Können Sie das an konkreten Anwendungsbeispielen festmachen?
Schön: Nehmen wir die Instandhaltung. Heute sind viele Wartungsprozesse stark reaktiv: Eine Maschine fällt aus, ein Mensch wird gerufen, ein Fehler wird manuell diagnostiziert. Physical AI verändert diesen Ablauf. Sensorik, visuelle Analyse und kontextbezogene Auswertung ermöglichen es Robotern, Anomalien frühzeitig zu erkennen, mögliche Ursachen einzugrenzen und erste Maßnahmen vorzubereiten. Das System versteht, dass etwas nicht stimmt und auch, in welchem betrieblichen Zusammenhang das Problem steht.

Das klingt nach einer Verschiebung von reaktiven zu proaktiven Prozessen?
Schön: Genau. Und das betrifft nicht nur die Instandhaltung. In der Logistik etwa können Roboter mit Physical AI auf unvorhergesehene Situationen reagieren, wie beispielsweise blockierte Wege, veränderte Prioritäten und plötzlich auftretende Sicherheitsrisiken. Statt starrer Routenplanung entsteht eine dynamische Entscheidungslogik. Das System versteht, dass Sicherheit jetzt wichtiger ist als Geschwindigkeit, oder dass ein bestimmter Auftrag Vorrang hat. Diese Kontextsensitivität war bislang kaum möglich.

Ein zentraler Punkt in diesem Zusammenhang ist das Training der Systeme. Wie lernen Roboter heute?
Schön:
Hier hat sich in den vergangenen Jahren enorm viel getan. Das Training hat sich stark von der physischen in die virtuelle Welt verlagert. Früher waren reale Testaufbauten notwendig, um Roboter zu trainieren. Das war teuer, langsam und oft riskant. Heute setzen viele Entwicklungen auf Simulationen und synthetische Trainingsdaten. In simulierten Umgebungen lassen sich tausende Varianten eines Szenarios erzeugen: unterschiedliche Lichtverhältnisse, Objektformen, Hindernisse, Störungen. Das System wird so mit einer großen Bandbreite möglicher Bedingungen konfrontiert und lernt, generalisierbare Strategien zu entwickeln, anstatt nur einzelne Abläufe zu reproduzieren. Das reduziert Ausfallzeiten, erhöht die Sicherheit und verkürzt Einführungsphasen.

Wie wichtig ist dabei die Qualität der Daten?
Schön:
Die Datenqualität ist ein entscheidender Erfolgsfaktor. Physical AI ist nur so gut wie die Daten, auf denen sie basiert. Dabei geht es um Qualität, aber auch um Vielfalt. Systeme müssen mit einer großen Vielfalt an Situationen konfrontiert werden, um robuste und verallgemeinerbare Entscheidungsmodelle entwickeln zu können. Gerade in industriellen Anwendungen ist das besonders relevant, weil viele kritische Szenarien selten auftreten, im Ernstfall aber erhebliche Auswirkungen haben können. Reale Daten allein decken diese Fälle oft nicht ausreichend ab. Hier liegt eine der zentralen Stärken synthetischer Daten: Sie ermöglichen es, gezielt Extrem- und Ausnahmesituationen zu erzeugen, etwa ungewöhnliche Objektkonstellationen, Fehlerzustände oder Kombinationen mehrerer Störfaktoren.

Ein weiterer Aspekt ist das Zusammenspiel zwischen Mensch und Maschine. Wie verändert sich das durch Physical AI?
Schön:
Wir bewegen uns weg vom klassischen Bedienkonzept hin zu einer kooperativen Beziehung. Statt jeden Schritt manuell vorzugeben, formuliert der Mensch Ziele, Prioritäten oder Sicherheitsanforderungen. Das System setzt diese in konkrete Handlungen um. Wichtig zu betonen ist, dass der Mensch jederzeit die Kontrolle behält und jederzeit eingreifen kann.

Wirft das nicht auch Fragen der Verantwortung auf?
Schön:
Ja, und diese Fragen gewinnen mit zunehmender Autonomie deutlich an Bedeutung. Je mehr Entscheidungsspielraum ein System erhält, desto wichtiger werden Transparenz, Nachvollziehbarkeit und klare Verantwortlichkeiten. Unternehmen müssen verstehen können, warum ein System eine bestimmte Entscheidung getroffen hat und welche Daten, Annahmen oder Modelle dabei eine Rolle gespielt haben. Gerade in sicherheitskritischen Bereichen braucht es klare Eskalationsmechanismen. Physical AI darf keine Black Box sein.

Automation NEXT Conference 2026

Sie sind an dem Thema 'Physical AI' interessiert? Dann melden Sie sich unbedingt zur Automation NEXT Conference 2026 an - denn hier dreht es sich neben anderen spannenden Themen auch um Neuentwicklungen rund um Physical AI!

Die Veranstaltung bringt Entscheider, Produktionsverantwortliche, Entwickler und Digitalisierungsexperten zusammen, um die zentralen Herausforderungen moderner Fertigung zu diskutieren und konkrete Lösungen erlebbar zu machen.Im Mittelpunkt stehen praxisnahe Einblicke in den Einsatz von KI und generativen Copilots in Engineering und Produktion, der Nutzen von Cobots und kognitiver Robotik zur Entlastung des Fachkräftemangels sowie der Weg zur Smart Factory durch IIoT, Industrial Networks und MES-Systeme. Die Teilnehmenden profitieren von hochkarätigen Speakern und Experten führender Unternehmen, die ihr Wissen anhand konkreter Best Practices teilen und Raum für direkte Diskussionen bieten. Die Veranstaltung schafft ein Umfeld für intensives Networking – von Gesprächen zwischen den Sessions bis hin zum abschließenden Get together – und bietet einen umfassenden Zugang zu allen Vorträgen, Panels, Diskussionsrunden sowie zur begleitenden Ausstellung. Verpflegung und Networking-Pausen sind inklusive und unterstützen den persönlichen Austausch auf Augenhöhe der Teilnehmer.

Weitere Informationen rund um die Veranstaltung finden Sie hier.

Welche Rolle spielen Plattformen in diesem Kontext?
Schön: Plattformen sind die verbindende Schicht, die Physical AI erst industriell nutzbar macht. Einzelne autonome Systeme entfalten ihren Mehrwert nicht im Alleingang, sondern nur dann, wenn sie in übergreifende Prozesse eingebettet sind. Physical AI muss mit Planungssystemen, MES- und ERP-Lösungen, digitalen KI-Agenten und menschlichen Entscheidern nahtlos zusammenarbeiten. Eine einheitliche Unternehmensplattform übernimmt in diesem Zusammenspiel die Orchestrierung. Sie integriert Daten aus unterschiedlichen Quellen, koordinieren Abläufe und stellen sicher, dass physische und digitale Aktionen aufeinander abgestimmt sind. Dadurch entsteht ein durchgängiger Workflow, der von der Planung über die Ausführung bis zur Überwachung und Optimierung reicht. Gleichzeitig schafft dieser Plattformansatz Transparenz und Nachvollziehbarkeit. Entscheidungen werden zentral dokumentiert und Verantwortlichkeiten klar zugeordnet werden. Das ist besonders wichtig, wenn autonome Systeme in sicherheits- oder qualitätskritische Prozesse eingebunden sind. In diesem Sinne sind Plattformen nicht nur technische Infrastruktur, sondern ein Governance-Instrument.

Was passiert, wenn Unternehmen diesen Plattformgedanken ignorieren?
Schön:
Dann bleibt Physical AI auf dem Niveau einzelner, isolierter Anwendungsfälle stehen. Technisch können solche Lösungen durchaus beeindruckend sein, ihr strategischer Nutzen für das Unternehmen bleibt jedoch begrenzt. Ohne Plattform entstehen Insellösungen, die weder sauber integrierbar noch skalierbar sind. Dann entwickelt jeder Anwendungsfall seine eigenen Schnittstellen, Regeln und Kontrollmechanismen. Das erhöht die Komplexität, erschwert den Betrieb und macht eine übergreifende Steuerung nahezu unmöglich. Gerade bei autonomen Systemen wird das schnell kritisch. Ohne zentrale Orchestrierung fehlt die Transparenz darüber, wer oder was wann welche Entscheidung trifft. Governance, Compliance und Sicherheitskonzepte lassen sich dann nur schwer durchsetzen.

Viele Unternehmen fragen sich, ob Physical AI wirtschaftlich sinnvoll ist oder ob es sich um ein technologisches Zukunftsversprechen handelt. Wie schätzen Sie das ein?
Schön:
Die Frage nach der Wirtschaftlichkeit ist zentral und absolut legitim. Physical AI ist kein Selbstzweck und auch keine Technologie, die sich für jeden Anwendungsfall automatisch rechnet. Ihr Mehrwert entsteht dort, wo klassische Automatisierung strukturell an Grenzen stößt, etwa bei hoher Variabilität oder komplexen Entscheidungslogiken. Wenn Prozesse stark schwanken, viele Sonderfälle auftreten oder menschliche Eingriffe regelmäßig notwendig sind, wird regelbasierte Automatisierung schnell ineffizient und teuer im Betrieb. Genau hier kann Physical AI ihre Stärken ausspielen.

Vom programmierten Automaten zum lernfähigen System: Moderne Robotik nutzt Vision-Language-Action-Modelle, um visuelle Daten, Sprache und Entscheidungslogik miteinander zu verknüpfen.
Vom programmierten Automaten zum lernfähigen System: Moderne Robotik nutzt Vision-Language-Action-Modelle, um visuelle Daten, Sprache und Entscheidungslogik miteinander zu verknüpfen.

Woran lässt sich der Return on Investment konkret festmachen?
Schön:
Der ROI lässt sich nicht allein an klassischen Kennzahlen wie Personalkosten oder Automatisierungsgrad abbilden. Viel wichtiger sind die Effekte auf die Gesamtperformance der Prozesse. Ein zentraler Faktor sind reduzierte Stillstandzeiten. Wenn Systeme flexibler auf Störungen reagieren und alternative Abläufe entwickeln können, sinkt die Anzahl ungeplanter Unterbrechungen deutlich. Hinzu kommen eine höhere Prozessstabilität und eine bessere Produktqualität. Weniger Ausschuss, geringere Nacharbeit und konsistentere Ergebnisse sind direkte wirtschaftliche Hebel. Ebenso relevant ist die bessere Auslastung von Anlagen und Ressourcen, weil Engpässe dynamischer ausgeglichen werden können.

Welche Risiken sehen Sie bei der Einführung solcher Systeme?
Schön:
Ein Risiko ist sicherlich die Überschätzung dieser Technologie. Physical AI ist leistungsfähig, aber nicht allwissend. Systeme müssen sorgfältig trainiert, überwacht und kontinuierlich angepasst werden. Ein weiteres Risiko ist eine mangelnde Integration. Wenn autonome Systeme isoliert eingesetzt werden, entstehen eher neue Komplexitäten anstatt zielgerichteter Lösungen.

Wie sollten Unternehmen heute konkret vorgehen, wenn sie sich mit Physical AI beschäftigen wollen?
Schön:
Unternehmen sollten Physical AI nicht als Technologieprojekt starten, sondern als strategische Weiterentwicklung ihrer Prozesse. Der erste Schritt ist eine ehrliche Prozessanalyse. Wo gibt es Komplexität, Unsicherheit oder Sicherheitsrisiken? Dort liegt das größte Potenzial. Darauf aufbauend empfiehlt sich ein klar abgegrenztes Pilotprojekt. Wichtig dabei ist, dass dieses nicht isoliert ist, sondern in bestehende IT- und Prozesslandschaften eingebettet werden. Themen wie Datenanbindung, Plattformarchitektur, Governance und Skalierbarkeit sollten von Anfang an mitgedacht werden. Parallel dazu müssen Unternehmen die organisatorische Dimension berücksichtigen. Physical AI verändert Rollenbilder. Mitarbeitende werden weniger operative Ausführende, sondern übernehmen stärker überwachende, koordinierende und bewertende Funktionen. Das erfordert neue Kompetenzen in den Bereichen Systemverständnis, Dateninterpretation und Entscheidungsmanagement. Eine erfolgreiche Einführung bedeutet deshalb, Technologie, Prozesse und Qualifikation gemeinsam weiterzuentwickeln.

Ein Blick in die Zukunft: Wo stehen wir in drei bis fünf Jahren?
Schön:
Ich erwarte, dass Roboter deutlich alltagstauglicher werden. Systeme werden zuverlässiger, besser integrierbar und stärker auf den realen Betrieb ausgelegt. Roboter werden weniger als isolierte Spezialmaschinen auftreten, sondern als adaptive Systeme, die eng mit Menschen zusammenarbeiten. Der Fokus liegt nicht auf vollständiger Automatisierung, sondern auf intelligenter Arbeitsteilung. Besonders in Logistik, Instandhaltung, Service und Qualitätsprüfung wird Physical AI spürbare Veränderungen bringen, weil dort Flexibilität und schnelle Reaktion entscheidend sind.

Woran wird sich in den kommenden Jahren entscheiden, welche Unternehmen vorne liegen und welche ins Hintertreffen geraten?
Schön:
Entscheidend wird sein, wie früh Unternehmen die organisatorischen und technologischen Voraussetzungen schaffen. Der Wettbewerbsvorteil entsteht nämlich nicht durch maximale Automatisierung, sondern durch ein hohes Maß an Flexibilität, Robustheit und Reaktionsfähigkeit. In einem Umfeld wachsender Komplexität wird genau diese Anpassungsfähigkeit zum zentralen Erfolgsfaktor. Für Entscheider heißt das: heute Kompetenzen aufbauen, Strukturen vorbereiten und erste Erfahrungen sammeln. Nicht alles muss sofort umgesetzt werden, aber die Richtung muss klar sein.

FAQ: Physical AI in der Industrie

1. Was ist unter Physical AI zu verstehen?
Physical AI bezeichnet KI-Systeme, die nicht nur digitale Daten verarbeiten, sondern direkt mit der physischen Welt interagieren. Sie verbinden künstliche Intelligenz mit Sensorik, Aktorik und Echtzeitverarbeitung, um ihre Umgebung zu erfassen, zu interpretieren und daraus situativ passende Handlungen abzuleiten.

2. Worin unterscheidet sich Physical AI von klassischer Robotik?
Klassische Robotik arbeitet vor allem regelbasiert und ist auf stabile, standardisierte Abläufe ausgelegt. Physical AI geht darüber hinaus: Sie kann mit Abweichungen, Unsicherheiten und wechselnden Bedingungen umgehen, Situationen eigenständig bewerten und flexibel reagieren.

3. Welche Technologien machen Physical AI möglich?
Ein zentraler Treiber sind sogenannte Vision-Language-Action-Modelle. Diese verbinden visuelle Wahrnehmung, Sprachverarbeitung und Entscheidungslogik. Dadurch können Roboter nicht nur Objekte erkennen, sondern auch sprachliche Anweisungen im Kontext verstehen und eigenständig geeignete Handlungsschritte planen.

4. In welchen industriellen Bereichen ist Physical AI besonders relevant?
Besonders interessant ist Physical AI in dynamischen und komplexen Umgebungen wie Produktion, Logistik, Instandhaltung, Service und Qualitätsprüfung. Dort kann sie helfen, auf Störungen, Materialabweichungen, Sicherheitsrisiken oder veränderte Prioritäten flexibel zu reagieren.

5. Was müssen Unternehmen bei der Einführung von Physical AI beachten?
Unternehmen sollten Physical AI nicht nur als Technologieprojekt betrachten, sondern als strategische Weiterentwicklung ihrer Prozesse. Wichtig sind eine saubere Prozessanalyse, ein klar umrissenes Pilotprojekt, eine gute Datenbasis, die Einbindung in bestehende IT- und Plattformstrukturen sowie klare Regeln für Transparenz, Governance und Verantwortung.