KI-Agent mit n8n einrichten: Schritt-für-Schritt-Anleitung

Sora Yazılım Ekibi5.6.2026

n8n AI Agent Der n8n AI Agent Node kombiniert ein LLM, Tools und Speicherkomponenten in einer ReAct-Schleife und ermöglicht es Ihnen, KI-Agenten auf Enterprise-Niveau ohne Programmieraufwand zu erstellen. Diese Anleitung bietet eine vollständige Roadmap für die Einrichtung eines funktionsfähigen Agenten von Grund auf.

Was ist der n8n AI Agent?

Der n8n AI Agent Node ist ein spezialisierter Workflow-Knoten, der ein Large Language Model mit einer Tool-Liste und einer optionalen Speicherkomponente kombiniert. Der Agent führt automatisch die LLM-Anfrage-Tool-Aufruf-Schleife aus, bis er das Ziel erreicht oder ein Schrittzähler-Limit greift.

Im Unterschied zu herkömmlichen Automatisierungstools, die einer festen Regelsequenz folgen, nutzt der n8n AI Agent Node ein dynamisches Entscheidungsverfahren. Der Node leitet die Benutzereingabe an das LLM weiter; das LLM entscheidet, welches Tool aufgerufen werden soll, empfängt dessen Ausgabe und wiederholt die Schleife bei Bedarf. Dieses Muster ist in der Literatur als ReAct (Reasoning and Acting) oder Function-Calling bekannt.

Für eine umfassendere Perspektive zu den Enterprise-Workflow-Automatisierungsfunktionen von n8n empfiehlt es sich, zunächst die Kernarchitektur zu verstehen. Der AI Agent Node ist vollständig in das Standard-Node-Ökosystem von n8n integriert: Der Trigger kann ein Chat Trigger, ein Webhook oder eine beliebige Datenquelle sein.

Vier Schlüsselkomponenten bestimmen das Verhalten des Agenten: das Chat-Modell (LLM), die Tool-Liste, der Speicher und der System-Prompt. Die korrekte Konfiguration dieser Komponenten wirkt sich direkt auf die Funktionalität und Zuverlässigkeit des Agenten aus.

Erforderliche Komponenten: LLM, Tools, Speicher und Vector Store

Ein funktionsfähiger n8n AI Agent erfordert mindestens vier Komponenten: eine LLM-Anbieter-Zugangsdaten, mindestens eine Tool-Definition, einen optionalen Memory Node und einen zielorientierten System-Prompt. Ein Vector Store wird als zusätzliche Komponente für RAG-Szenarien hinzugefügt.

Die Wahl des LLM-Anbieters ist die kritischste Entscheidung, die sowohl die Leistung des Agenten als auch die Betriebskosten beeinflusst. Die folgende Tabelle fasst die von n8n unterstützten Anbieter und ihre wichtigsten Eigenschaften Stand Mai 2026 zusammen.

Anbieter	Modellbeispiele	Hosting	Betriebshinweis
OpenAI	GPT-4o, GPT-4.1, o3	Cloud (API)	Breite Tool-Unterstützung; stabiler JSON-Modus
Anthropic	Claude Sonnet 4, Claude Opus 4	Cloud (API)	Langer Kontext; Enterprise-Sicherheitsfokus
Mistral AI	Mistral Large, Codestral	Cloud / Self-hosted	Europäische Datensouveränität; Kostenvorteil
Google Vertex AI	Gemini 2.5 Pro, Gemini Flash	Cloud (GCP)	Starke GCP-Integration; multimodal
Ollama	Llama 3.3, Mistral, Phi-4	Lokal / On-premise	Maximaler Datenschutz; GPU erforderlich
OpenAI-kompatibler Endpoint	Beliebiges LM Studio, vLLM-Modell	Self-hosted	Flexibel für custom Fine-Tuned-Modelle

Tools ermöglichen dem Agenten, über die vom LLM generierten Antworten hinaus reale Aktionen durchzuführen. Ein Tool kann ein n8n-Sub-Workflow, ein HTTP Request Node oder eine Datenbankabfrage sein. Der Memory Node speichert vorherige Nachrichten als Kontext für das LLM in Mehrfachrunden-Gesprächen, sodass der Agent 'sich erinnern' kann. Wenn ein Vector Store integriert wird, erhält der Agent ein Tool für die semantische Suche in einer Wissensbasis (RAG).

Schritt für Schritt: Ihren ersten KI-Agenten einrichten

Ein n8n AI Agent Workflow besteht aus einem Trigger-Node, einem AI Agent Node, einer Chat-Modell-Verbindung und mindestens einer Tool-Definition. Alle Komponenten können in wenigen Minuten per Drag-and-Drop in der n8n-Oberfläche konfiguriert werden.

Schritt 1: Trigger auswählen. Verwenden Sie den Chat Trigger Node für Tests über eine Chat-Oberfläche. In der Produktion kann auch ein Webhook Trigger oder ein geplanter Cron Trigger geeignet sein. Der Chat Trigger aktiviert die integrierte Chat-Oberfläche von n8n und ist ideal für schnelles Prototyping.

Schritt 2: AI Agent Node hinzufügen. Suchen Sie im Node-Panel nach 'AI Agent' und ziehen Sie ihn in Ihren Workflow. Dieser Node hat drei Unterverbindungspunkte: Chat Model (erforderlich), Memory (optional) und Tools (optional, aber empfohlen).

Schritt 3: Chat Model verbinden. Verbinden Sie einen OpenAI Chat Model Node oder den Node Ihres bevorzugten Anbieters mit dem Chat Model-Eingang des AI Agent Nodes. Ihre Zugangsdaten (API-Schlüssel) müssen vorab im n8n Credentials-Panel definiert worden sein.

Schritt 4: System-Prompt verfassen. Füllen Sie das Feld 'System Message' in der Konfiguration des AI Agent Nodes aus. Dieses Feld definiert die Rolle des Agenten, welche Tools wann verwendet werden und das Antwortformat. Beispiel: 'Sie sind der Kundensupport-Assistent von Sora Software. Verwenden Sie das Datenbank-Tool nur für Bestellabfragen.'

Schritt 5: Mindestens ein Tool hinzufügen. Verbinden Sie einen 'Calculator' (integriert) oder einen benutzerdefinierten Sub-Workflow Node mit dem Tools-Verbindungspunkt. Jedes Tool muss einen klaren Namen und eine Beschreibung haben; das LLM liest diese Beschreibungen, um zu entscheiden, welches Tool es auswählen soll.

Schritt 6: Testen. Klicken Sie auf die 'Chat'-Schaltfläche, um die integrierte Chat-Oberfläche von n8n zu öffnen, und stellen Sie eine Frage. Das Ausführungsprotokoll zeigt, welche Tools das LLM wie oft aufgerufen hat und welche Daten es bei jedem Schritt verwendet hat.

Schritt	Node / Komponente	Erforderlich?	Beschreibung
1	Chat Trigger / Webhook	Ja	Empfängt Benutzereingaben
2	AI Agent	Ja	Zentraler Agent-Node; verwaltet die ReAct-Schleife
3	Chat Model (z. B. OpenAI)	Ja	Stellt die Verbindung zum Sprachmodell her
4	System Message	Empfohlen	Definiert die Rolle und Einschränkungen des Agenten
5	Tool (Sub-Workflow, HTTP usw.)	Empfohlen	Gibt dem Agenten reale Fähigkeiten
6	Memory Node	Nein (ja für Mehrfachrunden)	Bewahrt den Gesprächsverlauf

Tool-Nutzung: Sub-Workflow, HTTP Request und Datenbank

Um einem n8n AI Agent Tools hinzuzufügen, kann jeder n8n-Node oder Sub-Workflow mit dem Tools-Verbindungspunkt verbunden werden. Das LLM entscheidet anhand des System-Prompts und der Tool-Beschreibungen eigenständig, welches Tool wann aufgerufen wird.

Sub-Workflow-Tools sind die leistungsstärkste Konfigurationsoption. Wenn Sie einen separaten n8n-Workflow über den Execute Workflow Node als Tool definieren, stellen Sie die gesamte Logik dieses Workflows (Bedingungen, Schleifen, mehrere API-Aufrufe) als einzelnes Tool bereit. Dieser Ansatz ist der sauberste Weg, um komplexe Geschäftsprozesse für den Agenten zugänglich zu machen.

Mithilfe von dem HTTP Request Node für Webhook- und API-Integration können Sie sich mit externen Systemen verbinden. Sie können beispielsweise HTTP Request Nodes, die Kundendaten aus einer CRM-API abrufen, eine Rechnung in einem Buchhaltungssystem erstellen oder ein Support-Ticket schließen, als Tools definieren. Halten Sie das Feld 'description' jedes Tools klar und präzise – das LLM liest es, um zu entscheiden, wann es das Tool verwenden soll.

Für Datenbank-Tools können Sie Postgres-, MySQL- oder MongoDB-Nodes direkt als Tools verbinden. Die bewährte Sicherheitspraxis besteht darin, Tool-Nodes einen schreibgeschützten Datenbankbenutzer zuzuweisen und Schreibrechte nur nach einem separaten Genehmigungsschritt zu erteilen. Unternehmensweite n8n-Anwendungsfälle umfassen häufig solche hybriden Agenten-Datenbank-Workflows.

Die Tool-Benennung wirkt sich direkt auf die Leistung aus: Klare, aktionsorientierte Namen wie 'get_customer_orders' liefern weitaus bessere LLM-Entscheidungen als vage Namen wie 'tool1'. Geben Sie in jeder Tool-Beschreibung an, welche Eingabe erwartet wird und welche Ausgabe zurückgegeben wird.

Speicher- und Kontextverwaltung

Die Speicherverwaltung im n8n AI Agent erfolgt über den Memory Node. Dieser Node speichert den Gesprächsverlauf und leitet ihn bei jeder neuen Runde an das LLM weiter, damit der Agent den Kontext behält und konsistente Antworten in einem Mehrfachrunden-Gespräch produziert.

Zu den in n8n unterstützten Speichertypen gehören Window Buffer Memory (behält die letzten N Nachrichten), Token Buffer Memory (bleibt innerhalb eines Token-Limits) und externe speicherbasierte Optionen (Redis, Postgres). Für Unternehmensumgebungen werden externe Speicher empfohlen, damit der Gesprächsverlauf auch bei einem Neustart des Agenten erhalten bleibt.

Achten Sie beim Konfigurieren des Memory Nodes auf das Feld 'Session ID'. Dieses Feld stellt sicher, dass verschiedene Benutzer oder verschiedene Gespräche voneinander getrennt werden. Die gängigste Praxis bei webhook-gesteuerten Gesprächen ist die Verwendung der Benutzerkennung (z. B. E-Mail-Adresse oder Session-Token) als Session ID.

Das Setzen eines Token-Limits zur Vermeidung eines vollen Kontextfensters ist bei langen Gesprächen von entscheidender Bedeutung. Obwohl Modelle wie OpenAI GPT-4o einen 128k-Token-Kontext unterstützen, schlägt sich jedes Token in den Verarbeitungskosten nieder. Die Beibehaltung der letzten 10–20 Nachrichten mit Window Buffer Memory reicht für die meisten Unternehmensanwendungsfälle aus und hält die Kosten planbar.

RAG-erweiterter KI-Agent

Durch Hinzufügen eines Vector Store Tools zum n8n AI Agent können Sie eine Retrieval-Augmented Generation (RAG)-Architektur implementieren. In dieser Konfiguration durchsucht der Agent zunächst die Vektordatenbank nach der Benutzerfrage, ruft relevante Dokumente ab und leitet diesen Kontext an das LLM weiter, um quellengestützte Antworten zu generieren.

Eine umfassende Anleitung zum Aufbau eines RAG-basierten KI-Chatbots mit n8n ist separat verfügbar. Hier konzentrieren wir uns auf den zentralen Integrationspunkt: Wenn Sie einen Pinecone-, Qdrant- oder PGVector-Node mit dem 'Vector Store Retriever'-Eingang des AI Agent Nodes verbinden, erhält der Agent ein Tool für die semantische Suche in dieser Wissensbasis.

Schreiben Sie die Beschreibung des RAG-Tools sorgfältig, wenn Sie es zur Tool-Liste hinzufügen. Eine Beschreibung wie 'Durchsucht die interne Dokumentenbasis; bietet Zugriff auf Produkthandbücher, Verfahrensdokumente und FAQ-Inhalte' stellt sicher, dass das LLM dieses Tool im richtigen Kontext aufruft.

Bei unternehmensweiten RAG-Implementierungen empfiehlt es sich, auch den Dokumentenaktualisierungsprozess zu automatisieren. Durch die Erstellung eines separaten 'Document Ingest'-Workflows in n8n können Sie neue Dokumente automatisch in Embeddings umwandeln und in die Vektordatenbank schreiben. Dieser Workflow kann von SharePoint, Confluence oder einem internen Dateiserver aus ausgelöst werden.

Unternehmensszenarien und KI-Evaluierungen

n8n AI Agents werden in Unternehmensszenarien wie Kundensupport-Automatisierung, internem Prozessmanagement, Datenanalyse-Assistenten und mehrstufigen Genehmigungsworkflows eingesetzt. Die AI Evaluations-Funktion ermöglicht die systematische Messung der Agent- und RAG-Leistung anhand eines Testdatensatzes.

Kundensupport-Agenten sind der häufigste Unternehmensanwendungsfall. Der Agent klassifiziert eine eingehende Supportanfrage, fragt den Kundenverlauf im CRM ab, durchsucht die Dokumentenbasis nach einer Lösung und eskaliert bei Bedarf an einen menschlichen Mitarbeiter. All diese Schritte können in n8n als einzelner Workflow modelliert werden.

Interne Prozessagenten automatisieren sich wiederholende Geschäftsprozesse wie Einkaufsgenehmigungen, Urlaubsanträge und Projektstatusaktualisierungen. In diesen Szenarien liest der Agent relevante Systemdaten (ERP, HR-Software), prüft die Genehmigungsmatrix und sendet die erforderlichen Benachrichtigungen.

Die AI Evaluations-Funktion von n8n vergleicht Agentenantworten mit vordefinierten richtigen Antworten und berechnet Präzisions-, Recall- und F1-Werte. Diese Funktion ist entscheidend für das Testen des Agentenverhaltens vor dem Produktivgang und für die Messung, wie sich Modelländerungen auf die Leistung auswirken.

Szenario	Trigger	Verwendete Tools	Erwarteter Nutzen
Kundensupport-Agent	Chat / E-Mail-Webhook	CRM-Abfrage, RAG, Ticket erstellen	60 % Reduzierung der ersten Antwortzeit
Interner Genehmigungsagent	Formular-Webhook	ERP-Lesen, Genehmigungsmatrix, E-Mail	Manuelle Genehmigungsschritte eliminieren
Datenanalyse-Assistent	Chat Trigger	SQL-Abfrage, Diagrammerstellung, RAG	Self-Service-Analytik; niedrigere BI-Kosten
Dokumentenverarbeitungsagent	Datei-Upload-Webhook	OCR, NLP, Datenbank schreiben	Manuelle Dateneingabe automatisieren

In Unternehmensumgebungen wird dringend empfohlen, vor dem Produktivgang mit AI Evaluations anhand eines Testdatensatzes von mindestens 50–100 Beispielen zu validieren. Basierend auf den Felderfahrungen von Sora Software ist die Wahrscheinlichkeit unerwarteter Agentenverhalten in der Produktion bei Projekten, die diesen Schritt überspringen, erheblich höher.

Häufig gestellte Fragen

Was genau ist der n8n AI Agent Node?

Der n8n AI Agent Node ist ein spezialisierter Workflow-Knoten, der ein Large Language Model (LLM), eine Tool-Liste und optionale Speicher- und Vector-Store-Komponenten kombiniert. Er trifft autonome Entscheidungen über eine ReAct- oder Function-Calling-Schleife, bis er das Ziel erreicht.

Welche LLM-Anbieter unterstützt der n8n AI Agent?

Stand Mai 2026 werden OpenAI, Anthropic, Mistral AI, Google Vertex AI, Ollama (lokal) und jeder OpenAI-kompatible Endpoint unterstützt. Sie können sich auch verbinden, wenn Sie LM Studio oder vLLM auf Ihrem eigenen Server betreiben.

Benötige ich Programmierkenntnisse, um einen n8n AI Agent einzurichten?

Für einen grundlegenden Agenten sind keine Programmierkenntnisse erforderlich; alle Komponenten werden über die Drag-and-Drop-Oberfläche konfiguriert. Technisches Wissen ist jedoch nützlich für benutzerdefinierte Tool-Logik, erweiterte System-Prompts oder die Verwendung von JavaScript/Python-Code-Nodes.

Was bedeutet 'Tool' im Kontext eines n8n AI Agent?

Ein Tool ist eine n8n-Komponente, die dem Agenten ermöglicht, reale Aktionen über das hinaus durchzuführen, was das LLM generiert. Ein HTTP Request Node, eine Datenbankabfrage, ein Sub-Workflow oder integrierte Hilfsmittel wie der Calculator können als Tools registriert werden.

Wie erinnert sich der Agent über mehrere Gesprächsrunden hinweg an den Kontext?

Der Memory Node (Window Buffer Memory, Token Buffer Memory oder externer Speicher mit Redis/Postgres) speichert den Gesprächsverlauf und leitet ihn bei jeder neuen Runde an das LLM weiter. Eine Session ID trennt den Verlauf verschiedener Benutzer.

Kann ich mit Ollama ein lokales Modell verwenden?

Ja. Durch die Installation von Ollama und das Hinzufügen des Ollama Chat Model Nodes zu n8n können Sie Modelle wie Llama 3.3, Mistral oder Phi-4 vollständig in einer lokalen Umgebung betreiben. Dieser Ansatz ist ideal für Unternehmensumgebungen, in denen Datenschutz Priorität hat, erfordert jedoch GPU-Hardware.

Wie werden die Betriebskosten eines n8n AI Agent berechnet?

Die Kosten hängen von der Token-Preisgestaltung des gewählten LLM-Anbieters und der Anzahl der pro Agent-Ausführung verbrauchten Token ab. Lokale Modelle wie Ollama erzeugen keine API-Kosten; bei Cloud-Anbietern muss der zusätzliche Token-Verbrauch pro Tool-Aufruf berücksichtigt werden.

Fazit

Der n8n AI Agent Node bietet eine der praktischsten Möglichkeiten, KI-Fähigkeiten ohne Programmieraufwand in Unternehmensautomatisierungsprojekte zu integrieren. Von der LLM-Auswahl und Tool-Definition über die Speicherverwaltung und RAG-Integration bis hin zur Leistungsmessung mit AI Evaluations können alle Komponenten auf einer einzigen Plattform verwaltet werden.

Sind Sie bereit, Ihre eigene n8n AI Agent-Infrastruktur aufzubauen? Unser Sora KI-Agenten-Team bietet eine kostenlose Discovery-Session für die Gestaltung maßgeschneiderter Agentenarchitekturen, LLM-Auswahl und Enterprise-Integration.

← Blog