Was ist der Vorteil von n8n gegenüber direkt programmierten KI-Agents?

n8n liefert das visuelle Framework mit: Trigger, Tool-Routing, Memory, Error-Handling — alles vorgefertigt als Nodes. Du schreibst keinen Loop, keine Token-Verwaltung, kein Retry-Code. Setup-Zeit: Stunden statt Tage. Trade-off: weniger Kontrolle bei sehr speziellen Edge-Cases.

Brauche ich einen eigenen Server für n8n oder reicht der Cloud-Tier?

Beides möglich. n8n Cloud startet bei 24 €/Monat. Self-hosted auf Hetzner CX22 kostet 5 €/Monat plus 30-90 Min Setup. Für Solo-Selbstständige meist self-hosted besser — günstiger, mehr Kontrolle, beliebige Workflows.

Welche LLM-Modelle unterstützt der n8n AI-Agent?

Native Anbindung an Claude (Anthropic), GPT-5 (OpenAI), Gemini (Google), Mistral, lokale Modelle via Ollama-Node. Du wechselst per Dropdown. Empfehlung: Claude Sonnet 4.6 für Qualität, Haiku 4.5 für Volume-Workloads.

Kann ich Memory zwischen Workflow-Aufrufen erhalten?

Ja, mit Memory-Subnodes. Standard ist Window Buffer Memory (letzte N Nachrichten). Für persistente Memory über Tage/Wochen: Postgres Memory oder Vector Store mit Pinecone, Qdrant oder pgvector. Setup ist ein Drag-and-Drop.

KI-Agent in n8n bauen — ohne Code, Schritt-für-Schritt-Anleitung

TL;DR — Was du nach diesem Artikel kannst

Eigenes n8n self-hosted Setup auf Hetzner für 5 €/Monat aufgebaut.

Funktionierenden KI-Agent in n8n mit AI-Agent-Node, Tool-Use und Memory.

System-Prompt, der Halluzinationen reduziert und konsistenten Output liefert.

Trigger-Integration: Email, Webhook oder Schedule, je nach Use-Case.

Mein eigenes n8n-Setup für die christianohle-Pipeline und was bei mir konkret läuft.

Einen KI-Agent in n8n zu bauen ist 2026 die schnellste Variante, ohne Code zu produktiven Agent-Workflows zu kommen. Was vor zwei Jahren noch komplexes Python-Setup mit LangChain hieß, ist heute ein 60-Minuten-Drag-and-Drop. Diese Anleitung führt dich Schritt für Schritt durch — von Server-Setup bis zum laufenden Agent mit Tool-Use und Memory.

Ich nutze n8n self-hosted seit ~10 Monaten parallel zur christianohle-Pipeline. Drei Workflows laufen produktiv (Email-Triage, RSS-Aggregation, Slack-Briefings), zwei sind in Entwicklung. Die Tipps in diesem Artikel kommen aus echten Projekten, nicht aus n8n-Marketing-Blogs.

Warum n8n für KI-Agents?

Bevor wir Setup machen, kurz die Einordnung. n8n ist ein Workflow-Automation-Tool — vergleichbar mit Make.com oder Zapier, aber Open-Source und self-hostbar. Seit Anfang 2024 hat n8n native KI-Agent-Nodes, mit denen du:

Tool-Use ohne eigenen Loop-Code bauen kannst
Memory zwischen Aufrufen erhältst
Verschiedene LLMs (Claude, GPT, Gemini, lokale Modelle) per Dropdown wechselst
Trigger flexibel kombinierst (Schedule, Webhook, Email, Database-Change)

Stärken gegenüber Code-Pfad:

Kein TypeScript/Python-Wissen nötig
Visueller Workflow — du siehst sofort, was wo passiert
Vorgefertigte Tool-Nodes für 400+ SaaS-Integrationen
Error-Handling und Retries eingebaut

Schwächen gegenüber Code-Pfad:

Bei sehr speziellen Edge-Cases stößt du an Limits
Multi-Agent-Topologien sind weniger elegant als in LangGraph
Versions-Updates können bestehende Workflows kaputt machen (kontrollierbar)

Für die meisten Solo-Selbstständigen ist das Trade-off klar zugunsten n8n.

Schritt 1: n8n self-hosted auf Hetzner aufsetzen

Mein Setup läuft auf einem Hetzner CX22 (4 vCPU, 8 GB RAM, 40 GB SSD) für 4,90 €/Monat. Das ist genug für 5–10 parallel laufende Agent-Workflows. Wer mehr Volume hat, skaliert auf CX32.

Schritt-Sequenz:

Hetzner-Account anlegen, CX22-Server bestellen, Ubuntu 22.04 als OS
SSH einrichten, Docker und Docker Compose installieren
Eine docker-compose.yml mit n8n + Postgres + Caddy (für HTTPS) anlegen
Domain (z.B. n8n.deine-domain.de) auf Hetzner-IP zeigen lassen
docker compose up -d starten
Im Browser n8n öffnen, Admin-Account anlegen

Ein vollständiges docker-compose.yml-Template findest du auf der n8n-Hosting-Doku. Setup-Zeit für Routinierte: 30 Min, für Newcomer: 60–90 Min.

Kosten-Ehrlichkeit:

Server: 4,90 €/Monat
Domain: ~10 €/Jahr (falls noch nicht vorhanden)
API-Kosten LLM: separat — bei Claude Sonnet 4.6 typisch 5–20 €/Monat für Solo-Workflows

Schritt 2: Anthropic API-Key in n8n hinterlegen

Sobald n8n läuft, brauchst du einen API-Key für dein LLM. Ich nutze Claude — der Pfad ist gleich für andere Anbieter:

Auf console.anthropic.com einen API-Key erstellen
In n8n: Credentials → New Credential
Typ: Anthropic API, Key einfügen, speichern

Wichtig: gibt deinem API-Key in der Anthropic-Console ein Spending Limit (z.B. 50 €/Monat). Wenn ein Workflow Amok läuft, ist die maximale Schadenshöhe gedeckelt.

Schritt 3: AI-Agent-Node im Workflow

Jetzt der Kern. Wir bauen einen einfachen Beispiel-Agent: ein Recherche-Briefing-Generator, der per Webhook eine Frage entgegennimmt, im Web recherchiert und ein strukturiertes Briefing zurückgibt.

Workflow-Aufbau:

Trigger-Node: Webhook (oder Schedule, je nach Use-Case)
AI-Agent-Node: das Herzstück
Response-Node: Output zurück an den Webhook-Caller

Den AI-Agent-Node findest du unter “Advanced AI” in der Node-Library. Drag in den Canvas, mit dem Trigger verbinden.

Node-Konfiguration:

Agent Type: Tools Agent (für Tool-Use-Workflows)
Model: über Subnode “Anthropic Chat Model”, claude-sonnet-4-6 auswählen
Memory: über Subnode “Window Buffer Memory” oder “Postgres Memory”
Tools: über Subnode-Connections (siehe Schritt 4)

Schritt 4: Tool-Subnodes konfigurieren

Tools sind das, was den Agent zum Agent macht. Für unseren Recherche-Agent brauchen wir:

Tool 1: Web-Search. n8n hat native SerpAPI- und Brave-Search-Nodes. Mein Tipp: Brave (kostenlos bis 2.000 Queries/Monat). Subnode “HTTP Request Tool” mit Brave-API verbinden, dem Agent als “web_search”-Tool exposen.

Tool 2: HTTP-Request. Wenn du auf eigene APIs zugreifen willst (z.B. eigene Postgres, eigenes Notion), nutzt du den HTTP-Request-Tool-Subnode.

Tool 3: Code (optional). Für Custom-Logik. Z.B. ein Tool, das Markdown formatiert oder Daten transformiert.

Jedes Tool wird als Subnode am AI-Agent-Node angedockt. n8n übersetzt die Tool-Schemas automatisch in das Format, das Claude versteht. Tool-Use-Beschreibung pro Tool sollte präzise sein — der Agent entscheidet auf Basis dieser Beschreibung, wann er welches Tool nutzt.

Pro-Tipp: Tool-Beschreibungen sollten konkret sein. Statt “Webseiten suchen” lieber “Suche im Web nach aktuellen Nachrichten und Statistiken — nutze nur, wenn die Frage Daten nach 2024 erfordert.”

Schritt 5: Memory-Modul hinzufügen

Memory ist optional, aber für Multi-Turn-Konversationen wichtig. Drei Varianten:

Window Buffer Memory. Behält die letzten N Nachrichten in-memory. Einfach, schnell, geht beim Server-Neustart verloren. Für Stateless-Workflows reicht das.

Postgres Memory. Schreibt Konversationen in deine Postgres-DB (n8n hat sowieso eine im Stack). Persistent über Neustarts. Für längere User-Sessions ideal.

Vector Store Memory. Speichert Embeddings in Pinecone, Qdrant oder pgvector. Erlaubt semantische Suche über lange Konversations-Historien. Für komplexe Wissens-Agents.

Für meinen Email-Triage-Agent nutze ich Window Buffer — ich brauche keine Persistenz über Tage. Für meinen Wissens-Agent über Notion-Inhalte nutze ich pgvector mit Embeddings.

Schritt 6: System-Prompt definieren

Hier liegt 80 % des Erfolgs. Der System-Prompt definiert, wer der Agent ist und wie er sich verhalten soll. Beispiel für meinen Recherche-Briefing-Agent:

Du bist ein präziser Research-Analyst für deutsche Solo-Selbstständige.
Deine Aufgabe: zu einer gegebenen Frage ein strukturiertes Briefing
erstellen — max 300 Wörter, im folgenden Markdown-Format:

# Frage
[die Original-Frage]

## Kernantwort
[2-3 Sätze, präzise]

## Quellen
- [Quelle 1 mit URL]
- [Quelle 2 mit URL]

## Offene Fragen
[was du nicht beantworten konntest]

Tools-Verwendung:
- Nutze web_search bei Fragen, die nach 2024-Daten verlangen
- Nutze max. 3 Tool-Calls pro Anfrage

Wenn du etwas nicht weißt: sag es ehrlich. Erfinde keine Quellen.

Drei wichtige Prinzipien im System-Prompt:

Rolle definieren — was ist der Agent, was macht er?
Output-Format vorgeben — Markdown, JSON, Tabelle?
Tool-Hinweise — wann welches Tool nutzen?
Anti-Halluzinations-Anweisung — explizit sagen, dass er nicht erfinden soll

Few-Shot-Beispiele (1-2 Beispiel-Anfragen mit Beispiel-Antwort) verbessern die Qualität nochmal um 20–30 %, kosten aber pro Anfrage etwas mehr Tokens.

Schritt 7: Testen und live nehmen

Bevor du den Workflow live nimmst:

Manuell testen — n8n hat einen “Execute Workflow”-Button. Beispiel-Input einfügen, Output prüfen.
Edge-Cases durchgehen — was passiert bei leerem Input, bei Fehlern in Tool-Aufrufen, bei Timeouts?
Token-Verbrauch prüfen — n8n loggt das. Bei 10x höheren Werten als erwartet stimmt was nicht im System-Prompt.

Live-Setup-Optionen:

Webhook-Trigger: Du exposst eine URL, externe Systeme können den Agent aufrufen.
Schedule-Trigger: Workflow läuft alle X Minuten/Stunden automatisch.
Email-Trigger: Eingehende E-Mails triggern den Agent (für Email-Triage).
Slack-Trigger: Slack-Befehle starten den Agent.

Für meinen Email-Triage-Workflow nutze ich Email-Trigger (IMAP-Polling alle 30 Min). Für Recherche-Briefings einen Webhook, den ich aus iOS-Shortcuts triggere.

Mein eigenes n8n-Setup für christianohle

Damit du nicht in Theorie verbleibst, hier mein konkreter Stack:

Server: Hetzner CX22, 4,90 €/Monat Domain: n8n.christianohle.de mit Cloudflare-DNS Stack: Docker Compose mit n8n, Postgres 16, Caddy für HTTPS Backups: Tägliches Postgres-Backup auf Hetzner Object Storage (~1 €/Monat)

Aktive Workflows:

Email-Triage — IMAP-Trigger, Claude Sonnet 4.6, klassifiziert nach Dringlichkeit, schreibt Drafts in IMAP-Drafts-Folder. ~6 €/Monat API.
RSS-Aggregation — Schedule-Trigger (1x täglich), aggregiert KI-relevante News, postet in Slack-Channel. ~2 €/Monat API.
Recherche-Briefings — Webhook von iOS-Shortcuts, recherchiert via Brave-Search, generiert strukturiertes Briefing. ~5 €/Monat API.

Gesamt-Kosten: ~18 €/Monat, gespart pro Woche ~4–5 Stunden. Setup-Zeit: 2 Wochenenden für alle drei Workflows.

Häufige Stolpersteine

Drei Sachen, die mir und anderen n8n-Nutzern regelmäßig wegfliegen:

Problem 1: Token-Limit überschritten. Bei langen Konversationen knallt der Workflow gegen das max_tokens-Limit. Lösung: Memory auf “Window Buffer” mit moderater Window-Size (10-20 Nachrichten).

Problem 2: Tools werden nicht oder falsch aufgerufen. Meist liegt’s am System-Prompt — entweder der Agent weiß nicht, dass Tools existieren, oder die Tool-Beschreibungen sind zu vage. Konkretisieren, mit Few-Shot-Beispielen testen.

Problem 3: Workflow läuft endlos. AI-Agent-Node hat ein Default-Limit von 10 Iterationen. Bei komplexen Tasks reicht das nicht — auf 15-20 erhöhen, gleichzeitig im System-Prompt klares Stopp-Kriterium (“Wenn du genug Daten hast, schreibe das finale Briefing”).

Wie geht’s weiter?

Du hast jetzt einen lauffähigen Agent in n8n. Drei nächste Erweiterungen:

Custom Tools dazubauen — über HTTP-Request-Tool eigene APIs ansprechen, oder Code-Tools mit Custom-Logik.
Multi-Agent-Pattern — n8n erlaubt das Verkettung mehrerer AI-Agent-Nodes (Researcher → Writer → Reviewer). Komplexer, aber sehr mächtig.
Code-Path lernen — wenn du irgendwann an Limits stößt, hilft das Schritt-für-Schritt-Tutorial mit Claude API, den Sprung zum eigenen Code zu machen.

Wer den n8n-Pfad einmal verstanden hat, baut sich in 1-2 Stunden komplette neue Workflows zusammen. Das ist der echte Wert: nicht der eine Agent, sondern die Geschwindigkeit, mit der du neue baust.

Meine Einschätzung

Ich habe inzwischen über ein Dutzend n8n-Workflows in Production und der wichtigste Tipp, den ich aus eigener Erfahrung geben kann: der System-Prompt ist 80 Prozent der Arbeit, das n8n-Setup nur 20 Prozent. Was ich in eigenen Workflows immer wieder sehe: Man investiert Stunden in Node-Konfiguration und Trigger-Logik, kopiert dann aber irgendeinen generischen Prompt rein — und wundert sich über schlechte Ergebnisse. Mein Rat: bau den einfachsten Workflow, der funktioniert, und iteriere dann am Prompt. Die visuellen Nodes sind schnell zusammengeklickt, aber einen System-Prompt zu schreiben, der konsistent guten Output liefert, braucht 3-5 Iterationsrunden. Wer diese Geduld mitbringt, hat in n8n das stärkste No-Code-Agent-Tool auf dem Markt.

Quellen

[n8n AI Agents Documentation](https://docs.n8n.io

KI-Agent in n8n bauen — ohne Code, Schritt-für-Schritt-Anleitung

Warum n8n für KI-Agents?

Schritt 1: n8n self-hosted auf Hetzner aufsetzen

Schritt 2: Anthropic API-Key in n8n hinterlegen

Schritt 3: AI-Agent-Node im Workflow

Schritt 4: Tool-Subnodes konfigurieren

Schritt 5: Memory-Modul hinzufügen

Schritt 6: System-Prompt definieren

Schritt 7: Testen und live nehmen

Mein eigenes n8n-Setup für christianohle

Häufige Stolpersteine

Wie geht’s weiter?

Meine Einschätzung

Quellen

Verwandte Artikel

n8n für Anfänger: Dein erster Workflow in 30 Minuten

Mistral Large als DSGVO-konformer Agent-LLM: ChatGPT-Alternative für autonome Workflows

n8n mit KI verbinden — Claude und n8n im Workflow 2026

Warum n8n für KI-Agents?

Schritt 1: n8n self-hosted auf Hetzner aufsetzen

Schritt 2: Anthropic API-Key in n8n hinterlegen

Schritt 3: AI-Agent-Node im Workflow

Schritt 4: Tool-Subnodes konfigurieren

Schritt 5: Memory-Modul hinzufügen

Schritt 6: System-Prompt definieren

Schritt 7: Testen und live nehmen

Mein eigenes n8n-Setup für christianohle

Häufige Stolpersteine

Wie geht’s weiter?

Meine Einschätzung

Quellen

Passende KI-Workflows

Verwandte Artikel

n8n für Anfänger: Dein erster Workflow in 30 Minuten

Mistral Large als DSGVO-konformer Agent-LLM: ChatGPT-Alternative für autonome Workflows

n8n mit KI verbinden — Claude und n8n im Workflow 2026