TL;DR — Was du nach diesem Artikel kannst
- Eigenes n8n self-hosted Setup auf Hetzner für 5 €/Monat aufgebaut.
- Funktionierenden KI-Agent in n8n mit AI-Agent-Node, Tool-Use und Memory.
- System-Prompt, der Halluzinationen reduziert und konsistenten Output liefert.
- Trigger-Integration: Email, Webhook oder Schedule, je nach Use-Case.
- Mein eigenes n8n-Setup für die christianohle-Pipeline und was bei mir konkret läuft.
Einen KI-Agent in n8n zu bauen ist 2026 die schnellste Variante, ohne Code zu produktiven Agent-Workflows zu kommen. Was vor zwei Jahren noch komplexes Python-Setup mit LangChain hieß, ist heute ein 60-Minuten-Drag-and-Drop. Diese Anleitung führt dich Schritt für Schritt durch — von Server-Setup bis zum laufenden Agent mit Tool-Use und Memory.
Ich nutze n8n self-hosted seit ~10 Monaten parallel zur christianohle-Pipeline. Drei Workflows laufen produktiv (Email-Triage, RSS-Aggregation, Slack-Briefings), zwei sind in Entwicklung. Die Tipps in diesem Artikel kommen aus echten Projekten, nicht aus n8n-Marketing-Blogs.
Warum n8n für KI-Agents?
Bevor wir Setup machen, kurz die Einordnung. n8n ist ein Workflow-Automation-Tool — vergleichbar mit Make.com oder Zapier, aber Open-Source und self-hostbar. Seit Anfang 2024 hat n8n native KI-Agent-Nodes, mit denen du:
- Tool-Use ohne eigenen Loop-Code bauen kannst
- Memory zwischen Aufrufen erhältst
- Verschiedene LLMs (Claude, GPT, Gemini, lokale Modelle) per Dropdown wechselst
- Trigger flexibel kombinierst (Schedule, Webhook, Email, Database-Change)
Stärken gegenüber Code-Pfad:
- Kein TypeScript/Python-Wissen nötig
- Visueller Workflow — du siehst sofort, was wo passiert
- Vorgefertigte Tool-Nodes für 400+ SaaS-Integrationen
- Error-Handling und Retries eingebaut
Schwächen gegenüber Code-Pfad:
- Bei sehr speziellen Edge-Cases stößt du an Limits
- Multi-Agent-Topologien sind weniger elegant als in LangGraph
- Versions-Updates können bestehende Workflows kaputt machen (kontrollierbar)
Für die meisten Solo-Selbstständigen ist das Trade-off klar zugunsten n8n.
Schritt 1: n8n self-hosted auf Hetzner aufsetzen
Mein Setup läuft auf einem Hetzner CX22 (4 vCPU, 8 GB RAM, 40 GB SSD) für 4,90 €/Monat. Das ist genug für 5–10 parallel laufende Agent-Workflows. Wer mehr Volume hat, skaliert auf CX32.
Schritt-Sequenz:
- Hetzner-Account anlegen, CX22-Server bestellen, Ubuntu 22.04 als OS
- SSH einrichten, Docker und Docker Compose installieren
- Eine
docker-compose.ymlmit n8n + Postgres + Caddy (für HTTPS) anlegen - Domain (z.B.
n8n.deine-domain.de) auf Hetzner-IP zeigen lassen docker compose up -dstarten- Im Browser n8n öffnen, Admin-Account anlegen
Ein vollständiges docker-compose.yml-Template findest du auf der n8n-Hosting-Doku. Setup-Zeit für Routinierte: 30 Min, für Newcomer: 60–90 Min.
Kosten-Ehrlichkeit:
- Server: 4,90 €/Monat
- Domain: ~10 €/Jahr (falls noch nicht vorhanden)
- API-Kosten LLM: separat — bei Claude Sonnet 4.6 typisch 5–20 €/Monat für Solo-Workflows
Schritt 2: Anthropic API-Key in n8n hinterlegen
Sobald n8n läuft, brauchst du einen API-Key für dein LLM. Ich nutze Claude — der Pfad ist gleich für andere Anbieter:
- Auf console.anthropic.com einen API-Key erstellen
- In n8n: Credentials → New Credential
- Typ: Anthropic API, Key einfügen, speichern
Wichtig: gibt deinem API-Key in der Anthropic-Console ein Spending Limit (z.B. 50 €/Monat). Wenn ein Workflow Amok läuft, ist die maximale Schadenshöhe gedeckelt.
Schritt 3: AI-Agent-Node im Workflow
Jetzt der Kern. Wir bauen einen einfachen Beispiel-Agent: ein Recherche-Briefing-Generator, der per Webhook eine Frage entgegennimmt, im Web recherchiert und ein strukturiertes Briefing zurückgibt.
Workflow-Aufbau:
- Trigger-Node: Webhook (oder Schedule, je nach Use-Case)
- AI-Agent-Node: das Herzstück
- Response-Node: Output zurück an den Webhook-Caller
Den AI-Agent-Node findest du unter “Advanced AI” in der Node-Library. Drag in den Canvas, mit dem Trigger verbinden.
Node-Konfiguration:
- Agent Type: Tools Agent (für Tool-Use-Workflows)
- Model: über Subnode “Anthropic Chat Model”,
claude-sonnet-4-6auswählen - Memory: über Subnode “Window Buffer Memory” oder “Postgres Memory”
- Tools: über Subnode-Connections (siehe Schritt 4)
Schritt 4: Tool-Subnodes konfigurieren
Tools sind das, was den Agent zum Agent macht. Für unseren Recherche-Agent brauchen wir:
Tool 1: Web-Search. n8n hat native SerpAPI- und Brave-Search-Nodes. Mein Tipp: Brave (kostenlos bis 2.000 Queries/Monat). Subnode “HTTP Request Tool” mit Brave-API verbinden, dem Agent als “web_search”-Tool exposen.
Tool 2: HTTP-Request. Wenn du auf eigene APIs zugreifen willst (z.B. eigene Postgres, eigenes Notion), nutzt du den HTTP-Request-Tool-Subnode.
Tool 3: Code (optional). Für Custom-Logik. Z.B. ein Tool, das Markdown formatiert oder Daten transformiert.
Jedes Tool wird als Subnode am AI-Agent-Node angedockt. n8n übersetzt die Tool-Schemas automatisch in das Format, das Claude versteht. Tool-Use-Beschreibung pro Tool sollte präzise sein — der Agent entscheidet auf Basis dieser Beschreibung, wann er welches Tool nutzt.
Pro-Tipp: Tool-Beschreibungen sollten konkret sein. Statt “Webseiten suchen” lieber “Suche im Web nach aktuellen Nachrichten und Statistiken — nutze nur, wenn die Frage Daten nach 2024 erfordert.”
Schritt 5: Memory-Modul hinzufügen
Memory ist optional, aber für Multi-Turn-Konversationen wichtig. Drei Varianten:
Window Buffer Memory. Behält die letzten N Nachrichten in-memory. Einfach, schnell, geht beim Server-Neustart verloren. Für Stateless-Workflows reicht das.
Postgres Memory. Schreibt Konversationen in deine Postgres-DB (n8n hat sowieso eine im Stack). Persistent über Neustarts. Für längere User-Sessions ideal.
Vector Store Memory. Speichert Embeddings in Pinecone, Qdrant oder pgvector. Erlaubt semantische Suche über lange Konversations-Historien. Für komplexe Wissens-Agents.
Für meinen Email-Triage-Agent nutze ich Window Buffer — ich brauche keine Persistenz über Tage. Für meinen Wissens-Agent über Notion-Inhalte nutze ich pgvector mit Embeddings.
Schritt 6: System-Prompt definieren
Hier liegt 80 % des Erfolgs. Der System-Prompt definiert, wer der Agent ist und wie er sich verhalten soll. Beispiel für meinen Recherche-Briefing-Agent:
Du bist ein präziser Research-Analyst für deutsche Solo-Selbstständige.
Deine Aufgabe: zu einer gegebenen Frage ein strukturiertes Briefing
erstellen — max 300 Wörter, im folgenden Markdown-Format:
# Frage
[die Original-Frage]
## Kernantwort
[2-3 Sätze, präzise]
## Quellen
- [Quelle 1 mit URL]
- [Quelle 2 mit URL]
## Offene Fragen
[was du nicht beantworten konntest]
Tools-Verwendung:
- Nutze web_search bei Fragen, die nach 2024-Daten verlangen
- Nutze max. 3 Tool-Calls pro Anfrage
Wenn du etwas nicht weißt: sag es ehrlich. Erfinde keine Quellen.
Drei wichtige Prinzipien im System-Prompt:
- Rolle definieren — was ist der Agent, was macht er?
- Output-Format vorgeben — Markdown, JSON, Tabelle?
- Tool-Hinweise — wann welches Tool nutzen?
- Anti-Halluzinations-Anweisung — explizit sagen, dass er nicht erfinden soll
Few-Shot-Beispiele (1-2 Beispiel-Anfragen mit Beispiel-Antwort) verbessern die Qualität nochmal um 20–30 %, kosten aber pro Anfrage etwas mehr Tokens.
Schritt 7: Testen und live nehmen
Bevor du den Workflow live nimmst:
- Manuell testen — n8n hat einen “Execute Workflow”-Button. Beispiel-Input einfügen, Output prüfen.
- Edge-Cases durchgehen — was passiert bei leerem Input, bei Fehlern in Tool-Aufrufen, bei Timeouts?
- Token-Verbrauch prüfen — n8n loggt das. Bei 10x höheren Werten als erwartet stimmt was nicht im System-Prompt.
Live-Setup-Optionen:
- Webhook-Trigger: Du exposst eine URL, externe Systeme können den Agent aufrufen.
- Schedule-Trigger: Workflow läuft alle X Minuten/Stunden automatisch.
- Email-Trigger: Eingehende E-Mails triggern den Agent (für Email-Triage).
- Slack-Trigger: Slack-Befehle starten den Agent.
Für meinen Email-Triage-Workflow nutze ich Email-Trigger (IMAP-Polling alle 30 Min). Für Recherche-Briefings einen Webhook, den ich aus iOS-Shortcuts triggere.
Mein eigenes n8n-Setup für christianohle
Damit du nicht in Theorie verbleibst, hier mein konkreter Stack:
Server: Hetzner CX22, 4,90 €/Monat Domain: n8n.christianohle.de mit Cloudflare-DNS Stack: Docker Compose mit n8n, Postgres 16, Caddy für HTTPS Backups: Tägliches Postgres-Backup auf Hetzner Object Storage (~1 €/Monat)
Aktive Workflows:
- Email-Triage — IMAP-Trigger, Claude Sonnet 4.6, klassifiziert nach Dringlichkeit, schreibt Drafts in IMAP-Drafts-Folder. ~6 €/Monat API.
- RSS-Aggregation — Schedule-Trigger (1x täglich), aggregiert KI-relevante News, postet in Slack-Channel. ~2 €/Monat API.
- Recherche-Briefings — Webhook von iOS-Shortcuts, recherchiert via Brave-Search, generiert strukturiertes Briefing. ~5 €/Monat API.
Gesamt-Kosten: ~18 €/Monat, gespart pro Woche ~4–5 Stunden. Setup-Zeit: 2 Wochenenden für alle drei Workflows.
Häufige Stolpersteine
Drei Sachen, die mir und anderen n8n-Nutzern regelmäßig wegfliegen:
Problem 1: Token-Limit überschritten. Bei langen Konversationen knallt der Workflow gegen das max_tokens-Limit. Lösung: Memory auf “Window Buffer” mit moderater Window-Size (10-20 Nachrichten).
Problem 2: Tools werden nicht oder falsch aufgerufen. Meist liegt’s am System-Prompt — entweder der Agent weiß nicht, dass Tools existieren, oder die Tool-Beschreibungen sind zu vage. Konkretisieren, mit Few-Shot-Beispielen testen.
Problem 3: Workflow läuft endlos. AI-Agent-Node hat ein Default-Limit von 10 Iterationen. Bei komplexen Tasks reicht das nicht — auf 15-20 erhöhen, gleichzeitig im System-Prompt klares Stopp-Kriterium (“Wenn du genug Daten hast, schreibe das finale Briefing”).
Wie geht’s weiter?
Du hast jetzt einen lauffähigen Agent in n8n. Drei nächste Erweiterungen:
- Custom Tools dazubauen — über HTTP-Request-Tool eigene APIs ansprechen, oder Code-Tools mit Custom-Logik.
- Multi-Agent-Pattern — n8n erlaubt das Verkettung mehrerer AI-Agent-Nodes (Researcher → Writer → Reviewer). Komplexer, aber sehr mächtig.
- Code-Path lernen — wenn du irgendwann an Limits stößt, hilft das Schritt-für-Schritt-Tutorial mit Claude API, den Sprung zum eigenen Code zu machen.
Wer den n8n-Pfad einmal verstanden hat, baut sich in 1-2 Stunden komplette neue Workflows zusammen. Das ist der echte Wert: nicht der eine Agent, sondern die Geschwindigkeit, mit der du neue baust.
Meine Einschätzung
Ich habe inzwischen über ein Dutzend n8n-Workflows in Production und der wichtigste Tipp, den ich aus eigener Erfahrung geben kann: der System-Prompt ist 80 Prozent der Arbeit, das n8n-Setup nur 20 Prozent. Was ich in eigenen Workflows immer wieder sehe: Man investiert Stunden in Node-Konfiguration und Trigger-Logik, kopiert dann aber irgendeinen generischen Prompt rein — und wundert sich über schlechte Ergebnisse. Mein Rat: bau den einfachsten Workflow, der funktioniert, und iteriere dann am Prompt. Die visuellen Nodes sind schnell zusammengeklickt, aber einen System-Prompt zu schreiben, der konsistent guten Output liefert, braucht 3-5 Iterationsrunden. Wer diese Geduld mitbringt, hat in n8n das stärkste No-Code-Agent-Tool auf dem Markt.
Quellen
- [n8n AI Agents Documentation](https://docs.n8n.io


