✍️ · Sprachmodelle meistern

Prompt Engineering: Das Maximum aus KI herausholen

Garbage in, garbage out – das gilt nirgends mehr als bei KI-Modellen. Wer lernt, Prompts präzise zu formulieren, bekommt aus jedem Modell dramatisch bessere Ergebnisse. Das ist keine Magie, das ist Handwerk.

Zero-Shot Few-Shot Chain-of-Thought System Prompts Personas

Was ist Prompt Engineering – und warum es so viel ausmacht

Prompt Engineering ist die Kunst, einem KI-Modell genau das zu sagen, was man von ihm braucht – in einer Form, die das Modell versteht und optimal beantwortet. Es geht nicht ums Zaubern, sondern ums Strukturieren. Ein guter Prompt gibt Kontext, definiert die Rolle des Modells, benennt das gewünschte Format und schränkt den Suchraum sinnvoll ein.

Warum das wichtig ist: Dasselbe Modell kann auf die Frage „Erkläre Docker" zehn sehr verschiedene Antworten geben – je nachdem ob man fragt als Neuling, als erfahrener DevOps-Engineer oder als jemand, der eine 3-Satz-Zusammenfassung für seinen Chef braucht. Der Prompt entscheidet, welche Antwort man bekommt.

Die vier Kernelemente eines guten Prompts:

  • Rolle/Persona: „Du bist ein erfahrener DevOps-Ingenieur..."
  • Kontext: Was ist die Situation, was ist bekannt?
  • Aufgabe: Was soll konkret geliefert werden?
  • Format: JSON, Markdown, Stichpunkte, Fließtext – klar angeben

Die wichtigsten Prompting-Techniken

Je nach Aufgabe gibt es unterschiedliche Ansätze. Diese drei sind in der Praxis am nützlichsten:

  • Zero-Shot Prompting: Direkte Aufgabe ohne Beispiele. Funktioniert für klar definierte, alltägliche Aufgaben. „Klassifiziere folgenden Text als positiv, neutral oder negativ: [Text]"
  • Few-Shot Prompting: 2–4 Beispiele mitgeben, die das gewünschte Muster zeigen. Sehr wirksam wenn das Modell ein spezifisches Output-Format lernen soll, das es sonst nicht kennt.
  • Chain-of-Thought (CoT): Das Modell zum Denken zwingen: „Denke Schritt für Schritt nach." Reduziert Fehler bei Aufgaben die Reasoning erfordern – Mathematik, Logik, mehrstufige Entscheidungen.
# Few-Shot Beispiel (Klassifikation) Klassifiziere die E-Mail als: dringend / normal / spam Beispiel 1: "Server down seit 20 Min!" → dringend Beispiel 2: "Meeting nächste Woche?" → normal Beispiel 3: "Gewinn 1.000.000€!" → spam Klassifiziere jetzt: "Wichtige Rechnung in Anlage"

Für KI-Automatisierungen ist das Format entscheidend: Wenn ein Workflow das Ergebnis weiterverarbeiten muss, sollte der Prompt immer explizit ein maschinenlesbares Format (JSON, CSV) verlangen.

Prompts für Automatisierungen und lokale Modelle optimieren

Prompts für Workflows haben andere Anforderungen als interaktive Chat-Prompts. Sie müssen konsistent funktionieren, bei jedem Input das gleiche Format liefern und robust gegenüber unerwarteten Eingaben sein.

Drei Regeln die ich für Automatisierungs-Prompts immer einhalte:

  1. Immer ein klares Output-Format erzwingen. „Antworte ausschließlich mit gültigem JSON. Kein Text davor oder danach." – Sonst bricht der Parser.
  2. Edge Cases explizit ansprechen. „Falls der Text keine E-Mail-Adresse enthält, gib null zurück." – Sonst halluziniert das Modell eine.
  3. System-Prompt von User-Prompt trennen. Der System-Prompt definiert Verhalten und Format, der User-Prompt liefert den variablen Input.

Bei lokalen LLMs ist zusätzlich die Modellgröße relevant: Kleinere Modelle (7B) brauchen klarere, einfachere Prompts als große Modelle (70B+). Zu komplexe Instruktionen bei zu kleinen Modellen führen zu Konfusion statt Gehorsam.

Versioniere deine Prompts wie Code. Ein Prompt der heute gut funktioniert, kann nach einem Modell-Update anders reagieren. In n8n Workflows speichere ich kritische Prompts als benannte Konstanten oder in einer Konfig-Tabelle.

Häufige Fragen zu Prompt Engineering

So lang wie nötig, so kurz wie möglich. Ein guter Prompt braucht keinen Roman. Klarer Kontext in 3–5 Sätzen ist oft stärker als 500 Wörter Erklärung. Ausnahme: Wenn man viele Beispiele (Few-Shot) braucht oder ein sehr spezifisches Verhalten definiert – dann darf der Prompt länger sein. Irrelevante Füllsätze verwässern den Fokus.

Nein – und das ist wichtig zu wissen. Jedes Modell hat seine Eigenheiten. GPT-4o reagiert anders auf Instruktionen als Llama 3 oder Mistral. Besonders bei lokalen Modellen lohnt es sich, Prompts explizit für das gewählte Modell zu testen und zu justieren. Was beim einen gut klappt, funktioniert beim anderen nur mittelmäßig.

System Prompts definieren das Grundverhalten des Modells für eine gesamte Session oder einen Workflow: Welche Rolle hat das Modell, wie soll es antworten, was soll es niemals tun? Für KI-Automatisierungen sind System Prompts essentiell – sie garantieren konsistentes Verhalten unabhängig vom konkreten User-Input.

Ich empfehle eine einfache Testmatrix: Erstelle 10–20 typische Inputs, ein paar Edge Cases (leerer Input, sehr langer Input, unerwartetes Format) und prüfe den Output systematisch. Für produktive Automatisierungen dokumentiere ich Prompts und ihre Testfälle wie Code. Bei digitalen Experimenten reicht oft der direkte Trial-and-Error-Ansatz.