Willkommen zurück, Robin

Dashboard

Level 2 350 XP

Tokens und Kontextfenster

Tokens und Kontextfenster sicher planen

Tokenisierung, Kontextbudget, Input- und Output-Tokens, Truncation, Summarization und RAG-Kontext für stabile AI-Features.

Fortschritt

Lernziel

Du kannst Kontextfenster planen, Tokenkosten abschätzen, Inhalte priorisieren und Strategien wie Sliding Window, Zusammenfassung und Prompt-Kompression gezielt einsetzen.

Dauer

70 Minuten

Schwierigkeit

foundation

introduction Kapitel 1

Warum dieser Skill wichtig ist

Warum dieser Skill wichtig ist: Kontext entscheidet über Qualität, Kosten und Stabilität jeder Modellanfrage. Wer Tokenbudget nicht plant, verliert relevante Informationen oder zahlt dauerhaft zu viel. In AI Architect OS ist dieser Skill kein isoliertes Theorieelement, sondern ein Entscheidungswerkzeug für produktionsfähige AI-Systeme. Er beeinflusst, welche Daten an ein Modell gegeben werden, welche Verantwortung beim Code bleibt, wie Fehler sichtbar werden und welche Nutzererwartung realistisch ist. Wer Tokens und Kontextfenster nur oberflächlich versteht, baut oft Funktionen, die in einer Demo überzeugend wirken, aber bei echten Daten, wechselnden Nutzern, Kostenlimits, Datenschutzanforderungen und Fehlersituationen instabil werden. In dieser Unit lernst du deshalb nicht nur Definitionen, sondern die Architekturfolgen: Was muss vor dem Modell passieren? Welche Entscheidung darf das Modell treffen? Welche Antwort muss validiert werden? Wann braucht es Fallback, Logging oder Human Review? Ziel ist, dass du nach der Lektion eine konkrete AI-Funktion erklären, begrenzen und prüfbar machen kannst.

concept Kapitel 2

Kernkonzept

Kernkonzept: Tokenisierung zerlegt Text in Einheiten. Input-Tokens, Output-Tokens und Kontextfenster bilden ein begrenztes Budget, das zwischen Regeln, Nutzerfrage, Quellen, Beispielen und Antwort geteilt wird. Das Konzept wird praktisch, sobald du es als Vertrag zwischen Nutzerziel, Anwendungscode, Datenquelle und Modell betrachtest. Ein produktives AI-System darf nicht hoffen, dass das Modell schon richtig reagiert. Es muss explizit festlegen, welche Inputs erlaubt sind, welche Informationen zuverlässig sind, welche Unsicherheiten sichtbar bleiben und welches Ergebnis akzeptiert wird. Für Tokens und Kontextfenster bedeutet das: Du übersetzt eine offene AI-Fähigkeit in nachvollziehbare Regeln, Datenflüsse und Prüfpunkte. Dadurch kann ein Team dieselbe Funktion testen, debuggen, verbessern und sicher betreiben.

concept Kapitel 3

Technische Funktionsweise

Technische Funktionsweise: Truncation, Sliding Window, Summarization, RAG-Kontext und Prompt-Kompression sind Strategien, um relevante Informationen in ein begrenztes Fenster zu bringen. Achte besonders auf die Grenze zwischen deterministischem Code und probabilistischem Modellverhalten. Code sollte Formate prüfen, Berechtigungen erzwingen, Zeitlimits setzen, Daten minimieren und persistente Entscheidungen dokumentieren. Das Modell kann Sprache interpretieren, strukturieren, klassifizieren oder Vorschläge erzeugen, aber es sollte nicht unkontrolliert über Datenzugriff, Geld, Rechte, Sicherheit oder finale Wahrheit entscheiden. Eine gute technische Umsetzung macht diese Grenze im Request, in der Response-Verarbeitung und im Logging sichtbar.

mental_model Kapitel 4

Mentales Modell

Mentales Modell: Stell dir Tokens und Kontextfenster als Kontrollschicht vor, nicht als Dekoration. Das Modell ist ein leistungsfähiger Mitarbeiter mit begrenztem Arbeitsgedächtnis, hoher Sprachkompetenz und fehlender eingebauter Betriebsverantwortung. Deine Architektur ist der Arbeitsplatz: Eingaben werden vorbereitet, Werkzeuge sind begrenzt, Ergebnisse werden geprüft, Fehler werden gemeldet und riskante Entscheidungen werden eskaliert. Dieses mentale Modell hilft, nicht in zwei Extreme zu fallen: blindes Vertrauen in Modellantworten oder übertriebene Angst vor jeder AI-Nutzung. Reife AI-Systeme nutzen Modelle dort, wo sie stark sind, und bauen Schutzschichten dort, wo sie strukturell schwach sind.

example Kapitel 5

Praxisbeispiel 1

Praxisbeispiel 1: Ein RAG-Wissenssystem muss Dokumentauszüge priorisieren, statt alle Treffer ungefiltert in den Prompt zu kopieren. Ausgangssituation: Ein Team möchte eine reale Aufgabe beschleunigen, ohne Fachqualität oder Datenschutz zu verlieren. Problem: Die Rohdaten sind unvollständig, unterschiedlich formuliert und teilweise sicherheitsrelevant. Architekturentscheidung: Die Anwendung bereitet den Input vor, markiert unsichere Daten, ruft das Modell mit klarer Aufgabe auf und validiert das Ergebnis vor Anzeige oder Speicherung. Datenfluss: Nutzerinput und Systemdaten werden normalisiert, an das Modell gegeben, strukturiert zurückgegeben, serverseitig geprüft und erst dann als Nutzerergebnis dargestellt. Risiken sind falsche Annahmen, zu viel Kontext, fehlende Quellen und stille Fehler. Validierung erfolgt über Schema, Plausibilitätsregeln und Review bei niedriger Sicherheit. Erwartetes Ergebnis ist ein verwertbarer Vorschlag, keine unkontrollierte Entscheidung.

example Kapitel 6

Praxisbeispiel 2

Praxisbeispiel 2: Ein AI-Telefonassistent verdichtet Gesprächshistorie, damit aktuelle Absicht und Kundendaten im Kontext bleiben. Ausgangssituation: Ein bestehender Workflow soll durch AI unterstützt werden. Problem: Der Prozess enthält einfache Teilschritte, aber auch riskante Ausnahmen. Architekturentscheidung: AI übernimmt Strukturierung, Entwurf oder Klassifikation; Business Logic entscheidet, was gespeichert, ausgelöst oder eskaliert wird. Datenfluss: Eingaben werden gekürzt, priorisiert und mit Metadaten versehen. Das Modell erzeugt eine Antwort im erwarteten Format. Output Validation prüft Pflichtfelder, Wertebereiche und Risikoindikatoren. Logging speichert technische Metadaten, aber keine unnötigen Secrets oder sensiblen Rohtexte. Erwartetes Ergebnis ist ein nachvollziehbarer Arbeitsschritt, der bei Unsicherheit sicher anhält.

architecture_example Kapitel 7

Produktionsnahe Architektur

Architekturbeispiel für Tokens und Kontextfenster: Input: Systemregeln, Nutzerfrage, komprimierter Verlauf, RAG-Treffer und Antwortbudget. → Validierung: Prüfe Berechtigung, Mindestdaten, Datentypen, Länge, sensible Inhalte und fachliche Vorbedingungen. → Business Logic: Entscheide, welche Daten wirklich gebraucht werden, welche Regeln vor dem Modell gelten und wann Human Review nötig ist. → Model/API: Rufe das Modell mit klarer Aufgabe, begrenztem Kontext, Timeout und nachvollziehbarer Request-ID auf. → Output Validation: Prüfe Struktur, Pflichtfelder, erlaubte Werte, Confidence, Quellenbezug und fachliche Plausibilität. → Logging: Speichere Status, Latenz, Kosten, Modell, Fehlerklasse und Korrelations-ID, aber keine unnötigen Secrets. → Fallback: Nutze Regelpfad, kleinere Funktion, Warteschlange oder menschliche Prüfung. → Nutzerergebnis: Zeige eine klare, ehrliche Antwort mit Grenzen, nächstem Schritt und ohne interne Providerdetails.

common_mistakes Kapitel 8

Typische Fehler

Typische Fehler: 1. Komplette Rohdaten werden in Prompts kopiert, ohne Relevanz, Kosten oder Truncation zu prüfen. Das wirkt harmlos, führt aber in Produktion zu schwer erklärbaren Ergebnissen. 2. Fehlende Validierung: Die Anwendung übernimmt Modellantworten, obwohl Pflichtfelder, Quellen oder Werte fehlen. 3. Zu viel Vertrauen in Demo-Daten: Tests decken keine Randfälle, leere Inputs oder widersprüchliche Informationen ab. 4. Vermischung von Systemregeln und Nutzerdaten: Dadurch entstehen Sicherheitsrisiken und Prompt-Injection-Flächen. 5. Keine Kosten- und Latenzbetrachtung: Die Funktion ist fachlich gut, aber im Alltag zu langsam oder zu teuer. 6. Keine Fallback-Strategie: Bei Fehlern bleibt der Nutzer ohne verwertbaren nächsten Schritt. 7. Zu wenig Logging: Später lässt sich nicht erklären, warum eine Antwort entstanden ist. 8. Keine klare Verantwortung: Das Modell trifft Entscheidungen, die eigentlich Business Logic oder Menschen treffen müssten.

checklist Kapitel 9

Checkliste

Checkliste zur Selbstprüfung: 1. Ist das Nutzerziel eindeutig beschrieben? 2. Sind Datenquellen und Vertrauensniveau markiert? 3. Ist klar, welche Aufgabe das Modell übernimmt und welche nicht? 4. Gibt es ein erwartetes Ausgabeformat mit Pflichtfeldern? 5. Werden Fehlerfälle, leere Ergebnisse und Unsicherheit behandelt? 6. Sind Datenschutz, Secrets und sensible Inhalte berücksichtigt? 7. Gibt es Metriken für Qualität, Kosten und Latenz? 8. Wird geloggt, ohne vertrauliche Inhalte unnötig zu speichern? 9. Existiert ein Fallback für Providerfehler oder fachliche Unsicherheit? 10. Kann ein anderer Entwickler die Entscheidung anhand der Dokumentation nachvollziehen? Wenn du zwei oder mehr Punkte nicht beantworten kannst, ist die Architektur noch nicht reif für produktive Nutzung.

exercise Kapitel 10

Praxisübung

Übung: Situation: Du planst das Kontextbudget für einen RAG-Assistenten mit langen Kundendokumenten. Ziel: Entwirf eine produktionsnahe Lösung, die Tokens und Kontextfenster sichtbar berücksichtigt. Aufgabe: Beschreibe Input, Validierung, Business Logic, Modellaufruf, Output Validation, Logging, Fallback und Nutzerergebnis. Einschränkungen: Keine Secrets im Prompt, keine ungeprüfte Speicherung von Modellantworten, klare Behandlung von Unsicherheit und maximal drei automatische Versuche bei technischen Fehlern. Erwartetes Ergebnis: Eine einseitige Architektur-Skizze mit Datenfluss, Risikoannahmen und Prüfkriterien. Erfolgskriterien: Die Lösung ist testbar, erklärt nicht retrybare Fälle, schützt sensible Daten, nennt mindestens zwei Metriken und definiert einen sicheren Abbruchpfad. Häufige Fehler: zu vage Inputs, fehlende Validierung, keine Eskalation und zu optimistische Annahmen. Optionale Vertiefung: Ergänze Beispiel-Testfälle für Erfolg, leere Daten, Providerfehler und fachliche Unsicherheit.

reflection Kapitel 11

Reflexion

Reflexion: 1. An welcher Stelle deiner aktuellen AI-Funktion verlässt du dich auf implizites Modellverhalten, obwohl eine explizite Regel besser wäre? 2. Welche Information müsste ein anderer Entwickler sehen, um deine Entscheidung zu prüfen oder zu debuggen? 3. Was ist der teuerste realistische Fehler, der durch falsche Anwendung von Tokens und Kontextfenster entstehen könnte? 4. Welche Nutzerbotschaft wäre ehrlich, wenn das System unsicher ist oder keine ausreichenden Daten hat? 5. Welche Metrik würdest du nach dem Launch beobachten, um Qualität und Risiko dieses Skills zu bewerten? Beantworte die Fragen schriftlich, weil die Lücke zwischen gefühltem Verständnis und architekturfähigem Verständnis oft erst beim Formulieren sichtbar wird.

summary Kapitel 12

Zusammenfassung

Zusammenfassung: 1. Kontextfenster sind knappe Arbeitsflächen, die aktiv budgetiert und priorisiert werden müssen. 2. Der Skill muss im Datenfluss sichtbar werden, nicht nur im Prompttext. 3. Produktive AI-Systeme trennen Input-Vorbereitung, Modellaufgabe, Validierung und Nutzerkommunikation. 4. Gute Architektur benennt Grenzen, Unsicherheit und Verantwortlichkeiten. 5. Beispiele, Tests und Logs sind nötig, damit Qualität nicht nur subjektiv bewertet wird. 6. Sicherheit bedeutet konkrete Maßnahmen wie Datenminimierung, Secret-Schutz, Berechtigungen und klare Fallbacks. 7. Nutzerfreundliche Ergebnisse entstehen durch ehrliche Kommunikation und sichere nächste Schritte. 8. Nach dieser Unit solltest du erklären können, warum Tokens und Kontextfenster wichtig ist, wie es technisch wirkt, welche Fehler typisch sind und wie du eine produktionsnahe Umsetzung prüfst.

Knowledge Checks

Welche Architekturentscheidung passt am besten zu Tokens und Kontextfenster?

Die Anwendung begrenzt die Modellaufgabe, validiert Ergebnis und Datenfluss und nutzt Tokens und Kontextfenster als expliziten Architekturbaustein. Das Modell entscheidet selbstständig, welche Daten sicher, aktuell und verbindlich sind, weil Tokens und Kontextfenster dadurch einfacher wird. Die UI zeigt jede Modellantwort direkt an und behandelt sie als finale Wahrheit.

Welche Maßnahmen gehören zu einer produktionsreifen Umsetzung von Tokens und Kontextfenster?

Input-Validierung, Output-Validierung, Logging, Fallback und klare Erfolgskriterien für Tokens und Kontextfenster werden kombiniert. Nur ein längerer Prompt wird ergänzt; Validierung, Logging und Fallback bleiben unverändert. Alle Fehler werden vor Nutzern verborgen und weder klassifiziert noch gemessen.

Welche Aussage zu Tokens und Kontextfenster ist fachlich korrekt?

Wahr: Tokens und Kontextfenster braucht in produktiven AI-Systemen klare Grenzen, Prüfpunkte und beobachtbare Qualitätskriterien. Falsch: Tokens und Kontextfenster kann ohne Tests, Datenfluss und Fehlerbehandlung als reine Prompt-Formulierung gelöst werden. Falsch: Wenn eine Demo funktioniert, sind Architektur, Sicherheit und Betrieb für Tokens und Kontextfenster bereits ausreichend geklärt.

Passende Missionen

Noch keine Mission verknüpft.