Context window (Context window) — Słownik AI

Okno kontekstu to budżet input + output na jedno wywołanie LLM, liczony w tokenach (~0.75 słowa dla angielskiego, ~0.5 dla polskiego). Gdy spec mówi „200k kontekstu”, obejmuje to system prompt, historię rozmowy, wszystkie pobrane chunk-i ORAZ miejsce na odpowiedź modelu.

Większe okna umożliwiają dłuższe dokumenty, głębsze historie agentów i workflow-y typu „wepchnij-cały-codebase”. Ale: recall nie jest jednolity przez całe okno. Większość modeli lepiej przypomina sobie treść z początku i końca niż ze środka („lost-in-the-middle”). Powyżej ~100k tokenów, recall konkretnych faktów często ostro spada.

Praktyczna odpowiedź: RAG ciągle jest relewantny nawet przy 1M kontekstu. Nie zastępuj retrievalu brute-force-em wpychania kontekstu; łącz je.

Context window

Zobacz też

RAG

MoE