OpenAI ChatGPT: Комплетна архитектура

OpenAI ChatGPT: Комплетна архитектура интеракције

Технички прецизан модел од корисника до корисника — базирано на OpenAI документацији

Овај дијаграм приказује комплетан архитектурни ток интеракције корисника са OpenAI ChatGPT системом — од момента када корисник унесе prompt до момента када прими финални одговор.

Систем је организован у 26 слојева груписаних у три главне колоне: Одлазни ток (слојеви 1–14), Tool Execution Loop (слојеви 15–19), и Повратни ток (слојеви 20–26).

Сваки слој представља начелну архитектурну компоненту без конкретних имплементационих детаља који се мењају. Кликните на било који слој да видите детаљан опис његове функције, кључне процесе, и изворе верификације из OpenAI документације.

Tool Loop механика: Када модел захтева извршавање алата (finish_reason: tool_calls), систем извршава алат, додаје резултат у контекст, и враћа се на слојеве 8→9→12→13→14 (прескаче Moderation и Prompt Caching). Овај loop се понавља док модел не врати финални одговор (finish_reason: stop).

Корисник
Интерфејс
Безбедност
Контекст
Процесирање
Рутирање
Модел (GPT)
Алати (Tools)
Повратак
Одлазни ток
1
Корисник
Формулисање намере
2
UI / ChatGPT Interface
Прихват текстуалног уноса
3
Authentication
Верификација идентитета
4
Rate Limiting
Контрола фреквенције захтева
5
Session Context
Историја конверзације
6
Custom Instructions
Трајне инструкције корисника
7
System Prompt
OpenAI base instructions
8
Context Consolidation
Спајање у messages array
9
Token Window Management
Context window по моделу
10
Moderation API
Input safety filtering
11
Prompt Caching
Кеширање prompt prefix-а
12
Model Router
Model selection по tier-у
13
API Gateway
Load balancing, routing
14
GPT Model (Inference)
Autoregressive token generation
Tool Execution Loop
15
Tool Call Detection
finish_reason: tool_calls
16
Tool Authorization
Провера дозвола
17
Tool Execution
Извршавање са timeout
18
Result Formatting
role: tool, content: result
19
Context Re-injection
Append to messages → loop
⤴ Враћа се на 8→9→12→13→14 (прескаче 10, 11)
Повратни ток
20
Response Finalization
finish_reason: stop
21
Output Moderation
Safety filtering output-а
22
Streaming (SSE)
Server-side: stream=True → delta chunks
23
Response Formatting
Client-side: Markdown, syntax highlight
24
Persistence
Снимање у session history
25
UI Rendering
Приказ streaming одговора
26
Корисник
Читање → нови циклус
Погледај поједностављен дијаграм (5 фаза)

High-level преглед процеса без детаља имплементације