Agentek, amik tényleg csinálnak valamit — a demó és a prod közötti szakadék
Egy AI agent lekérdezni adatot tud. Számlát kiállítani veszélyes. A különbség: idempotencia, audit, undo, és emberi checkpoint.
Egy AI agent, ami ír a prod adatbázisba, nem demó. Olyan, mint egy junior fejlesztő SSH-val — pontosan ugyanazok a szabályok kellenek.
Az "AI agent" szó 2025-ben annyiszor szerepelt egy hype-zenei klippben, hogy 2026-ra már elveszítette a jelentését. Mégis: van egy konkrét különbség a "demó-agent" (lekérdez adatot, választ generál) és a "prod-agent" (létrehoz, módosít, töröl entitásokat éles rendszerben) között. A különbség nem a modell. A különbség az infrastruktúra körülötte. A Nortinia Sales AI agentünk májusban 14.300 valódi mutációt hajtott végre 7 ügyfélnél: kampányokat indított, sequence-eket módosított, lead-eket re-asszignált. Egyetlen hibás mutáció sem ment ki vissza nem fordíthatóan. Hogy?
Az öt szabály, ami nélkül nem írunk prod agentet
- Idempotencia kulcs minden mutációnál — ha kétszer küldi az agent (network retry, modell-újragondolás), egyszer jön létre
- Pre-mutation audit: minden írást egy `mutation_intent` rekord előz meg Postgres-ben, amit a backend a tényleges művelettel együtt commit-ol
- Undo-token: minden destruktív mutáció (delete, status-flip) egy 24 órás undo-tokent ad vissza, amit az agent vissza tud játszani
- Human-in-the-loop küszöb: > €500 értékű művelet, > 100 entity-t érintő bulk-op, és minden user-facing kommunikáció (email, SMS) explicit confirm-ra vár
- Dry-run mode: minden tool meghívható `{ dryRun: true }`-val, ami visszaad egy "ezt fogom csinálni" payload-ot mutáció nélkül
A leggyakoribb agent-hiba, és miért nem éles rendszerben
A májusi mérésünk szerint a Sales AI agent 0.8%-ban választott "majdnem jó, de nem jó" műveletet — pl. "lépj át a sequence 3. lépésére a 2. helyett". Ezek 100%-a a human-in-the-loop checkpoint-on akadt fenn, mert >50 lead-et érintett. Az operátor egy kattintással elutasította, az agent re-tervezett, és a következő javaslat 89%-ban már jó volt. A kulcs nem az, hogy az agent ne hibázzon — az, hogy a hiba ne menjen ki éles állapotba. Ehhez kell az audit-trail-first architektúra, amit más posztokban már részleteztünk.
A "prod agent" nem egy modell. Egy modell + checkpoint + audit + undo. Bármelyik hiányzik, az nem agent — az veszély.