Twój agent prawie zrobił DROP TABLE albo wysłał przelew na podstawie błędnego wyniku. gate.cat blokuje nieodwracalną akcję zanim się wykona — fail-closed, deterministycznie, bez Twojego nadzoru.
Agent AI proponuje akcję. gate.cat ocenia ją zanim dotknie świata. Kliknij scenariusz albo wpisz własną akcję:
# spróbuj też: rm -rf /data · terraform destroy prod · 17*23=400 · charge(amount=30)
Limit kroków reaguje PO wydatku. Agent nie wie, że się myli — jest pewny, nie gadatliwy. Akcja jest nieodwracalna.
Replit, lipiec 2025 — agent skasował produkcyjną bazę danych mimo zakazu, w trakcie code-freeze. DROP TABLE wykonany, zanim ktokolwiek zareagował.
Pętla agentowa — autonomiczny agent zapętlił płatne wywołania API i kosztowne akcje. Hard-cap zadziałał po fakcie.
Confident-wrong — model liczy źle z zerowym wahaniem. Sample-disagreement tego nie złapie. Interpreter łapie: prawda to 391.
Wątpliwość = blokada, nie przepuszczenie. Niezależne od modelu — interpreter się nie myli.
N próbek modelu. Rozjazd = „zgaduje" → wstrzymaj zamiast działać.
Uruchamia kod / liczy / sprawdza fakt. Łapie confident-wrong, którego gate nie widzi.
Policy + verifier + człowiek. Nieodwracalna akcja zablokowana ZANIM się wykona.
Gdy nie wiadomo — model się wstrzymuje, zamiast zgadywać. Audit-trail za każdym razem.
Produkt blokujący umiera nie przez przeoczony błąd, lecz przez blokowanie poprawnych akcji. Mierzymy oba kierunki.
tab · newline · komentarz SQL · zmiana wielkości liter · rm -rf · terraform destroy prod — żadna sztuczka nie omija deny-pattern.
Art. 14 EU AI Act wymaga, by człowiek mógł monitorować, interweniować i nadpisać decyzje AI, oraz by runtime egzekwował polityki. gate.cat realizuje dokładnie to: deterministyczna brama akcji + audytowalny log + zatwierdzanie człowieka dla akcji ze skutkiem.
Każda decyzja: który mur, dlaczego, kiedy. Gotowe pod post-incident review.
Akcje finansowe / nieodwracalne wymagają zatwierdzenia człowieka.
Działa wokół Twoich narzędzi (LangChain / OpenAI tools / własny ReAct). Model-agnostyczne — na frontier i na tanich modelach lokalnych.