Człowiek decyduje, AI tylko rekomenduje — a każda taka decyzja zostawia ślad. Ta strona opisuje dwa sprzężone rejestry MVP: Oversight Ledger (kto zatwierdził, na jakim dowodzie, czy AI radziło inaczej, pod jaką presją czasu, z jakim wynikiem) oraz AI Regression Tests (każdy incydent AI — prompt injection, wyciek danych, niebezpieczne wywołanie narzędzia — zamieniony w powtarzalny test defensywny). Dane na stronie są syntetyczne, ilustracyjne. Realizacja odpowiada na wymóg nadzoru człowieka z AI Act art. 14.
AI Act art. 14 wymaga, by systemy wysokiego ryzyka podlegały skutecznemu nadzorowi człowieka: operator musi móc zrozumieć rekomendację, ją zignorować lub cofnąć oraz nie ulegać automatycznemu zaufaniu (automation bias). Oversight Ledger operacjonalizuje ten wymóg — zapisuje moment, w którym człowiek przejął odpowiedzialność za rekomendację modelu. AI Regression Tests domykają pętlę: każdy zaobserwowany incydent AI staje się testem, który ma nie dopuścić do jego powtórki.
Każdy wiersz = jedna decyzja człowieka nad rekomendacją AI. Kolumny odpowiadają wprost na pytania audytora art. 14: kto, co zatwierdził, na jakim dowodzie, czy AI radziło inaczej, pod jaką presją czasu i z jakim wynikiem. Poniżej dane syntetyczne (2026-07-05).
| ID / czas | Decydent (rola) | Decyzja | Dowód (evidence) | Rekomendacja AI | Presja czasu | Wynik |
|---|---|---|---|---|---|---|
OVL-0001syntet. |
SOC L2 człowiek | Zatwierdził eskalację findingu do incydentu | 2 alerty skanera + korelacja z evidence-package #EP-114 |
zgodna — AI też rekomendowało eskalację | niska — pełny SLA | trafna — retest potwierdził |
OVL-0002syntet. |
Analityk GRC człowiek | Odrzucił auto-klasyfikację „high" dla findingu | kontekst biznesowy: system testowy, brak danych produkcyjnych | rozbieżna — AI proponowało „high", człowiek dał „medium" | niska | trafna — override uzasadniony, zapisany |
OVL-0003syntet. |
Dyżurny IR człowiek | Wstrzymał automatyczną rekomendację izolacji hosta | host krytyczny; brak potwierdzenia drugim źródłem | rozbieżna — AI rekomendowało natychmiastową izolację | wysoka — nocny dyżur | częściowo trafna — opóźnienie 20 min, bez szkody; do przeglądu |
OVL-0004syntet. |
Radca prawny człowiek | Zatwierdził draft powiadomienia organu przed wysyłką | Legal Trigger Engine: sugestia terminu DORA + treść draftu | zgodna po korekcie — człowiek poprawił podstawę prawną | średnia — bieg terminu | trafna — wysłano po przeglądzie |
OVL-0005syntet. |
SOC L1 człowiek | Zaakceptował rekomendację zamknięcia jako false-positive | reguła znana, sygnatura potwierdzona jako benign | zgodna | wysoka — kolejka alertów | do rewizji — flaga automation bias: akcept bez pełnej weryfikacji |
OVL-0005).
Każdy potwierdzony incydent zachowania AI zamieniamy w powtarzalny test defensywny. Cel: nie chodzi o odtwarzanie ataku, lecz o sprawdzian obronny na danych syntetycznych, że dokładnie ten sam błąd nie przejdzie ponownie. Poniżej klasy testów (dane syntetyczne).
| Klasa incydentu AI | Co się zdarzyło (syntet.) | Test regresyjny (defensywny) | Oczekiwane zachowanie | Status |
|---|---|---|---|---|
| Prompt injection | Treść wklejona do analizy próbowała nadpisać instrukcję systemową modelu asystującego. | Test sprawdza, że wejście traktowane jest jako dane, nie instrukcja (izolacja kontekstu, sanityzacja). Bez payloadu ataku — wyłącznie asercja obronna. | Model ignoruje wstrzykniętą instrukcję; zgłasza anomalię do Ledgera. | test aktywny |
| Data leakage | Odpowiedź modelu zawierała fragment danych spoza dozwolonego kontekstu (syntetyczne PII). | Test weryfikuje redakcję/maskowanie i granice kontekstu; korpus wyłącznie syntetyczny. | Brak wycieku poza zakres; pola wrażliwe zredagowane. | test aktywny |
| Unsafe tool call | Model zaproponował wywołanie narzędzia o skutku nieodwracalnym bez zgody człowieka. | Test wymusza bramkę ACK człowieka (human-in-the-loop) przed akcją destrukcyjną; allowlist narzędzi. | Akcja wstrzymana do zatwierdzenia; wpis w Oversight Ledger. | test aktywny |
| Hallucinated evidence | Model przypisał finding do nieistniejącego dowodu/linku. | Test claim ≤ proof: każdy claim musi mieć weryfikowalny hash/link, inaczej oznaczony jako GAP. | Brak dowodu → status GAP, nie „potwierdzone". | ROADMAP |
| Over-trust / automation bias | Seria akceptacji rekomendacji bez weryfikacji pod presją kolejki (por. OVL-0005). |
Test analityczny na Ledgerze: wykrycie wzorca „zawsze zgoda przy wysokiej presji". | Alert nadzorczy; wymóg drugiego oka. | ROADMAP |
| Wymóg art. 14 (skrót) | Jak adresuje to Ledger / testy | Status |
|---|---|---|
| Człowiek rozumie możliwości i ograniczenia systemu | Kolumna „rekomendacja AI" + link do model risk i znanych ograniczeń | MVP |
| Świadomość automation bias (nadmiernego zaufania) | Rejestr presji czasu + test wykrywający wzorzec nadmiernej zgody | MVP + ROADMAP |
| Możliwość zignorowania / cofnięcia wyjścia AI | Wpisy override (OVL-0002, OVL-0003) + bramka ACK przed akcją nieodwracalną |
MVP |
| Możliwość interwencji / zatrzymania | Unsafe tool call blokowany do zatwierdzenia człowieka (human-in-the-loop) | MVP |
| Ślad audytowy decyzji nadzorczych | Oversight Ledger jako dziennik z rozbieżnością AI i wynikiem; docelowo niezmienny chain-of-custody | ROADMAP (podpis/TSA jak w ograniczeniach) |
Powiązane: zgłoszenia i obsługa zdarzeń AI → /ai-incident · ryzyko i profil modeli → /model-risk · granice dojrzałości MVP → /known-limitations.