K0NSULT // ai-truth/ipIII
k0nsult.cloud / ai-truth / ipIII / arena / scoreboard

Scoring / Scoreboard — definicja metryk (spec)

Ta strona to definicja metryk oceny dla ścieżek junior-academy i senior-arena — a nie działający ranking. Interaktywny scoreboard i Hall of Fame są jawnie oznaczone jako ROADMAP. Zgodnie z doktryną claim ≤ proof: publikujemy dokładnie tyle, ile potrafimy pokazać. Ocena wspiera naukę i decyzję (decision support); nie ma nagród finansowych.

Co jest tu dziś, a co dopiero w planie. MVP = spisana, stabilna definicja czterech wymiarów oceny i ich skal (to, co czytasz poniżej). ROADMAP = interaktywny scoreboard, automatyczne liczenie punktów, tablica wyników na żywo oraz Hall of Fame. Nie udajemy, że ranking już działa — to szkielet metryki, na którym dopiero zbudujemy narzędzie. Bez nagród finansowych na żadnym etapie: ocena służy nauce i informacji zwrotnej.
4 wymiary oceny. Jedna skala. Zero nagród finansowych.

Każde zgłoszenie w academy/arena ocenia się na czterech osiach: evidence quality (jakość dowodu), severity accuracy (trafność klasyfikacji ważności), remediation clarity (jasność rekomendacji naprawczej) i legal awareness (świadomość obowiązków prawnych). Każda oś ma jawną skalę 0–5. Wszystko wyłącznie defensywnie, na danych syntetycznych i dopiero po pisemnych Rules of Engagement.

OŚ DOJRZAŁOŚCI: spec metryki (dziś)rubryka + przykładyręczna ocena reviewscoreboard interaktywnyHall of Fame

Wymiary oceny — tabela

Cztery wymiary. Każdy w skali 0–5 (0 = brak / niepotwierdzone, 5 = wzorcowe). Suma orientacyjna 0–20 — to informacja zwrotna dla uczestnika, nie certyfikat. Data spisania: 2026-07-05.

WymiarCo mierzySkala 0–5 (kotwice)Status
Evidence quality
jakość dowodu
Czy zgłoszenie ma weryfikowalny dowód (kroki reprodukcji, artefakt, hash, zrzut z danych syntetycznych) — zgodnie z zasadą claim ≤ proof. 0 gołosłowne · 2 opis bez reprodukcji · 3 reprodukcja częściowa · 4 pełna reprodukcja + artefakt · 5 artefakt + integralność (np. sha256) i chain-of-custody. MVP spec
Severity accuracy
trafność ważności
Czy przypisana ważność (np. skala CVSS/kontekst biznesowy) odpowiada rzeczywistemu wpływowi — bez zawyżania i zaniżania. 0 brak oceny · 2 duża rozbieżność · 3 właściwy rząd wielkości · 4 trafna z uzasadnieniem · 5 trafna + kontekst wpływu i wektora. MVP spec
Remediation clarity
jasność naprawy
Czy rekomendacja naprawcza jest konkretna, wykonalna i priorytetyzowana (co zrobić, gdzie, w jakiej kolejności). 0 brak · 2 ogólnik („popraw walidację") · 3 kierunek działania · 4 konkretne kroki · 5 kroki + priorytet + weryfikacja po naprawie (retest). MVP spec
Legal awareness
świadomość prawna
Czy uczestnik rozpoznaje możliwe obowiązki (DORA/NIS2/RODO/AI Act) jako wsparcie decyzji — z zastrzeżeniem, że to nie porada prawna. 0 brak · 2 wzmianka bez kontekstu · 3 właściwy reżim · 4 reżim + orientacyjny termin · 5 j.w. + jawne zastrzeżenie „decision support, nie porada". MVP spec

Jak liczymy (dziś: ręcznie)

Ocena review MVP

Zgłoszenie ocenia recenzent według rubryki powyżej. Ocena na papierze/w tabeli — bez automatu. To spec, którą można stosować od zaraz.

Scoreboard interaktywny ROADMAP

Automatyczne liczenie, tablica na żywo, filtry per ścieżka. Nie istnieje jeszcze — planowane. Do tego czasu wynik to feedback recenzenta.

Hall of Fame ROADMAP

Uznaniowa lista wyróżnień (nazwa/nick, za zgodą). Bez nagród finansowych. Wyłącznie uznanie edukacyjne. Do zbudowania.

Anty-gaming ROADMAP

Zasady przeciw naciąganiu punktów (duplikaty, zawyżona severity) będą częścią rubryki i review. Szkielet, nie działający mechanizm.

Skrót statusów

4
Wymiary spisane (MVP)
evidence · severity · remediation · legal
3
Elementy ROADMAP
scoreboard · Hall of Fame · anty-gaming
0
Nagród finansowych
ocena = nauka i feedback
0–20
Orientacyjny zakres punktów
4 osie × 0–5 · nie certyfikat

Czego ten scoreboard NIE oznacza

To nie jest ranking na żywo ani ocena zdolności zawodowych. Punkty są informacją zwrotną w kontekście edukacyjnym (junior-academy) i ćwiczebnym (senior-arena) na danych syntetycznych. Nie stanowią oceny kwalifikacji ani rekomendacji zatrudnienia.
„Wynik" u nas znaczy pokrycie rubryki, nie skuteczność naruszenia. Cała ścieżka jest defensywna (GRC/blue): oceniamy jakość dowodu, trafność klasyfikacji, jasność naprawy i świadomość obowiązków — a nie skuteczność techniki naruszenia. Zero payloadów, zero instrukcji ataku.
Granica etyczna i prawna. Academy i arena działają wyłącznie defensywnie, na danych syntetycznych, w granicach pisemnych Rules of Engagement. Wymiar legal awareness to wsparcie decyzji (decision support), nie porada prawna — każdy odnośnik do DORA/NIS2/RODO/AI Act wymaga weryfikacji przez radcę/kancelarię. Ta strona nie zbiera i nie punktuje żadnych technik naruszenia.

Powiązane: ścieżka nauki → /junior-academy · ćwiczenia zaawansowane → /senior-arena · granice narzędzia → /known-limitations.