Mecenas ChatGPT

2026-05-20

O tym, czego model językowy nie może zrobić – nawet gdy mówi prawdę

Robert Nogacki | Kancelaria Prawna Skarbiec

Przez ostatnie dwa lata środowisko prawnicze z pewną satysfakcją dokumentowało kolejne przypadki adwokatów składających pisma z wymyślonymi orzeczeniami. Morał był zawsze ten sam: AI zmyśla, należy sprawdzać. Problem w tym, że to nie jest obserwacja o AI. To jest obserwacja o sposobie, w jaki używano AI.

Duże modele językowe zasadniczo nie halucynują, jeśli wie się jak się z nimi obchodzić. Halucynacja jest niemal zawsze produktem złego użycia: pytasz model o fakty, których nie posiada w danych treningowych, albo o szczegóły konkretnego dokumentu, którego nie czytał. Model nie odpowiada „nie wiem” – generuje najbardziej prawdopodobne uzupełnienie luki. Jeśli znasz granicę narzędzia, nie wchodzisz w strefę, gdzie konfabuluje. Odkrywanie halucynacji AI jest w dużej mierze przyznaniem się do tego, że nie umie się z AI korzystać.

Prawo jest dziedziną wyjątkowo podatną na ten rodzaj błędu. Orzecznictwo jest rozległe, hierarchiczne, jurysdykcyjnie rozdrobnione i stale ewoluujące. Modele trenowane na ogólnodostępnym tekście internetowym mają nieproporcjonalną reprezentację najczęściej cytowanych źródeł. Badacze z Princeton zaproponowali użyteczną taksononomię: przetwarzanie informacji (model działa dobrze – istnieje jasna prawidłowa odpowiedź), zadania wymagające kreatywności i oceny (model zawodzi – brak prawidłowej odpowiedzi bez znajomości konkretnego kontekstu), predykcja (model nie ma dostępu do informacji decydujących o wyniku) [Kapoor, Henderson, Narayanan (2024)].

Właściwe użycie modelu językowego to używanie go tam, gdzie jest dobry: jako narzędzie do automatyzacji procesu pisania tekstu, strukturyzowania myśli, szkicowania dokumentów. Nie jako wyroczni wiedzy o faktach. Nie jako zastępstwa analizy konkretnego dokumentu. I nie – co pokazuje sprawa Krafton – jako doradcy strategicznego w sporze o 250 milionów dolarów.

Zarówno zachwyt nad AI w prawie, jak i lęk przed nią, odwróciły uwagę od pytania zasadniczego: nie czy używać AI, lecz do czego. Prawnik, który w 2026 roku nie używa AI, jest w położeniu żołnierzy szarżujących z bagnetami na karabiny maszynowe pod Sommą w 1916 roku: odwaga i rzemiosło niezaprzeczalne, lecz asymetria technologiczna rozstrzygająca.

* * *

W marcu 2026 roku na wokandę Delaware Court of Chancery trafiła sprawa, która jest w tym kontekście osobliwa. Nie dlatego, że AI coś zmyślił. Nie dlatego, że któryś z prawników złożył pismo z fikcyjnymi orzeczeniami. Właśnie dlatego, że AI powiedział prawdę – i właśnie to, jak się okazało, nie miało żadnego znaczenia.

Fortis Advisors LLC v. Krafton, Inc., rozstrzygnięta przez Delaware Court of Chancery 16 marca 2026 roku (sprawa nr C.A. 2025-0805-LWW), jest interesująca z zupełnie innego powodu. ChatGPT nie zmyślił tu niczego. Powiedział prawdę. I właśnie dlatego warto się jej przyjrzeć.

Źródła: pełny wyrok (Justia) | Fortune

Krafton, Unknown Worlds i Subnautica – tło

Krafton Inc. to południowokoreński konglomerat gamingowy, znany z PUBG: Battlegrounds. W 2021 roku szukał dywersyfikacji i nabył Unknown Worlds Entertainment – studio (43 pracowników) twórców Subnautica, gry survivalowej, która sprzedała się w ponad 17,5 miliona egzemplarzy, generując ponad 300 milionów dolarów przychodu. Za studiem stała para twórców: Charlie Cleveland i Max McGuire, którzy wbudowali w DNA studia model wczesnego dostępu: wypuszczasz grę nieskończoną, zbierasz feedback gracza, wprowadzasz zmiany.

W październik u 2021 roku Krafton nabył Unknown Worlds za 500 milionów dolarów plus earnout do 250 milionów.

Earnout to mechanizm ceny odroczonej w transakcjach M&A: nabywca płaci część ceny przy zamknięciu, resztę warunkowo, jeśli zbywca osiągnie wyniki w ustalonym oknie. W teorii: podział ryzyka. W praktyce: jeden z najczęstszych źródeł sporów po-transakcyjnych. Formuła Krafton była wyjątkowo dźwigniowa: 3,12 dolara za każdy kolejny dolar powyżej progu 69,8 milionów – do pułapu 250 milionów. Gdy Subnautica 2 nabierała kształtu, pułap stał się realną perspektywą. I wtedy Krafton stracił zainteresowanie kontraktem, który sam podpisał.

Gdy projekcje wskazały w maju 2025 roku, że planowana na 14 sierpnia premiera Subnautica 2 wygeneruje 191–242 milionów dolarów wypłaty, CEO Changhan Kim – zamiast zlecić analizę opcji kontraktowych – zapytał ChatGPT. Chatbot powiedział, że earnoutu nie da się anulować, a następnie zaproponował pięciopunktowy plan przejęcia kontroli nad studiem, wewnętrznie nazywany „Project X”. Krafton plan wykonał.

Sąd wpisał go do akt jako dowód złej wiary, nakazał przywrócenie CEO Teda Gilla i przedłużył okres earnoutu o 258 dni. Faza druga – odszkodowanie za utracony earnout – pozostaje otwarta.

Czym jest strategia – i dlaczego nie jest wzorcem?

Model językowy jest maszyną statystyczną. Trenowany na miliardach tokenów tekstu – orzeczeniach, umowach, blogach prawniczych – nauczył się rozpoznawać wzorce. Gdy CEO Krafton zapytał o strategię w sporze earnoutowym, model wygenerował odpowiedź, którą wygenerowałby kompetentny strateg zapytany o typowy spór earnoutowy. To jest dokładnie to, do czego model jest zdolny – i to jest jego fundamentalne ograniczenie.

Strategia prawna nie działa na poziomie wzorca. W akademickiej taksonomii halucynacji agentów językowych odpowiada to kategorii Planning Generation Hallucinations: model generuje plan wykraczający poza granice swojej wiedzy z nadmierną pewnością siebie. ChatGPT nie czytał Equity Purchase Agreement z 2021 roku. Nie wiedział, że definicja Cause wymaga udowodnienia intentional act of dishonesty – a nie zwykłego niedopełnienia obowiązków. Nie wiedział żadnej z rzeczy, które Vice Chancellor Will uznała za decydujące. Lin i in. (2025)

Wygenerował za to plan taktyczny, który wyglądał jak strategia: nagłówki, podpunkty, sekwencja kroków. Dokładnie tak jak powinien wyglądać plan w typowym sporze – co jest inną sprawą niż to, jak powinien wyglądać plan w tym sporze, przy tej definicji Cause, w tym systemie orzeczniczym.

Mapa bez legendy

Istnieje klasyczne rozróżnienie epistemologiczne między wiedzą propozycjonalną a wiedzą sytuacyjną. Model posiada imponującą wiedzę propozycjonalną: wie, że earnouty bywają trudne do anulowania, że klauzule Cause bywają wąsko interpretowane. Nie posiada wiedzy sytuacyjnej: nie wie, że ta umowa, ci negocjatorzy, ten sąd i ta chwila tworzą konfigurację wykluczającą standardową taktykę.

Co więcej – model nie zasygnalizuje tej luki. Wygeneruje plan z taką samą pewnością siebie niezależnie od tego, czy ma wszystkie potrzebne dane, czy nie ma żadnych. Pewność siebie jest tu cechą stylistyczną, nie epistemiczną.

To odróżnia model od prawnika. Dobry prawnik czyta umowę w poszukiwaniu słabych miejsc, a nie mocnych; i mówi: tu jest słaby punkt, który zmienia całą analizę. Model nie ma dostępu do słabego punktu, jeśli nie jest mu podany.

Jest jeszcze jedna warstwa, którą warto odnotować. Modele językowe trenowane na informacji zwrotnej od ludzi rozwijają strukturalną tendencję do mówienia tego, co użytkownik chce usłyszeć. Badania opublikowane na ICLR 2024 pokazują, że zgodność z przekonaniami użytkownika jest najbardziej predyktywną cechą ludzkich preferencji w danych treningowych – silniejszą nawet niż prawdziwość odpowiedzi. W konsekwencji modele często przyznają się do błędu nawet gdy odpowiedziały prawidłowo i dostosowują się do preferencji użytkownika po wyrażeniu niezgody. W sprawie Krafton: Kim usłyszał prawidłową odpowiedź, wyraził frustrację i natychmiast przesformował pytanie jako prośbę o strategię. Model odpowiedział. Możliwe, że nie była to wyłącznie kwestia sposobu zadania pytania – możliwe, że sam mechanizm treningu sprawił, iż model był skonfigurowany do dostosowywania się do preferencji użytkownika w momencie, gdy ten sygnalizuje niezadowolenie z odpowiedzi. ChatGPT nie poddal się Kim’owi. Zachował się dokładnie tak, jak zaprojektowano systemy tego typu: optymalizując natychmiastową satysfakcję użytkownika. Problem polega na tym, że natychmiastowa satysfakcja użytkownika w sporze o 250 milionów dolarów jest kategorią całkowicie rozłączną z interesem strategicznym tego użytkownika. Sharma i in. (ICLR 2024)

Kategoria błędu

W sprawie Krafton nie doszło do błędu technicznego. Doszło do błędu kategorialnego: CEO użył narzędzia do zadania, które to narzędzie strukturalnie wykonać nie może.

To jest subtelniejszy i poważniejszy błąd niż niezweryfikowanie cytowania. Niezweryfikowane cytowanie można odkryć sprawdzając je w bazie. Nieodróżnienie strategii od pozoru strategii wymaga oceny zawodowej, której model nie dostarczy.

Możliwy kontrargument: model powiedział prawdę. Kim po prostu to zignorował. Tak – ale to jest właśnie problem. Klient, który nie potrafi odróżnić, które odpowiedzi modelu są wiarygodne, jest w gorszej sytuacji niż klient bez doradztwa, bo ma złudzenie posiadania strategii.

Czego model może być częścią

To nie jest argument przeciwko używaniu LLM w praktyce prawnej. Jest to argument za precyzyjną kwalifikacją zadań.

Model jest użyteczny jako narzędzie wstępnej analizy: identyfikacja ryzyk typowych dla danej struktury, przegląd orzecznictwa (por. ABA Formal Opinion 512), szkicowanie dokumentów do weryfikacji. Badacze z Princeton rekomendują używanie AI w wąskich zadaniach z pełną obserwowalnością istotnych informacji – takich, gdzie wynik jest weryfikowalny, a granice modelu – rozpoznawalne.

Model jest nieodpowiedni jako substytut strategicznego doradztwa z trzech powodów: nie czytał dokumentów decydujących o sprawie, nie ma dostępu do informacji niepodanych przez użytkownika i nie sygnalizuje granic własnej kompetencji.

Pełnomocnik procesowy robi coś kategorycznie innego: czyta umowę w poszukiwaniu słabych miejsc; modeluje zachowanie sądu; i mówi klientowi rzeczy, których nie chciał usłyszeć, bo honorarium nie zależy od jego zadowolenia.

ChatGPT ma jeden trwały problem instytucjonalny, potwierdzony empirycznie: mówi to, co statystycznie chcesz usłyszeć. Strategia prawna w trudnej sprawie często wymaga usłyszenia czegoś dokładnie przeciwnego.

Mecenas ChatGPT jest bardzo dobry w tym, co robi. Problem polega na tym, że to, co robi, nie jest doradztwem prawnym.

Inne publikacje na podobne tematy

Sztuczna Inteligencja a świadomość, osobowość prawna i wolna wola

AI dla prawnika | Sztuczna inteligencja a analiza prawna

Wielki Brat wie co promptujesz

Więcej publikacji na tematy związane ze Sztuczną Inteligencją.

Robert Nogacki

Robert Nogacki – radca prawny (WA-9026), założyciel Kancelarii Prawnej Skarbiec.

Są prawnicy, którzy zajmują się prawem. I są tacy, którzy zajmują się problemami, na które prawo nie ma gotowej odpowiedzi. Od ponad dwudziestu lat Kancelaria Skarbiec pracuje na przecięciu prawa podatkowego, struktur korporacyjnych i ludzkiej niechęci do oddawania państwu więcej, niż się państwu należy. Doradzamy przedsiębiorcom z kilkunastu krajów – od tych z listy Forbesa po tych, którym fiskus właśnie zajął konto i którzy nie wiedzą, co robić jutro rano.

Jeden z najczęściej cytowanych ekspertów prawa podatkowego w polskich mediach – pisze dla Rzeczpospolitej, Dziennika Gazety Prawnej i Parkietu nie dlatego, że to dobrze wygląda w CV, lecz dlatego, że pewnych rzeczy nie da się wyjaśnić w piśmie procesowym i ktoś musi je powiedzieć głośno. Autor AI Decoding Satoshi Nakamoto. Sztuczna inteligencja na tropie twórcy Bitcoina. Współautor nagrodzonej książki Bezpieczeństwo współczesnej firmy.

Kancelaria Skarbiec zajmuje czołowe pozycje w rankingach kancelarii podatkowych Dziennika Gazety Prawnej. Czterokrotny laureat Medalu Europejskiego, laureat tytułu International Tax Planning Law Firm of the Year in Poland.

Specjalizuje się w sporach z organami skarbowymi, międzynarodowym planowaniu podatkowym, regulacjach kryptoaktywów i ochronie majątku. Od 2006 roku prowadzi sprawę WGI – jedną z najdłuższych spraw karnych w historii polskiego rynku finansowego, bo są rzeczy, których nie wolno zostawić w połowie, nawet jeśli trwają dwie dekady. Wierzy, że prawo jest zbyt poważne, żeby traktować je wyłącznie poważnie – i że najlepsza porada prawna to ta, dzięki której klient nigdy nie musi stanąć przed sądem.