Według dokumentów sądowych opublikowanych w środę, inżynierowie OpenAI przypadkowo usunęli kluczowe dowody zgromadzone przez The New York Times i inne gazety w związku z pozwem dotyczącym wykorzystania ich artykułów do szkolenia modeli sztucznej inteligencji.
Zespoły prawne gazet spędziły ponad 150 godzin na analizie danych szkoleniowych OpenAI w poszukiwaniu dowodów na wykorzystanie ich treści. W dokumentach nie wyjaśniono, jak doszło do tego błędu ani co dokładnie zawierały usunięte dane. Chociaż OpenAI przyznało się do błędu i próbowało odzyskać dane, zgromadzone informacje okazały się niekompletne i nieprzydatne. OpenAI określiło usunięcie danych jako „usterkę techniczną”.
Sprawa rozpoczęła się w grudniu ubiegłego roku, gdy The New York Times Company oskarżyło OpenAI i jego partnera Microsoft o wykorzystanie „milionów” artykułów do szkolenia narzędzi AI, które obecnie „konkurują bezpośrednio” z treściami publikacji. Gazeta domaga się od OpenAI odszkodowania w wysokości miliardów dolarów za domniemane naruszenia praw autorskich.
Proces kosztował już The New York Times ponad milion dolarów, co podkreśla finansowe wyzwania, przed którymi stoją inne wydawnictwa w walce z gigantami technologicznymi. Tymczasem OpenAI podpisało porozumienia z dużymi wydawcami, takimi jak Axel Springer, Conde Nast czy Vox Media, co sugeruje, że wiele firm woli nawiązywać współpracę, niż podejmować walkę sądową.
Informację o usunięciu danych The New York Times zgłosiła formalnie Jennifer Maisel, prawniczka reprezentująca organizacje medialne. Rzecznik OpenAI, Jason Deutrom, stwierdził, że firma nie zgadza się z przedstawionymi zarzutami i wkrótce złoży własne stanowisko.