OpenAI har uppmanat en domare att avvisa The New York Times stämning mot Microsoft och OpenAI, och anklagar tidningen för att ha "hackat" deras produkter.
De anklagar The New York Times för att ha fabricerat upphovsrättsintrång genom en uttömmande och manipulativ process som involverar "tiotusentals försök" och "vilseledande uppmaningar som uppenbart bryter mot OpenAI:s användarvillkor".
Det starkt formulerade domstolsinlägget inleds med: "Anklagelserna i Times klagomål uppfyller inte dess berömda rigorösa journalistiska standarder. Sanningen, som kommer att komma fram under målets gång, är att Times betalade någon för att hacka OpenAI:s produkter."
New York Times är begära omfattande skadestånd från både Microsoft och OpenAI.
Även om det finns en ständigt växande hög av stämningar AI-företag från alla hörn av de kreativa branscherna är inblandade, och det här fallet är på väg att bli en milstolpe. Det kan omforma landskapet för AI-utveckling och upphovsrättslagstiftning.
Du kan dock vara säker på att Big Tech kommer att kämpa med näbbar och klor. "Normala människor använder inte OpenAI:s produkter på det här sättet", hävdade OpenAI i sin senaste ansökan.
Termen "prompt engineering" eller "red-teaming", som OpenAI nämner i sin juridiska ansökan, fungerar som ett stresstest för att upptäcka sårbarheter i AI-system.
Genom att mata generativa AI-system med specifikt utformade uppmaningar tvingas de att negera sina skyddsräcken och uppträder oregelbundet.
Detta har lett till en rad märkliga och potentiellt farliga reaktioner, till exempel att erbjuda hjälp att tillverka bomber eller uppmuntrar till självmord och andra skadliga aktiviteter.
OpenAI:s inlaga, tillgänglig härOpenAI och de andra svarandena i dessa stämningar kommer i slutändan att vinna eftersom ingen - inte ens New York Times - har rätt att monopolisera fakta eller språkregler."
Det står också: "I motsats till påståendena i klagomålet är ChatGPT dock inte på något sätt ett substitut för en prenumeration på The New York Times. I den verkliga världen använder människor inte ChatGPT eller någon annan OpenAI-produkt för det ändamålet. Det skulle de inte heller kunna göra."
Detta är avgörande, eftersom NYT måste övertyga domaren om ekonomiska skador till följd av OpenAI:s intrång.
Upphovsrätt: rättvis användning eller kryphål?
Det är en öppen hemlighet att generativa AI-modeller gärna tränas på upphovsrättsdata, vissa i större utsträckning än andra.
OpenAI erkände detta i en förhandsinlaga till det brittiska överhuset (House of Lords)"Eftersom upphovsrätten idag täcker praktiskt taget alla typer av mänskliga uttryck - inklusive blogginlägg, fotografier, foruminlägg, programkod och myndighetsdokument - skulle det vara omöjligt att träna dagens ledande AI-modeller utan att använda upphovsrättsskyddat material."
OpenAI fortsatte med vad vissa såg som en freudiansk glidning: "Att begränsa träningsdata till böcker och teckningar som skapades för mer än ett sekel sedan kan ge ett intressant experiment, men skulle inte ge AI-system som uppfyller behoven hos dagens medborgare."
Det råder ingen tvekan om att AI-företag har för avsikt att använda upphovsrättsskyddade data. Men det betyder inte att upphovsrättslagen, en konstruktion före AI, inte är på deras sida.
Under en diskussion i Davos, Schweiz, uttryckte OpenAI:s VD, Sam Altman, sin förvåning över NYT:s stämning och klargjorde en vanlig missuppfattning om behovet av tidningens data för att träna OpenAI:s modeller.
"Vi behöver faktiskt inte träna på deras data", sa Altman och betonade den försumbara effekten av att utesluta data från en enskild utgivare på ChatGPT:s resultat.
OpenAI är dock medvetet om den potentiella kumulativa effekten av att flera utgivare drar tillbaka sitt innehåll och håller på att säkra avtal om att använda innehåll från mediehus för AI-träning.
A nyligen genomförd studie från Reuters Institute for the Study of Journalism vid University of Oxford fann att cirka 48% av de stora nyhetssajterna nu blockerar OpenAI:s webbsökare, vilket allvarligt kan begränsa företagets tillgång till färsk, högkvalitativ data.
OpenAI och andra teknikföretag kommer förmodligen att behöva börja betala för data men förblir ostraffade för sina exploateringar hittills.