Collectieve rechtszaak tegen Adobe over auteursrecht en AI-training.

  • Auteurs beschuldigen Adobe ervan auteursrechtelijk beschermde boeken te gebruiken om het SlimLM-model te trainen.
  • De collectieve rechtszaak richt zich op de datasets SlimPajama-627B, RedPajama en Books3.
  • Deze zaak zou belangrijke precedenten kunnen scheppen op het gebied van auteursrecht en AI-training in de VS en Europa.
  • De controverse zet vraagtekens bij het datamodel van generatieve AI en Adobe's belofte van "verantwoorde AI".

Collectieve rechtszaak tegen Adobe over auteursrecht en AI-training.

De juridische strijd rondom Het trainen van kunstmatige intelligentiemodellen met auteursrechtelijk beschermde werken. Er is een nieuw hoofdstuk aangebroken met Adobe in het oog van de storm. Het bedrijf, dat van oudsher verbonden is met de creatieve sector, staat nu voor een nieuwe uitdaging. class action-rechtszaak Dit roept fundamenteel de vraag op hoe het bedrijf aan een deel van de gegevens is gekomen die gebruikt zijn om een ​​van zijn AI's te trainen.

De kern van de rechtszaak is SlimLM, een familie van lichtgewicht taalmodellen ontworpen voor documentondersteuningstaken, met name in mobielIn de klacht wordt beweerd dat de volgende methoden zijn gebruikt om dit systeem te trainen: illegale kopieën van boeken en andere auteursrechtelijk beschermde werken Zonder toestemming van de auteurs, wat een gevoelig front vormt, niet alleen voor Adobe, maar voor de hele generatieve AI-industrie, ook in Europa en Spanje, waar het debat over het rechtmatige gebruik van data voor AI steeds heviger wordt.

Context van de collectieve rechtszaak en oorsprong van het conflict

Juridische context van de collectieve rechtszaak tegen Adobe

El 17 december 2025Adobe werd op de hoogte gesteld van een voorgestelde collectieve actie voor een federale rechtbank in het noordelijke district van Californië. De rechtszaak is aangespannen door de auteur uit Oregon. Elizabeth Lyonbeschuldigt het bedrijf ervan misbruik te hebben gemaakt van de situatie. illegale kopieën van boeken —waaronder een aantal van zijn eigen werken— om de voorbereiding van zijn AI-modellen te voeden.

In de rechtszaak wordt beweerd dat Adobe zijn teksten heeft gebruikt als onderdeel van een verwerkte subset van gegevens die als basis dienden voor SlimLM. Dat materiaal zou deel uitmaken van een reeks bekende datasets in het AI-ecosysteem: Boeken3, opgenomen in Rode pyjamaen vervolgens geïntegreerd in de dataset SlimPajama-627B, gebruikt om het Adobe-model te trainen. Volgens de eisers zouden duizenden auteursrechtelijk beschermde werken in dit proces zijn gebruikt zonder toestemming, naamsvermelding of vergoeding.

Lyon beweert dat hij acteert. namens andere auteurs en rechthebbenden die zich in een vergelijkbare situatie zouden bevinden, wat de zaak tot een argument maakt mogelijk verstrekkende collectieve rechtszaakHoewel er nog geen specifiek bedrag openbaar is gemaakt, eist de rechtszaak een aanzienlijke financiële compensatie, juridische en andere schadevergoedingen, evenals betaling van advocaatkosten en een expliciete verklaring van opzettelijke inbreuk door Adobe.

Het bedrijf heeft op zijn beurt betoogd dat SlimLM is getraind met SlimPajama-627B., beschreven als een open-source dataset die in juni 2023 door het bedrijf Cerebras is gepubliceerd en bestaat uit gegevens die naar verluidt afkomstig zijn van meerdere open en ontdubbelde corporaDe kern van het juridische conflict ligt precies in de vraag of dit "open" karakter voldoende is om het gebruik te legitimeren van beschermde werken die anders zonder toestemming van de auteurs in de dataset terecht zouden zijn gekomen.

Voorlopig bevindt het proces zich nog in de beginfase. Adobe heeft vermeden om publiekelijk in detail te treden, en media zoals Reuters hebben opgemerkt dat het bedrijf niet heeft gereageerd op bepaalde verzoeken om commentaar. Lyon heeft echter benadrukt dat het vastbesloten om de zaak krachtig vooruit te helpen en dat het over de middelen beschikt om het tot het einde toe vol te houden, wat een langdurige en veelbesproken juridische strijd voorspelt.

Hoe SlimLM past in Adobe's AI-strategie

Adobe's SlimLM-model en AI-training

Een van de elementen die deze zaak bijzonder opvallend maakt, is dat het betreffende model niet GlimwormAdobe's meest zichtbare suite voor creatieve software voor het grote publiek, maar SlimLMeen veel discreter systeem, gericht op taken van hulp bij documenten en ondersteunende functies Op de achtergrond. We hebben het dus niet over AI die spectaculaire beelden genereert voor reclamecampagnes, maar over modellen die helpen bij het verwerken, samenvatten of beheren van tekst achter de schermen van applicaties.

Tot nu toe was Adobe's verhaal over AI sterk gebaseerd op Firefly. voorbeeld van “verantwoordelijke AI”, getraind —volgens het bedrijf zelf— met gelicentieerde inhoud (zoals Adobe Stock), materiaal in het publieke domein en andere bronnen waarover het bedrijf duidelijke rechten claimt. Bovendien heeft het bedrijf promotie gemaakt voor compensatieprogramma's voor Adobe Stock-bijdragers, met als doel het imago van het platform als partner van fotografen, illustratoren en contentmakers te versterken.

De rechtszaak richt zich echter niet op dat zeer zichtbare aspect. De aandacht is gericht op SlimLM en de oorsprong van de gegevens die gebruikt zijn voor de voorbereidingprecies in een gebied dat minder zichtbaar is voor de eindgebruiker. Dit verschil is belangrijk omdat het aantoont dat het debat over het gebruik van auteursrechtelijk beschermde werken niet beperkt is tot tools die spectaculaire beelden of creatieve teksten genereren, maar ook betrekking heeft op andere aspecten. Het heeft ook gevolgen voor stillere ondersteuningsmodellen.geïntegreerd in alledaagse producten.

Volgens de gepresenteerde documentatie zou SlimLM getraind zijn vanuit SlimPajama-627B, een variant van een grotere dataset, Rode pyjama, zeer populair in de AI-gemeenschap. Dit integreert op zijn beurt Boeken3een verzameling van ongeveer 191.000 boeken Dit argument is herhaaldelijk aangehaald in rechtszaken over auteursrecht. In de rechtszaak wordt gesteld dat als SlimPajama rechtstreeks is afgeleid van RedPajama, en RedPajama Books3 bevat, dan De werken van Lyon en andere auteurs zouden tijdens de voorbereidende opleiding zijn gekopieerd en bewerkt. zonder duidelijke juridische basis.

Voor Adobe komt dit probleem op een gevoelig moment, midden in de uitbreiding van hun diensten. Generatieve AI en hulpmiddelen Het bedrijf is geïntegreerd in zijn ecosysteem van creatieve en kantoorproducten. Het imago van het bedrijf als beschermer van makers, dat het zorgvuldig heeft opgebouwd om zich te onderscheiden van andere techreuzen, wordt daardoor aan bijzonder intense kritiek onderworpen, ook onder creatieve professionals in Spanje en Europa die dagelijks tools zoals Photoshop, Illustrator, Acrobat of Premiere gebruiken.

De rol van de datasets Books3, RedPajama en SlimPajama

Om te begrijpen waarom deze vraag veel verder gaat dan een geïsoleerd geval, is het de moeite waard even stil te staan ​​bij hoe de huidige AI-modellen worden getraind. Grote taalmodellen en veel generatieve AI's leren van enorme hoeveelheden tekst.Webpagina's, artikelen, boeken, code, technische documentatie, enzovoort. Hoe gevarieerder en uitgebreider deze verzameling, hoe beter de modellen doorgaans presteren, mits de gegevensverwerking en het systeemontwerp van de juiste kwaliteit zijn.

In deze context zijn datasets zoals Boeken3, een enorme verzameling boeken waarvan de herkomst al lange tijd twijfels oproept, en Rode pyjamaEen project dat tot doel heeft datasets te reproduceren die vergelijkbaar zijn met de datasets die grote laboratoria gebruiken om hun modellen te trainen. SlimPajama-627B Het zou een ontdubbelde en verfijnde variant zijn van dat materiaal, dat Cerebras in 2023 als open dataset beschikbaar heeft gesteld aan de gemeenschap.

Volgens de rechtszaak tegen Adobe zou SlimPajama gebouwd zijn. “kopiëren en manipuleren” RedPajama, inclusief de Books3-sectie. Die toevoeging is wat er in theorie voor zorgt dat... duizenden auteursrechtelijk beschermde werken in de hele keten. De aanklacht stelt dat, zelfs als Adobe de boeken niet direct had samengesteld, het feit dat het bedrijf gebruikmaakte van een dataset waarin deze boeken voorkomen, nog steeds fraude vormt. herhaaldelijk downloaden, kopiëren en verwerken materiaal beschermd tijdens de voorverwerkings- en trainingsfase.

De controverse is niet nieuw: beide Boeken3 als Rode Pyjama Ze zijn al eerder aangehaald in andere rechtszaken tegen technologiebedrijven, waaronder zaken waarin bedrijven als Apple en Salesforce ervan beschuldigd werden deze gegevens te gebruiken om hun interne modellen te trainen. Aan de basis van al deze geschillen ligt dezelfde vraag: Is het rechtmatig om ‘open’ datasets te hergebruiken die auteursrechtelijk beschermde werken bevatten? zonder voorafgaande toestemming van alle betrokken auteurs te hebben verkregen?

De juridische procedure tegen Adobe draagt ​​dus bij aan een een klein stroompje rechtszaken wat de sector ertoe aanzet zijn werkwijzen te herzien. In de praktijk verhoogt elke nieuwe zaak de druk om mechanismen te creëren voor traceerbaarheid van gegevensDuidelijke opt-out-systemen voor makers en specifieke licentiemodellen voor AI-training, iets dat in Europa ook beïnvloed zou kunnen worden door de EU-verordening inzake kunstmatige intelligentie en de bestaande auteursrechtregels.

Een juridisch front dat de hele AI-industrie nu al beïnvloedt.

De rechtszaak tegen Adobe komt niet uit het niets. Sinds 2023 is er sprake van een Een golf van auteursrechtelijke rechtszaken tegen bedrijven die generatieve AI ontwikkelen.waaronder namen als OpenAI, Stability AI, Meta, Anthropic en Midjourney. Veel van deze gevallen draaien om hetzelfde idee: het ongeoorloofde gebruik van auteursrechtelijk beschermde werken om modellen te trainen die teksten, afbeeldingen of muziek kunnen genereren die soms sterk lijken op de stijl van de oorspronkelijke auteurs.

Een van de recente mijlpalen was de overeenkomst bereikt door Anthropicdie ermee instemden om ongeveer te betalen 1.500 miljoen Verschillende auteurs veroordeelden het gebruik van illegale kopieën van hun boeken om de chatbot Claude te trainen. Deze veelbesproken overeenkomst werd geïnterpreteerd als een mogelijke buigpunt De manier waarop technologiebedrijven met dit soort claims omgaan, heeft de deur geopend voor de verwachting van aanzienlijke schadevergoedingen in toekomstige procedures.

Ondertussen hebben Amerikaanse media zoals TechCrunch, Reuters, The Verge en The New York Times verslag gedaan van de ontwikkelingen. gekoppelde gevallen Deze problemen treffen vrijwel alle grote spelers in de AI-sector. Het patroon herhaalt zich vaak: enorme datasets die alles bevatten, van webpagina's tot code repositories en zelfs complete boeken; een gebrek aan duidelijke toestemmingsmechanismen; en steeds krachtigere modellen die dit materiaal gebruiken om geavanceerde antwoorden, samenvattingen, analyses te leveren of creatieve content te genereren.

De Adobe-zaak voegt een relevante nuance toe: het bedrijf had een deel van zijn commerciële verhaal gebouwd rond het idee van... om zich te onderscheiden van de rest Het beschermen van makers. Daarom is het vermoeden dat een van de modellen gebaseerd zou kunnen zijn op illegale kopieën van boeken zo'n gevoelige snaar in de creatieve sector, ook in landen als Spanje, waar schrijvers, vertalers, journalisten en uitgevers Ze constateren met enige bezorgdheid hoe hun catalogi, direct of indirect, in trainingsdatasets terecht kunnen komen.

Buiten de Verenigde Staten zullen rechterlijke uitspraken in deze zaken in Europa nauwlettend worden gevolgd. Amerikaanse jurisprudentie over redelijk gebruik Het kopiëren voor transformatief gebruik strookt niet bepaald met het Europese kader, dat rechthebbenden meer beschermt. Desondanks kunnen de komende uitspraken van invloed zijn op hoe Europese rechters kwesties interpreteren zoals het massaal gebruik van data voor trainingsdoeleinden of de noodzaak van specifieke compensatie voor auteurs.

Potentiële impact in Europa en voor makers in Spanje

Hoewel de rechtszaak tegen Adobe is aangespannen bij een Amerikaanse rechtbank, kunnen de gevolgen ervan aan beide zijden van de Atlantische Oceaan voelbaar zijn. Grote technologiebedrijven opereren met globale modellen En hun manier van omgaan met gegevens is zelden beperkt tot één rechtsgebied. Als Amerikaanse rechtbanken uiteindelijk vaststellen dat het gebruik van bepaalde datasets inbreuk maakt op het auteursrecht, is het waarschijnlijk dat Dezelfde modellen of werkwijzen moeten worden herzien. ook in Europa.

In het specifieke geval van Adobe worden veel van hun AI-gebaseerde tools al op grote schaal gebruikt in Spaanse ontwerpstudio's, reclamebureaus, uitgeverijen en mediabedrijvenDe mogelijke aanwezigheid van Spaanse literaire werken in datasets zoals Books3 – zonder toestemming – baart auteurs en beroepsgroepen steeds meer zorgen. Als bevestigd wordt dat in Spanje geregistreerde boeken zijn gebruikt om modellen te trainen, kunnen er nieuwe problemen ontstaan. individuele of collectieve klachtenkanalen ook in Europese rechtsgebieden.

El AI-verordening van de Europese Unie, wat transparantieverplichtingen introduceert voor bepaalde systemen, evenals communautaire regelgeving over auteursrechtDeze factoren zullen cruciaal zijn bij het bepalen welke praktijken acceptabel zijn. Zo zou de eis om de gebruikte datasets te documenteren of om duidelijke opt-outmogelijkheden aan rechthebbenden te bieden, kunnen worden aangescherpt als gevallen zoals die van Adobe vaker voorkomen.

Voor het Europese creatieve ecosysteem versterkt dit soort rechtszaken de perceptie dat het noodzakelijk is onderhandelen over nieuwe vormen van verlof en beloning gerelateerd aan AI-training. Het gaat niet alleen om het voorkomen van ongeoorloofd gebruik, maar ook om het onderzoeken van manieren waarop uitgevers, auteursrechtenbureaus en technologieplatformen overeenstemming bereiken over de voorwaarden voor toegang tot catalogi literaire of visuele werken in ruil voor een redelijke vergoeding.

Vanuit een innovatieperspectief zal de uitdaging zijn om Het verzoenen van de ontwikkeling van krachtige modellen met oprecht respect voor intellectueel eigendom.In Spanje, waar de uitgeversbranche en de audiovisuele en reclamesector een aanzienlijk gewicht in de schaal leggen, zal de uitkomst van de rechtszaak tegen Adobe op de voet gevolgd worden, zowel door bedrijven die al AI gebruiken als door advocatenkantoren die gespecialiseerd zijn in digitaal recht en intellectueel eigendom.

Lessen voor startups en technologiebedrijven die AI gebruiken

De zaak met Adobe stuurt een directe boodschap naar ecosysteem van technologische startupsZowel in Amerika als in Europa is de herkomst van data van groot belang. Hoewel veel jonge bedrijven geen eigen, uitgebreide taalmodellen ontwikkelen, maken ze vaak gebruik van... open datasets, API's van derden en voorgeïnstalleerde modellen die mogelijk onbewust dezelfde juridische problemen met zich meedragen die nu voor de rechter worden besproken.

De eerste les is de noodzaak om gegevensbronnen grondig controlerenHet enkel labelen van een dataset als 'open' of het beschikbaar stellen ervan in een openbare repository garandeert niet automatisch de auteursrechtelijke bescherming ervan. Raadpleeg de documentatie, identificeer eventuele auteursrechtelijk beschermde onderdelen en neem bij twijfel contact op met de betreffende instantie. Zoek naar schonere alternatieven of onderhandel over specifieke vergunningen. Dit kan latere ernstige problemen voorkomen.

De tweede heeft te maken met internationale naleving van regelgevingStartups die vanuit Spanje of Latijns-Amerika opereren, maar gebruikers in Europa of de Verenigde Staten willen bereiken, moeten er rekening mee houden dat ze mogelijk onderworpen zijn aan meerdere rechtsgebieden tegelijkDit vereist dat er vanaf het begin duidelijke beleidsregels worden opgesteld met betrekking tot het verzamelen en opslaan van gegevens, toestemming en de reactie op verwijderingsverzoeken of auteursrechtclaims.

Ten derde biedt het een vruchtbare bodem voor nieuwe businessmodellen gericht op verantwoord databeheer. Traceerbaarheidstools voor datasets, diensten voor het verifiëren van toestemmingen, platforms die de licentieverlening van culturele catalogi vergemakkelijken, of oplossingen waarmee rechthebbenden het gebruik van hun werken in AI-systemen kunnen monitoren, kunnen hierbij van belang zijn. zeer waardevolle producten in de komende jaren.

Tot slot is het goed om te onthouden dat de reputatie Het is een even belangrijk bezit geworden als de technologie zelf. Voor elk bedrijf dat AI ontwikkelt of integreert, kan het een groot risico vormen om betrokken te raken bij een conflict over het misbruik van auteursrechtelijk beschermd materiaal. om wantrouwen te zaaien onder klanten, partners en gebruikers.Het creëren van een cultuur waarin intellectueel eigendom wordt gerespecteerd, is niet alleen een juridische kwestie, maar ook een slimme manier om je te onderscheiden in een markt die steeds meer verzadigd raakt met beloftes van 'ethische AI' of 'verantwoordelijke AI'.

Mogelijke scenario's en wat er daarna zou kunnen gebeuren.

Zoals bij veel rechtszaken van dit type, opent de zaak tegen Adobe een scala aan mogelijkheden. juridische scenario'sDe rechtbank kan besluiten de collectieve actie volledig toe te laten, de reikwijdte ervan te beperken, deze af te wijzen indien zij van mening is dat er onvoldoende gronden zijn, of, zoals in andere procedures is gebeurd, het geschil te beslechten via een buitengerechtelijke schikking Dat omvat financiële compensatie en toezeggingen om de werkwijze van het bedrijf te veranderen.

Voor Adobe ligt de grootste impact, naast de economische kosten, mogelijk in de noodzaak om hun datatoevoerketens grondig beoordelenDit houdt in dat er gecontroleerd moet worden welke datasets in elk model zijn gebruikt, welk deel van de training afhankelijk is van bedrijfseigen data, welke licenties dat gebruik dekken en hoe dit alles op een transparante manier aan klanten en regelgevende instanties gecommuniceerd kan worden.

De technologie-industrie bevindt zich over het algemeen op een kruispunt. Naarmate het aantal rechtszaken over auteursrecht toeneemt en de regelgeving strenger wordt – met name in de Europese Unie – lijkt het steeds minder haalbaar om de ontwikkeling van AI te baseren op auteursrecht. enorme hoeveelheden internetgegevens en dubieuze verzamelingen van boeken of afbeeldingenIn plaats daarvan is het idee van modellen die getraind zijn met zorgvuldig geselecteerde gegevens, met duidelijke toestemmingen en in veel gevallen vergezeld van vergoedingsovereenkomsten..

In dit veranderende landschap dient de Adobe-zaak als een spiegel voor zowel grote technologiebedrijven als kleinere ondernemingen die AI willen inzetten zonder juridische valkuilen. De uitspraak van de rechter in deze zaak zal cruciaal zijn. de collectieve rechtszaak over auteursrecht en AI-training Het zal niet alleen gevolgen hebben voor een specifiek model zoals SlimLM, maar het zou de manier waarop toegang tot creatieve data wordt opgevat in het tijdperk van kunstmatige intelligentie, kunnen herdefiniëren.

Hoe een boek te publiceren?
Gerelateerd artikel:
Hoe een boek te publiceren?