Uit rechtszaken blijkt dat Meta enorme hoeveelheden literatuur uit een databank haalt om haar taalmodellen te trainen. De database in kwestie, LibGen (Library Genesis), bevat naar schatting zo’n 7,5 miljoen boeken en 81 miljoen onderzoeksartikelen. Volgens analyse van Nieuwsuur staan daar inmiddels duizenden boeken van Nederlandse auteurs in verwerkt.
Van de 49 bestsellers uit 2023 van Nederlandse auteurs waren meer dan de helft – in elk geval 27 titels – al opgenomen in de database vóór april 2024. Bij bepaalde schrijvers, zoals Arthur Japin, staat de teller zelfs op twintig Nederlandstalige titels in LibGen.
Daarnaast heeft de Auteursbond al ruim 600 meldingen ontvangen van schrijvers die zich benadeeld voelen, meldt voorzitter Anja Sicking. Ze noemt het gedrag van Meta en soortgelijke techbedrijven ‘maffiapraktijken’.
Ter illustratie: alleen al van de 49 bestsellers die in 2023 door Nederlandse auteurs werden geschreven, stond meer dan de helft in de database op het moment dat Meta daar gebruik van maakte. Van sommige auteurs, zoals van romanschrijver Arthur Japin, staan er twintig Nederlandstalige titels in.
De klagers gaan overigens wel voorbij aan de vraag of hier werkelijk sprake is van auteursrechtelijke overtredingen. Daarvan zou pas sprake zijn als grote delen van een boek door AI chatbots worden weergegeven.
De EU wil de praktijken van de techbedrijven niettemin aan banden leggen: met de AI Act, die komende week van kracht wordt. In een gedragscode die bij de wet hoort, staat dat bedrijven toestemming nodig hebben en transparant moeten zijn over data waarmee ze hun modellen trainen. Meta heeft al laten weten de code niet te willen ondertekenen.
Foto Anefo archief
emerce
28-07-2025 11:00