Grote nieuwsuitgevers in Amerika, Australië en Engeland houden de deur dicht voor de indexeringsbots van OpenAI. Ze willen de AI-machine niet voeden met nieuwe, actuele kennis en inzichten.
The Guardian, New York Times, CNN, Reuters en de Australian Broadcasting Corporation (ABC) behoren tot een groeiende groep uitgevers op de Engelstalige markt die GPTBot actief buiten de deur houden.
Ook Disney, Bloomberg, The Washington Post, The Atlantic, Axios, Insider, ESPN, Condé Nast, Hearst en Vox Media blijken de AI-crawlers bewust buiten de deur te houden.
De NY York Times paste vorige maand de gebruiksvoorwaarden van zijn site hiertoe aan. AI’s mogen teksten, foto’s, video’s en animaties van de site niet meer lezen. Het uitgeefbedrijf wil niet voorzien in gratis digitaal ‘eten en onderdak’.
Andere uitgevers kiezen een andere route. Met een kleine tekstuele aanpassing op hun site, enkel te zien door computers, weren ze de onverzadigbare dataslurpers.
OpenAI vertelt website-eigenaren zelf, proactief hoe zijn graaiers blind te maken. Dat gaat middels een simpele, algemeen geaccepteerde techniek: een paar regels kale tekst in het robots.txt-bestand dat praktisch alle websites hebben. Dat bestand vertelt tegen searchspiders hoe ze zich moeten gedragen op die site.
De betreffende nieuwsuitgevers hebben grote redacties die unieke kennis publiceren. Kennis en context die vaak niet eerder elders verscheen. Juist dit soort data voeden commerciële LLM-makers als OpenAI graag aan hun machines om deze slimmer te maken.
Het protest van de uitgevers is meerledig. De ene groep gooit het over de boeg van bescherming van auteursrecht, de ander wil niet weer een techbedrijf in het zadel helpen dat het verdienmodel achter nieuws bedreigt. Google heeft jaren zonder enige rem uit die trog kunnen eten. Weer een andere groep, Associated Press zit in dat kamp, sluit een licentieovereenkomst met OpenAI. Tegen betaling mogen de AI-bots informatie drinken.
Taaltools als GPT, PaLM (=Google/Bard), Meta’s LLaMa en Claude behoren tot de groep generatieve AI. Ze lezen grote taalsets om te leren hoe taal werkt. Op grond van oude taalpatronen kunnen ze nieuwe teksten vormen. In zekere zin zijn het slimme kopieermachines. Andere generatieve AI’s doen dit voor statisch beeld en video.
In de muziekwereld spelen vergelijkbare discussies. Uitgever Universal Music besloot recent om de vlucht naar voren te kiezen. Hij houdt de kopieermachines niet met juridische middelen buiten de deur, maar onderzoekt ook hoe het de AI-wereld kan omarmen. Hiertoe sloot het met YouTube een samenwerking om de grenzen op te zoeken van wat met generatieve AI kan en mag.
Foto: Aurélien Adoue (cc)