Passer au contenu

Apple Intelligence entraîné avec des livres piratés ? Des auteurs portent plainte contre Apple

Il est encore trop tôt pour dire qu’il existe une « jurisprudence Anthropic », qui va verser 1,5 milliard de dollars à des auteurs américains suite au téléchargement et à l’exploitation de milliers de livres piratés. Néanmoins, cet accord à l’amiable pour éviter un procès donne déjà peut-être des idées.

1,5 milliard de dollars : c’est la somme énorme qu’Anthropic va verser à quelque 500 000 écrivains qui se sont regroupés dans une action collective contre le créateur du bot Claude. La start-up est accusée d’avoir téléchargé des livres piratés pour entraîner son modèle IA. Pour éviter un procès qui pourrait être encore plus coûteux — des estimations évoquaient la bagatelle de… 1 000 milliards de dollars ! —, l’entreprise a préféré signer un gros chèque.

Lire Anthropic paie une somme astronomique pour éviter un procès sur des livres piratés

On ignore si la nouvelle plainte de deux auteurs contre Apple est motivée par « l’affaire Anthropic », mais toujours est-il que la poursuite intentée par Grady Hendrix et Jennifer Roberson y ressemble beaucoup. Cette class action, à laquelle d’autres écrivains pourront se rallier, accuse Apple d’avoir entraîné ses modèles IA à l’aide d’un corpus de 20 000 livres piratés. Les œuvres des plaignants, protégés par le droit d’auteur, figurent dans cette base de données. Et bien sûr, ils n’ont pas donné leur consentement ni reçu de compensation.

Dans le détail, Applebot — le robot d’Apple qui sillonne le web — aurait copié de grandes quantités de pages web, y compris potentiellement celles provenant de « shadow libraries » (LibGen, Z-Library, Sci-Hub, etc.), qui distribuent illégalement des livres protégés. Selon les plaignants, Apple a dissimulé cette pratique jusqu’à l’été 2024, trop tard pour que les éditeurs puissent empêcher l’utilisation de leurs contenus.

Les plaignants estiment aussi qu’Apple a sciemment préféré exploiter des corpus piratés plutôt que de payer des licences, alors que le marché des droits pour l’entraînement d’IA est en pleine expansion. Également dans leur collimateur : les contenus générés par Apple Intelligence produiraient des contenus concurrents aux œuvres originales, ce qui entraîne une dilution de la valeur marchande des œuvres, une baisse des ventes et un risque de confusion pour les lecteurs.

Enfin, Apple conserverait une bibliothèque privée de données d’entraînement comprenant ces œuvres piratées. Cette base de données pourrait être réutilisée pour de futurs modèles, ce qui constituerait une violation continue des droits d’auteur. Les plaignants réclament des dommages et des compensations, une injonction permanente interdisant à Apple de poursuivre ces pratiques, la destruction des modèles Apple Intelligence et des jeux de données contenant les œuvres protégées.

La firme à la pomme avait expliqué au lancement d’Apple Intelligence que les modèles IA du constructeur étaient entraînés avec les données du « web ouvert » et aussi sur des bases de données achetées auprès d’éditeurs.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : Reuters


Mickaël Bazoge