Les sociétés d'octroi de licences pour les ensembles de données d'IA créent un groupe commercial information fournie par Reuters 26/06/2024 à 15:33
((Traduction automatisée par Reuters, veuillez consulter la clause de non-responsabilité https://bit.ly/rtrsauto))
(Supprime les caractères supplémentaires dans le premier paragraphe) par Katie Paul
Sept vendeurs de musique, d'images, de vidéos et d'autres ensembles de données destinés à la formation de systèmes d'intelligence artificielleont formé le premier groupe commercial du secteur,ont-ils annoncé mercredi.
La Dataset Providers Alliance (DPA) plaidera en faveur d'un "approvisionnement éthique en données" pour la formation des systèmes d'intelligence artificielle, y compris les droits des personnes représentées dans les ensembles de données et la protection des droits de propriété intellectuelle des propriétaires de contenu, ont déclaré les entreprises dans un communiqué.
Parmi les membres fondateurs figurent la société américaine Rightsify, spécialisée dans les données musicales, le service de licences d'images vAIsual, le fournisseur japonais de photos d'archives Pixta et la place de marché de données Datarade, basée en Allemagne.
Ces dernières années, l'émergence de technologies d'IA générative capables d'imiter la créativité humaine a suscité une levée de boucliers de la part des créateurs de contenu et une série de poursuites en matière de droits d'auteur contre des entreprises technologiques telles que Google GOOGL.O , Meta
META.O et OpenAI, le fabricant de ChatGPT, qui est soutenu par Microsoft MSFT.O .
Les développeurs ont formé des modèles en leur fournissant de grandes quantités de contenu, dont une grande partie est extraite gratuitement de l'internet sans le consentement de ceux qui ont créé les œuvres ou qui en détiennent les droits.
Les entreprises technologiques, qui affirment que l'utilisation est légale, paient également discrètement l'accès à des collections privées de contenu, à la fois pour répondre à des besoins de types particuliers de données et pour se prémunir contre les risques juridiques et réglementaires.
La perspective d'une augmentation de la demande de données sous licence si les détenteurs de droits d'auteur gagnent leur bataille juridique a suscité l'émergence d'une industrie naissante d'entreprises qui regroupent des contenus et en vendent l'accès à des fins d'utilisation par des systèmes d'intelligence artificielle.
En conséquence, des groupes ont été formés pour établir des normes éthiques pour ce commerce, comme Fairly Trained, une organisation à but non lucratif fondée cette année qui certifie les modèles qui n'ont pas utilisé de matériel protégé par le droit d'auteur sans licence.
La loi sur la protection des données cible le contenu de ces transactions et exige, par exemple, que ses membres acceptent de ne pas vendre des données textuelles obtenues en parcourant le web ou des fichiers audio contenant la voix de personnes sans leur consentement explicite.
Alex Bestall, directeur général de Rightsify et de sa filiale de licence GCX, qui a participé à la création du groupe, a déclaré que l'accent sera mis sur la promotion d'une législation telle que le NO FAKES Act, un projet de loi américain présenté l'année dernière qui prévoit des sanctions pour la création de répliques numériques non autorisées de voix ou d'images de personnes.
"Le plaidoyer jouera un rôle important, car tout le monde a pris position sur l'IA et le droit d'auteur, mais beaucoup de ces batailles n'ont pas encore été résolues et il faudra un certain temps pour qu'elles le soient", a déclaré M. Bestall.
La DPA fera également pression pour obtenir davantage d'exigences en matière de transparence des données de formation, comme celles prévues par la loi sur l'IA de l'Union européenne et par un projet de loi américain similaire présenté en avril, le Generative AI Copyright Disclosure Act, a-t-il ajouté.
Le groupe prévoit de publier un livre blanc exposant ses positions en juillet.