Sommaire
Dans un rapport récent (présenté au House of Lords Communications and Digital Select Committee), OpenAI a affirmé que l’entraînement des systèmes d’IA générative serait impossible sans accéder à des contenus protégés par des droits d’auteur. Malgré les poursuites judiciaires de divers ayants-droit, la start-up soutient que l’utilisation de contenus protégés est nécessaire pour former des modèles de langage avancés tels que GPT-4, la technologie à l’origine de ChatGPT.
Des inquiétudes à propos de l’utilisation des contenus protégés
Les outils d’IA générative tels que ChatGPT et Stable Diffusion sont développés à partir de vastes quantités de données collectées sur Internet, dont une grande partie est protégée par des droits de propriété intellectuelle. Cette utilisation sans consentement ni crédit a suscité des préoccupations parmi les éditeurs et les auteurs qui voient leur travail être ainsi exploité.
Face à ces inquiétudes, certains experts estiment que les développeurs doivent rester attentifs à ne pas utiliser de code ou de textes protégés par des droits d’auteurs. Ils soulignent également que cette question est devenue un sujet majeur dans les acquisitions de logiciels pour les grandes entreprises technologiques.
Des plaintes qui se multiplient
Cependant, OpenAI semble déterminée à défendre sa position, malgré les poursuites judiciaires. Dans une plainte récente, le New York Times a accusé OpenAI et Microsoft d’utiliser illégalement ses contenus pour créer des outils AI. En réponse, la start-up argue que la législation sur le droit d’auteur ne prohibe pas l’entraînement des modèles génératifs.
L’affaire du New York Times s’inscrit dans une série de litiges visant à limiter l’utilisation sans autorisation des données par l’IA générative. Des plaintes collectives ont également été déposées contre OpenAI et Microsoft par des auteurs qui accusent les deux entreprises de violer leurs droits d’auteur en utilisant leurs écrits sans autorisation.
Alors que les débats juridiques se multiplient, il est clair qu’une résolution satisfaisante doit être trouvée pour concilier les avancées de l’IA avec les droits d’auteur. Les contours de cette problématique restent flous, mais il est indéniable que le débat sera de plus en plus important à mesure que l’IA continuera à se développer, dixit John Licato, professeur adjoint en Computer Science et Engineering à l’Université de Floride du Sud.
En conclusion, il semble que la question de l’utilisation de contenus protégés par des droits d’auteur dans l’entraînement de l’IA générative est un sujet complexe qui nécessite une réflexion approfondie et une résolution légale. Les opportunités offertes par l’IA sont indéniables, mais il est crucial de trouver un équilibre entre l’innovation technologique et la protection des droits d’auteur.