La base légale de l’intérêt légitime : fiche focus sur la diffusion des modèles en source ouverte (open source)
Compte tenu des bénéfices qu’elles peuvent présenter, les pratiques d’ouverture sont à prendre en compte dans l’évaluation de l’intérêt légitime d’un fournisseur de système d’IA. Il est toutefois nécessaire d’adopter des garanties permettant de limiter les atteintes qu’elles peuvent porter aux personnes.
L’ouverture en intelligence artificielle
Devant l’absence d’une définition communément admise pour la diffusion d’un modèle d’IA en source ouverte, la CNIL observe que l’ouverture dans ce domaine correspond en réalité à des pratiques diversifiées. Si la publication des paramètres du modèle est une condition minimale pour parler d’ouverture, d’autres pratiques peuvent être bénéfiques dans de nombreux cas. Ces pratiques peuvent être classées en plusieurs catégories :
- La transparence sur le développement du modèle, dont la publication :
- de la documentation de la procédure suivie pour développer le modèle (y compris la phase de collecte des données d’apprentissage), éventuellement sous la forme d’une publication scientifique,
- du code utilisé pour entraîner le modèle,
- des données d’entraînement.
- La transparence sur le modèle obtenu, dont la publication :
- d’une documentation du modèle, détaillant par exemple son architecture, ses performances, et ses limitations, et pouvant prendre la forme d’une fiche descriptive (souvent appelée model card en anglais),
- des poids du modèle.
- L’accès donné au modèle, dont la publication :
- d’une bibliothèque permettant son utilisation,
- d’une API permettant de l’utiliser,
- du code permettant d’utiliser le modèle,
- du modèle sous une licence permettant son utilisation, sa modification, ou sa redistribution.
Certaines de ces pratiques, comme la publication des données d’entraînement, peuvent néanmoins comporter des risques pour les personnes concernées, et ne peuvent ainsi être recommandées dans tous les cas. La diffusion en source ouverte peut présenter des bénéfices, même si tous les éléments listés ci-dessus ne sont pas diffusés. La publication de certains éléments peut toutefois être nécessaire pour assurer un gain significatif en termes de transparence ou de contrôle par les pairs. Dans ces cas, des mesures complémentaires sont recommandées pour limiter l’atteinte aux droits des personnes.