AI & ML interests

Data Protection (GDPR)

Recent Activity

nbkcnil  updated a Space 4 days ago
cnil/README
nbkcnil  published a Space 13 days ago
cnil/README
View all activity

Cette page est le dépôt officiel de la Commission Nationale Informatique et Libertés (CNIL) sur la plateforme HuggingFace. Il s’inscrit dans la mission d’information de la CNIL telle que définie dans l’article 8.I.1 de la loi Informatique et Libertés mais également dans la mission de suivi de l’évolution des technologies de l’information telle que définie dans l’article 8.I.4.

Outil d'exploration de la généalogie des modèles open source

VERSION BĂŠTA

Comment assurer la traçabilité des opérations de modifications effectuées sur un modèle open source ?

Ce projet exploratoire est proposé par le Service IA et le Laboratoire d'Innovation Numérique de la CNIL (LINC). Il a pour but de développer un outil de médiation et de transparence. Il s’agit aujourd’hui d’une version bêta. Cet outil s’adresse aussi bien au grand public désireux de mieux comprendre l’écosystème de l'IA en source ouverte (open source) mais également aux professionnels et académiques.

Objectif de l'outil

Afin d’étudier le développement de la communauté de l’IA open source, et de préparer la possibilité d’exercices de droits par les personnes concernées, le projet vise à étudier la base de données des jeux de données et modèles présents sur la plateforme HuggingFace. Cette base de données très riche permet d’établir un arbre généalogique des modèles. Le contexte précis du projet est présenté dans un article sur le site du LINC insérer lien. À partir de l'identifiant d'un modèle ou d'un jeu de données (dataset), l'outil permet d'explorer les modèles et/ou jeux de données (datasets) dont il provient ou qu'il a engendré (sa généalogie), et en particulier de :

  • GĂ©nĂ©rer des statistiques sur la gĂ©nĂ©alogie
  • Visualiser et naviguer dans la gĂ©nĂ©alogie sous forme de graphe
  • Explorer la gĂ©nĂ©alogie sous forme de tableau interactif

genmod

Exemple de statistiques sur une généalogie de modèle

models 0

None public yet

datasets 0

None public yet