vendredi, 29 mars 2024

Grand saut dans la taille des ensembles de données biométriques de visage public

Un grand groupe de scientifiques extrêmement chinois affirme avoir produit une toute nouvelle norme de reconnaissance faciale à l’échelle d’un million. Ils affirment dans un nouvel article avoir construit un ensemble de données biométriques nettoyées de manière autonome de 2 millions d’identités parmi 42 millions d’images faciales.

L’ensemble de données non curatif contient 4 millions d’identités de célébrités parmi 260 millions d’images. Le nouveau benchmark proposé s’appelle WebFace260M, et il est décrit comme le plus grand ensemble de données biométriques de visage public.

C’est un différenciateur significatif. Les scientifiques publics ont dénoncé le désavantage auquel ils se trouvent avec les ressources d’ensembles de données par rapport aux entreprises personnelles, en particulier et Google. À toutes fins utiles, les deux disposent d’ensembles de données d’images illimités.

Le document terminologique indique que exploite 200 millions d’images de 8 millions d’identités lors de la formation de FaceNet. compte 500 millions de visages parmi 10 millions d’identités.

La taille des ensembles de données est un puissant accélérateur du développement de la biométrie, et les chercheurs publics sont stressés d’être exclus de la course.

Les scientifiques de WebFace260M , de l’Université Tsinghua, de l’Imperial College de Londres et d’une chinoise, XForwardAI, affirment que leur ensemble de données « révèle un énorme potentiel dans des circonstances de reconnaissance faciale standard, masquées et impartiales ». Il a été nettoyé avec un outil d’IA qu’ils ont créé, Cleaning Automatically by Self-Training.

Jack Clark, co-fondateur de la société d’étude de sécurité et de recherche sur l’IA Anthropic, écrit dans son Import AI, déclare :  » Les modèles formés sur l’ensemble de données résultant sont respectables. »

Clark fait également remarquer que la reconnaissance faciale – en particulier la reconnaissance faciale masquée – est très importante pour les entreprises de surveillance gouvernementales. Des résultats comme ceux de WebFace260M influencent les décisions sur « comment surveiller une population et combien de dépenses prévoient de réserver pour la surveillance indiquée. »

Un ensemble de données de cette taille présente évidemment des dangers plus immédiats. Avec d’excellents volumes, des images à confidentialité restreinte pourraient provenir, un problème de longue date pour les ensembles de données produits par les universitaires et les entreprises.

Un site a été publié avec l’historique des emplois et des informations mises à jour.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici