vendredi, 29 mars 2024

Facebook vante la biométrie vocale non supervisée, l’infrastructure de l’IA pourrait accélérer les choses

La biométrie vocale était actuellement sur le point de dépasser les rôles décevants qu’elle joue aujourd’hui, et une toute nouvelle annonce de AI pourrait s’avérer être un accélérateur de développement encore plus important.

Le laboratoire d’IA pour déclare dans un article qu’il a en fait développé des outils vocaux formés sans conseils. Non seulement l’avance est censée rendre la production de systèmes de reconnaissance vocale plus rapide et moins coûteuse, mais elle est censée le faire pour toutes les langues et tous les dialectes.

L’annonce intervient alors que l’informatique de pointe est déployée pour traiter la voix reconnaissance et autres tâches gourmandes en calcul. Retirer la majorité de ce travail du cloud augmente les vitesses de fonctionnement, ce qui sera vital pour des rôles plus larges et beaucoup plus profonds pour les camions à biométrie vocale, par exemple.

Dans un article publié par le laboratoire, des scientifiques de l’entreprise composer que wav2vec-U (pour ne pas être regardé) entraîne des modèles d’accusé de réception de la parole sans données étiquetées. Autrement dit, aucune entrée de synthèse vocale humaine n’est nécessaire – wav2vec-U traite les enregistrements audio vocaux non étiquetés et le texte non étiqueté.

Ceci est la 3ème version de wav2vec mais la première qui ne nécessite aucune indication, selon AI, et il est ouvert à tous les concepteurs via GitHub.

L’algorithme découvre la structure de la parole à partir des enregistrements vocaux. Les enregistrements sont segmentés au niveau phonétique et transmis au modèle auto-supervisé. Un réseau antagoniste génératif, ou générateur et discriminateur, est formé pour reconnaître les mots enregistrés.

Selon AI, wav2vec-U a été vérifié sur la norme TIMIT, et il a réduit le taux d’erreur de 57% par rapport à « la prochaine meilleure technique à ne pas surveiller. »

La société d’études de marché ReportLinker prévoit que le marché mondial de la biométrie vocale conventionnelle aura plus que triplé par rapport à 2020. Le marché était d’environ 1 milliard de dollars, et il est devrait dépasser 3,4 milliards de dollars en 2025.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici