jeudi, 28 mars 2024

OpenAI a entraîné avec succès un bot Minecraft en utilisant 70 000 heures de vidéos de gameplay

Pourquoi c’est important : Minecraft peut ne pas sembler être un outil important qui soutient une étude de recherche innovante sur l’IA. Après tout, qu’est-ce qui pourrait être si crucial pour apprendre à un créateur à jouer à un jeu vidéo sandbox sorti il ​​y a plus de dix ans ? Sur la base des efforts récents d’OpenAI, un bot Minecraft formé est plus pertinent pour l’amélioration de l’IA que beaucoup de gens ne le pensent.

OpenAI s’est toujours concentré sur les progrès de l’intelligence artificielle (IA) et de l’apprentissage automatique qui profitent à l’humanité. Tout récemment, l’entreprise a efficacement formé un bot pour jouer à Minecraft en utilisant plus de 70 000 heures de vidéos de gameplay. L’accomplissement est bien plus qu’un simple bot jouant à un jeu. Il marque un pas de géant dans l’intelligence artificielle innovante utilisant l’observation et l’imitation.

Le bot d’OpenAI est un exemple exceptionnel d’apprentissage répliqué (aussi appelé « apprentissage surveillé ») en action. Contrairement à la connaissance par renforcement, où un agent d’apprentissage est récompensé après avoir atteint un objectif par l’expérimentation, la connaissance par réplique entraîne des réseaux de neurones à effectuer des tâches particulières en voyant les humains les terminer. Dans ce cas, OpenAI a tiré parti des vidéos de gameplay et des didacticiels proposés pour apprendre à son bot à réaliser des séries complexes dans le jeu qui demanderaient au joueur ordinaire environ 24 000 actions spécifiques à réaliser.

La connaissance par imitation nécessite que les entrées vidéo soient étiquetées pour fournir le contexte de l’action et le résultat observé. Cette technique peut nécessiter beaucoup de travail, ce qui se traduit par des ensembles de données facilement disponibles limités. Cette pénurie d’ensembles de données disponibles limite en fin de compte la capacité de l’agent à découvrir par l’observation.

Plutôt que de se forcer à travers un entraînement manuel complet de marquage d’informations, le groupe de recherche d’OpenAI a utilisé une approche particulière, connue sous le nom de pré-formation vidéo (VPT ), pour élargir considérablement la variété des vidéos identifiées proposées. Les chercheurs ont d’abord capturé 2 000 heures de gameplay annoté de Minecraft et l’ont utilisé pour former un agent à associer des actions particulières à des résultats particuliers à l’écran. Le modèle résultant a ensuite été utilisé pour créer immédiatement des étiquettes pour 70 000 heures de matériel Minecraft précédemment non étiqueté facilement disponible en ligne, offrant au bot Minecraft un ensemble de données beaucoup plus important à examiner et à imiter.

L’ensemble de l’entraînement montre la valeur potentielle des référentiels vidéo proposés, tels que YouTube, en tant que ressource de formation à l’IA. Les scientifiques de l’apprentissage automatique pourraient utiliser des vidéos disponibles et étiquetées de manière efficace pour entraîner l’IA à effectuer des tâches particulières, allant de la simple navigation sur le Web à l’assistance aux utilisateurs avec des exigences physiques réelles.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici