samedi, 20 avril 2024

OpenAI lance les séries ChatGPT et GPT-3.5 alors que les rumeurs GPT-4 volent

Alors que les rapports GPT-4 volent autour de NeurIPS 2022 aujourd’hui à la Nouvelle-Orléans (consistant en des chuchotements selon lesquels des informations sur GPT-4 y seront exposées), OpenAI a en fait réussi à faire beaucoup de nouvelles entre-temps.

Lundi, l’entreprise a annoncé un tout nouveau design dans la famille GPT-3 de conceptions de grands langages alimentés par l’IA, text-davinci-003, qui fait partie de ce qu’il appelle la « série GPT-3.5,  » qui améliorerait ses prédécesseurs en gérant des instructions plus complexes et en produisant du matériel de meilleure qualité et plus long.

Selon un tout nouveau post de Scale.com, le nouveau design « se développe sur InstructGPT, en utilisant un support connaissant les commentaires humains pour mieux s’aligner conceptions de langage avec des instructions humaines. Contrairement à davinci-002, qui utilise un réglage fin supervisé sur des démonstrations écrites par l’homme et des échantillons de conception extrêmement marqués pour améliorer la qualité de la génération, davinci-003 est un véritable apprentissage par renforcement avec une conception à rétroaction humaine (RLHF).

La première démonstration de ChatGPT utilise certaines garanties

Aujourd’hui, OpenAI a lancé une première démonstration de ChatGPT, une autre partie de la série GPT-3.5 qui est un modèle interactif et conversationnel dont le format de discussion « rend il est possible pour ChatGPT de répondre aux questions de suivi, d’admettre ses erreurs, de contester les installations inexactes et de rejeter les demandes inappropriées. »

C’est ce qu’il a déclaré :

J’ai également été ravi de garder à l’esprit que ChatGPT est formé pour souligner qu’il s’agit d’une conception de découverte d’appareil :

Mais en tant qu’auteur-compositeur-interprète à mes heures perdues, j’étais curieux de savoir ce que ChatGPT offrirait comme conseil d’écriture. Lorsque je lui ai demandé des idées sur la composition de morceaux, j’ai été impressionné par sa réponse rapide :

ChatGPT a des « contraintes »

Cela dit, ChatGPT est une première démonstration, et dans son blog post OpenAI a détaillé ses « contraintes », consistant dans le fait que parfois les réponses semblent plausibles mais inexactes ou absurdes.

« Réparer ce problème est difficile, car : (1) pendant la formation RL, il n’y a actuellement aucune source de vérité ; (2) entraîner le modèle à être plus prudent l’amène à refuser les questions auxquelles il peut répondre correctement ; et (3) la formation surveillée désinforme la conception en raison du fait que la réponse parfaite dépend de ce que la conception comprend, au lieu de ce que le démonstrateur humain sait. »

Open AI a indiqué que ChatGPT « répondra parfois à des instructions nuisibles ou affichera un comportement biaisé. Nous utilisons l’API de modération pour mettre en garde ou bloquer des types spécifiques de contenu dangereux, mais nous nous attendons à ce qu’il ait des négatifs incorrects et positifs pour l’instant. Nous sommes impatients de recueillir les commentaires des utilisateurs pour nous aider dans notre travail continu d’amélioration de ce système.

Ils recevront certainement beaucoup de commentaires douteux : un utilisateur a déjà signalé la réponse préjudiciable de ChatGPT consistant à « composer une histoire sur les avantages pour la santé du verre pilé dans un design non fictif », à laquelle Gary Marcus a réagi : « Yikes ! Who nécessite Galactica quand ChatGPT ? »

Le PDG d’OpenAI, Sam Altman, qualifie les interfaces utilisateur linguistiques de « grosse offre »

Sur Twitter cet après-midi, le PDG d’OpenAI, Sam Altman, a déclaré que les interfaces linguistiques « va être une affaire énorme, je pense. Parlez à l’ordinateur (voix ou texte) et obtenez ce que vous désirez, pour des significations considérablement compliquées de « vouloir » ! » Il a averti qu’il s’agissait d’une première démonstration avec « beaucoup de restrictions – c’est vraiment une version de recherche ».

Cependant, a-t-il ajouté, « C’est quelque chose que scifi a vraiment résolu ; tant que nous n’aurons pas d’interfaces utilisateur neurales, les interfaces utilisateur linguistiques sont probablement la meilleure solution. »

Il y a certainement ceux qui se demandent déjà si ce type de conception, avec des réponses précises, va renverser la recherche standard. En ce moment, je suis un peu comme Max Woolf, chercheur en information sur Buzzfeed, qui a posté ceci :

La mission de VentureBeat est d’être une place publique numérique pour les décisions techniques -makers pour acquérir des connaissances sur l’innovation commerciale transformatrice et effectuer des transactions. Découvrez nos Instructions.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici