Les nuits tardives avec un nouveau-né peuvent entraîner des développements inattendus. Tel a été le cas de Josh Bickett, développeur d’OthersideAI, qui a eu l’idée d’un tout nouveau « cadre de système informatique autonome » révolutionnaire tout en nourrissant sa fille au milieu de la nuit.
??????????????? ????-????????? ????-????????????????????????????????????????????? ?????????,????????? ?-?-?????????????????? ??????-????????? … pic.twitter.com/8DyQRBsWUQ
— Josh Bickett (@josh_bickett) 27 novembre 2023
Comme Bickett l’a expliqué à VentureBeat, « J’ai vraiment apprécié le temps passé avec ma fille, qui a maintenant quatre semaines, et j’ai reçu de nombreuses nouvelles leçons de paternité et tout le reste. J’ai aussi eu un peu de temps, et cette idée m’a en quelque sorte m’est venu depuis que j’ai vu diverses démonstrations de la vision GPT-4. Ce sur quoi nous travaillons actuellement peut en fait se produire avec la vision GPT-4.
Avec son enfant niché dans un bras, Bickett a élaboré une stratégie pour la structure de base sur son ordinateur. « Je viens de découvrir une première application… elle n’est pas extrêmement efficace pour cliquer correctement avec la souris. Cependant, ce que nous faisons, c’est préciser le problème : nous devons comprendre comment faire fonctionner un système informatique. »
Lorsque Matt Shumer, co-fondateur et PDG d’AutresideAI, a vu le nouveau cadre, il a reconnu son potentiel important. Comme Shumer l’a déclaré à VentureBeat, « Il s’agit d’une étape importante sur la voie menant à l’équivalent d’une automobile autonome, mais pour un ordinateur. Nous avons maintenant les unités de détection. Nous avons les systèmes LIDAR. Ensuite, nous construisons l’intelligence. »
VB Occasion
Le AI Impact Trip
Entrez en contact avec le quartier des affaires de l’IA lors de l’AI Impact Tour de VentureBeat qui se déroulera dans une ville près de chez vous !
En savoir plus Une IA
qui choisit
où et sur quoi cliquer sur votre PC Comme l’a décrit Bickett, le framework « permet à l’IA de contrôler à la fois la souris là où elle clique et tout le clavier s’active essentiellement. Il ressemble à un agent comme autoGPT, sauf qu’il n’est pas basé sur du texte. Il est basé sur la vision, donc il faut une capture d’écran du système informatique, puis il décide des clics de souris et des claviers, exactement comme le ferait un individu. Shumer a expliqué comment cette structure
représente une avancée significative par rapport aux techniques précédentes qui reposaient exclusivement sur les API. « Beaucoup de choses que les gens font sur les systèmes informatiques, c’est vrai, on ne peut pas vraiment en finir avec les API, et c’est ainsi que beaucoup d’autres personnes abordent ce problème, [quand] ils souhaitent construire un agent. Ils l’ont construit au-dessus des API librement disponibles pour ce service, mais cela n’englobe rien. » Comme l’a affirmé Shumer, » Si vous souhaitez vraiment réparer quelque chose qui est autonome [et] peut réellement aider » Nous ou faire plus. Vous devez lui permettre de fonctionner comme une personne puisque le monde est construit pour les individus. » La structure prend des captures d’écran en entrée et génère des clics de souris et des commandes
clavier, tout comme le ferait un humain. Mais comme Bickett et Shumer l’ont reconnu, la véritable perspective ne réside pas dans la structure légère elle-même, mais dans la vision avancée du système informatique et les modèles de pensée qui peuvent y être connectés. branchez un meilleur modèle et cela s’améliore », a déclaré Bickett. Comment les représentants de l’IA modifieront l’informatique telle que nous la connaissons Interrogé par VentureBeat sur les implications futures, Shumer a brossé une vision vibrante : « Une fois que cette chose aura suffisamment de réputation, ce sera votre ordinateur, ce sera sera votre interface avec le monde numérique. « Avec la structure du système informatique autonome en place, les conceptions avancées d’IA pourraient apprendre à prendre le contrôle de toutes les interactions du système informatique
par le simple biais de commandes conversationnelles. Comme Shumer l’avait prédit, divers types de conceptions informatiques représentatives spécialisées apparaîtront probablement pour gérer diverses tâches.
Certains pourraient se concentrer sur la vitesse pour des tâches plus faciles, tandis que d’autres excellent dans la réflexion complexe. Les modèles peuvent également différer selon les cas d’utilisation de l’entreprise et du client. L’objectif primordial, selon Shumer, est de développer des représentants qui permettent un monde « où les gens peuvent dire, c’est ce que je déteste faire. Maintenant, je n’ai plus besoin de le faire. Et nous voulons que cela soit si foutu ». simple, que quelqu’un qui sait à peine utiliser un système informatique dès le départ peut le faire. « L’open source pour alimenter le développement. Bickett pense que la nature open source de la structure accélérera encore plus le progrès, permettant ainsi aux développeurs du monde entier de
expérimenter de nouvelles applications.
Shumer a reconnu qu’il y avait « de la place pour de nombreux acteurs dans ce domaine… une série de fournisseurs de conception. Une série d’applications. Et il y aura de nombreux espaces sur ce marché pour développer réellement des industries. « Bien que Bickett et Shumer voient un énorme potentiel, reconnaître la vision d’agents informatiques véritablement intelligents nécessitera d’énormes ressources et un développement continu. À cette fin, l’IA La société de recherche Imbue, anciennement appelée General Smart, a récemment conclu une collaboration de 150 millions de dollars avec Dell pour construire une plate-forme de formation en IA efficace. Le cluster massif d’environ 10 000 GPU Nvidia H100 permettra à Imbue d’établir de nouvelles conceptions de base optimisées. En particulier pour les capacités de raisonnement, un objectif clé de leur travail. Comme l’a souligné Kanjun Qiu, co-fondateur et PDG d’Imbue,
« Le raisonnement est le principal obstacle aux représentants qui fonctionnent réellement bien. »Imbue pense qu’un raisonnement solide est essentiel. pour développer des agents d’IA vraiment efficaces, car ils permettent aux créateurs de gérer l’imprévisibilité, d’adapter les techniques, de collecter de nouvelles informations, de prendre des décisions complexes et de faire face aux complexités du monde réel – des capacités cruciales pour travailler de manière autonome au-delà de tâches restreintes. La société adopte une méthodologie « full stack » comprenant une formation améliorée en conception de structures, un prototypage expérimental d’agents et d’interfaces, une construction d’outils robustes et une recherche théorique sur l’IA – dans le but de faire progresser à la fois la compréhension utile et fondamentale de l’apprentissage profond
dans le but de l’ingénierie de l’IA efficace dans la pensée au niveau humain et l’intelligence générale synthétique ultime. Bien que le système informatique autonome ne soit qu’une première étape, Bickett et Shumer y voient l’introduction d’une toute nouvelle ère dans laquelle des représentants sophistiqués de l’IA remplaceront complètement les interfaces informatiques humaines. Les nuits tardives peuvent continuer à donner lieu à des idées qui changent de paradigme, mais il faudra un travail ciblé pour reconnaître la vision complète des systèmes informatiques qui fonctionnent – pour n’importe qui, n’importe où – grâce au seul langage ordinaire. L’objectif de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur l’innovation et les transactions commerciales transformatrices. Découvrez nos Consignes..
Toute l’actualité en temps réel, est sur L’Entrepreneur