jeudi, 28 mars 2024

Le rival d’OpenAI, Cohere AI, est passé sous le radar. Cela est peut-être sur le point de changer.

Aidan Gomez, co-fondateur et PDG de Cohere AI, avoue que l’entreprise, qui offre aux concepteurs et aux services l’accès au traitement du langage naturel (TAL) alimenté par de grands modèles de langage (LLM), est « folle sous le radar. »

Offrir la qualité des conceptions de structure de l’entreprise, qui, selon beaucoup, sont en concurrence avec les meilleurs de Google, OpenAI et autres, cela ne devrait pas être le cas, a-t-il informé VentureBeat.

C’est peut-être parce que l’entreprise ne lance pas de démonstrations client accrocheuses comme le ChatGPT d’OpenAI. Cependant, Cohere, souligne-t-il, s’est en fait « directement concentré sur l’entreprise et sur la manière dont nous pouvons y ajouter de la valeur ».

Cohere apparemment en pourparlers pour un tout nouveau financement

En tout cas, la société torontoise Cohere, fondée en 2019 par Gomez, Ivan Zhang et Nick Frosst, pourrait ne pas passer inaperçue pour longtemps.

Reuters a rapporté mardi que Cohere était toujours en pourparlers pour lever des centaines de dollars lors d’un tour de financement qui pourrait valoriser la start-up à plus de 6 milliards de dollars, dans « le dernier signe de la frénésie des investissements financiers autour de l’IA générative ». Et en octobre 2022, le Wall Street Journal a rapporté que Cohere aurait en fait été en pourparlers avec et Nvidia au sujet d’un éventuel investissement.

Bien que Cohere n’ait pas parlé des rumeurs de financement, un vote de confiance pour l’entreprise est l’arrivée récente de Martin Kon, ancien chef des finances de YouTube, qui s’est engagé en tant que président et chef de l’exploitation en décembre .

Kon a déclaré qu’il était impressionné non seulement par l’expertise approfondie des co-fondateurs de Cohere, mais aussi par leur concentration sur la conception de grands modèles de langage adaptés aux concepteurs et aux entreprises.

« J’ai vu cette prochaine vague de perturbations et de changements et c’était tout simplement incroyable », a-t-il déclaré. « Cependant en pensant aux designers, au business et en résolvant de vrais problèmes business, c’est là que j’ai dit : ‘Je pense que je peux apporter quelque chose ici.' »

Selon son site, la plateforme Cohere peut être utilisée » pour générer ou examiner du texte pour faire des choses comme composer une copie, modérer du matériel, classer des informations et extraire des informations, le tout à grande échelle. » Il est facilement disponible via l’API en tant que service géré, via des plates-formes cloud ML telles qu’Amazon Sagemaker et VertexAI, et pour les clients professionnels ayant les exigences les plus élevées en matière de protection des données et de latence, des implémentations LLM privées sur VPC ou peut-être sur site.

« Nous travaillons directement avec les concepteurs et les entreprises pour établir ou utiliser les applications qui les aideront à résoudre les problèmes de service », a déclaré Kon. Par exemple, « Nous travaillons actuellement avec une plate-forme de streaming audio mondiale pour utiliser la recherche sémantique multilingue afin de permettre une bien meilleure exploration des podcasts – et nous traitons avec des entreprises comme Jasper et HyperWrite qui construisent des applications en plus de celles-ci capacités. »

Cohere fondée par le co-auteur de l’article Transformer

En 2017, Gomez et un groupe de collègues de Brain, qui avaient co-écrit l’article l’article original de Transformer, intitulé « Attention si tout ce dont vous avez besoin », ont été irrités.

L’équipe avait avancé avec Transformers – une percée en PNL de réseau neuronal qui enregistrait le contexte et la signification des mots plus précisément que ses prédécesseurs, le réseau neuronal persistant et le réseau de mémoire à court terme. L’architecture Transformer est devenue le fondement de grandes conceptions de langage comme GPT-3 et ChatGPT, mais également d’applications non linguistiques comprenant le Codex d’OpenAI et AlphaFold de Deep Mind.

« Nous l’avons initialement développé pour  Traduction, mais il a ensuite été adopté dans la recherche, Gmail, YouTube », a déclaré Gomez. « Donc, cela a en quelque sorte balayé les domaines de produits d’Alphabet, de manière presque cohérente. Cela a entraîné des modifications vraiment extraordinaires au sein de Google. »

Mais alors que Gomez a constaté une adoption substantielle de Transformers au sein de Google, il n’y a pas eu beaucoup d’adoption au-delà. « Il y avait des manifestations folles à l’intérieur, mais rien ne changeait à l’extérieur », a-t-il déclaré. « Aucune des installations nécessaires à sa mise en production n’a été construite, adoptée ou envisagée – personne ne comprenait réellement les modèles de langage ou comment les rendre bénéfiques, et c’était avant GPT-3. Nous devenions simplement si anxieux — vous êtes en personne avec quelque chose de remarquable et personne d’autre ne le voit. »

Les ressources informatiques et les compétences en IA/ML étaient des obstacles à l’adoption

En conséquence, plusieurs co-auteurs de Transformer ont décidé de quitter et de fonder leurs propres start-up. Par exemple, Noam Shazeer a créé Character.ai, Niki Parmar et Ashish Vaswani ont créé Adept AI, y compris Gomez.

« Nous avons juste décidé que nous devions faire notre propre truc », a déclaré Gomez. « Nous avons estimé qu’il y avait des obstacles fondamentaux empêchant les entreprises et les jeunes développeurs et créateurs de start-up [d’adopter la PNL] et il doit y avoir une méthode pour faire tomber ces obstacles. »

Parmi les obstacles les plus importants pour les entreprises qui souhaitent construire des produits utilisant la PNL à grande échelle, a expliqué Gomez, il y avait les ressources informatiques.

« Pour construire ces conceptions, vous avez besoin de superordinateurs avec des milliers de GPU », a-t-il déclaré. « Et il n’y a pas beaucoup de supercalculateurs dans le monde, donc ce n’est pas comme si tout le monde le faisait en interne. »

De plus, la compétence en IA et en ML pour créer ces conceptions est exceptionnellement rare et compétitive. « Nous voulions produire un élément qui supprime ces deux barrières », a-t-il ajouté. « Nous voulions prendre quelque chose de vraiment difficile que seuls les spécialistes parce que le domaine sait comment faire et créer une interface dessus qui permet à chaque développeur d’aller construire avec lui. »

Cohere n’est pas lié à un seul cloud

L’un des arguments de vente de Cohere est qu’il n’est pas lié à un seul cloud, a souligné Gomez. « Nous sommes pas verrouillé dans Azure », a-t-il déclaré, faisant référence à la relation d’OpenAI avec Microsoft. « Nous avons une relation avec et avons accès à leurs pods TPU de superordinateur, et nous avons également récemment révélé une collaboration avec AWS. »

Cela signifie que les clients peuvent se déployer dans le cloud de leur choix et même sur site. « Si vous souhaitez bénéficier d’une latence incroyablement faible, ou si vous ne souhaitez pas que nous ayons accès à vos données de consommation, car il s’agit de quelque chose de très délicat, nous pouvons vous aider. d’une manière que personne d’autre ne peut », a-t-il dit. « Personne d’autre ne fournit cela, pas avec la conception ns que nous avons à la qualité que nous avons. »

Grâce au succès fulgurant de ChatGPT, Gomez a déclaré qu’éduquer les gens sur la puissance des LLM a fini par être beaucoup plus facile. « La plupart de mon temps a été investi dans l’éducation des gens, mais cela a totalement changé », a-t-il déclaré. « Maintenant, les gens nous concernent et disent, bonjour, nous avons vu cela, nous voulons vraiment construire cela. »

Lorsqu’une nouvelle technologie émerge, a-t-il décrit, au début, elle a tendance à être uniquement une question d’éducation, puis elle devient une connaissance typique et tout est une question de mise en œuvre ou de production. « Je crois qu’au cours des deux derniers mois, nous venons de passer à la mise en œuvre », a-t-il déclaré.

En particulier, Gomez a déclaré qu’il pensait que l’assistance aux connaissances était un cas d’utilisation émergent important pour les services d’entreprise. « Le copywriting a été l’un des premiers produits et l’un des premiers à s’adapter au marché, comme Jasper, mais maintenant il commence à se répandre beaucoup plus », a-t-il expliqué. « Nous commençons à voir des choses comme la synthèse. Nous commençons à voir de grandes entreprises dire bonjour, j’en ai vraiment besoin. Je pense qu’avoir une méthode beaucoup plus naturelle et efficace pour découvrir des informations spécifiques à votre organisation ou à vous est sur le point de être déverrouillé. »

Une apparition chez Google – et à venir

L’article Transformer a été un grand succès pour ses co-auteurs de Google, qui ont eu la première idée de ce qui bouillait le brochet lorsque il s’agit de grandes conceptions de langage.

A déclaré Gomez, chacun des amis a une vision différente de ce qu’ils veulent construire.

« Nous résolvons chacun une couche différente de la pile », a-t-il déclaré. « Certaines personnes sont au niveau de l’application, créant des chatbots agréables avec qui parler. Je suis au niveau fondamental où nous voulons développer l’infrastructure et la plate-forme sur lesquelles tout le monde peut construire, et il y a des individus tout le chemin entre les deux. Je crois que nous avons chacun une vision différente de ce à quoi nous sommes le plus ravis de contribuer, mais tout cela est très complémentaire. »

En ce qui concerne Google, Gomez a déclaré qu’il était « très ravi » de la prochaine génération d’articles de son ancien employeur, qui comprend le Bard récemment annoncé.

« Ils ont en fait l’air de remonter leurs chaussettes et de plonger dans la production d’IA », a-t-il déclaré. « Il semble qu’il y ait eu un revirement général. »

Et sans remarquer la similitude avec ses propres objectifs pour Cohere, il a ajouté : « C’est vraiment incroyable pour le monde, cela suggère que ces choses vont être là-bas dans les applications, changer les choses et fournir de la valeur.  »

L’objectif de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques de comprendre la technologie d’entreprise transformatrice et d’effectuer des transactions. Découvrez nos Rundowns.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici