La mise à disposition d’une conception de base pour l’IA générative n’est qu’un début, et non un service complet, pour répondre aux exigences complexes des cas d’utilisation en entreprise.
Aujourd’hui, Amazon Web constitue un grand pas en avant. Services (AWS) a annoncé la disponibilité générale de son service Amazon Bedrock, un outil important pour répondre aux exigences des applications métiers en matière d’IA générative.
AWS a initialement introduit Amazon Bedrock en avril en tant que service de prévisualisation, proposant une série de conceptions de structures en tant que service sur sa plate-forme cloud. L’aperçu a par conséquent été élargi en juillet avec l’ajout de modèles supplémentaires, composés des modèles Anthropic Claude 2 et Stability AI SDXL 1.0. Désormais facilement proposé, Amazon Bedrock prend en charge une variété de modèles, notamment les propres Amazon Titan Embeddings de l’entreprise.
La transition d’un service vers une disponibilité de base sur AWS n’est pas un choix pris à la légère ; il s’agit plutôt de l’aboutissement d’une sélection ardue et d’améliorations ultérieures, éclairées par les commentaires préliminaires des utilisateurs.
Occasion
AI Unleashed
Une soirée unique sur invitation uniquement informations et mise en réseau, créé pour les cadres supérieurs d’entreprise supervisant les piles de données et les techniques.
En savoir plus »C’est
un processus régulier pour nous
publier quelque chose en avant-première, en testant soigneusement avec quelques consommateurs pour obtenir des commentaires et ce sont des interactions très profondes, nous ne voulons donc pas commencer par un « Nous avons un groupe qui doit se connecter avec ces clients pour vraiment comprendre où nous pourrions faire beaucoup mieux et quelles autres choses nous pourrions être passer à côté. » Comment Amazon Bedrock s’est amélioré pour devenir une entreprise prête pour GA Le chemin vers le calendrier général concerne la fiabilité et le renforcement, de sorte que le service soit prêt à être produit pour le travail d’entreprise. Parmi les nombreuses choses qu’AWS a améliorées dans Amazon Bedrock pour permettre aux entreprises de le faire, il y a l’ajout de la conformité aux politiques. L’une de ces politiques avec laquelle le service est désormais certifié selon Philomin est le RGPD (Directive générale sur la sécurité des données) de l’Union européenne. » Nous parlons de clients professionnels et ils doivent se conformer au RGPD et cela nécessite beaucoup de travail et nous avons effectivement fait tout cela », a-t-il déclaré. Dans le cadre de la conformité, les entreprises ont généralement également besoin de capacités d’observabilité et d’audit. À cette fin, Amazon Bedrock, en tant que service habituellement proposé, s’intègre également désormais au service Amazon CloudWatch pour la journalisation. Le contrôle des dépenses est un autre élément essentiel pour que tout service soit prêt à être utilisé à grande échelle par l’entreprise. De nombreuses entreprises disposent de services comptables et de plans budgétaires qui doivent être appréciés. Le débit de fourniture est une fonctionnalité annoncée par AWS pour Amazon Bedrock dans le cadre des mises à jour d’aujourd’hui. Il permet aux clients de dépenser pour une quantité définie de débit à partir d’une conception d’IA générative, garantissant ainsi des défenses en matière de coûts et des niveaux d’efficacité. Grâce au débit de l’arrangement, les clients peuvent définir le nombre de « systèmes modèles » ou de jetons dont ils ont besoin, évitant ainsi les problèmes de limitation en cas de pics de besoins. Philomin a noté que la fonctionnalité de débit de l’arrangement offre aux consommateurs des plafonds de dépenses garantis et un débit garanti pour leurs applications, ce qui est nécessaire pour véritablement adopter ces technologies à grande échelle dans un environnement d’entreprise. Les intégrations Amazon Titan apportent une toute nouvelle puissance à la précision de l’IA générative. Aujourd’hui, un élément crucial de l’accessibilité de base est la conception d’Amazon Titan Embeddings, qu’AWS a développé lui-même. Amazon Titan Embeddings fonctionne pour la génération augmentée de récupération (RAG) et utilise des cas, ce qui contribue à améliorer considérablement la précision de l’IA générative. Il fonctionne en prenant des mots en entrée et en les convertissant en représentations vectorielles mathématiques appelées intégrations. Cela lui permet de décomposer les fichiers et les questions dans un espace d’intégration, améliorant ainsi la précision lors de la récupération des fragments de fichiers appropriés à utiliser comme réponses. Philomin a commenté que lorsque Amazon Titan Embeddings a été initialement proposé en avant-première, le groupe préliminaire d’utilisateurs a reçu de nombreux commentaires. Parmi les choses qu’ils ont demandées figurait une fenêtre de jeton plus grande, pour permettre au modèle de gérer des fichiers plus volumineux. Ce changement se reflète désormais dans le service normalement disponible,
afin de garantir qu’il puisse répondre aux exigences de l’entreprise. Les intégrations Amazon Titan sont également utilisées en combinaison avec d’autres conceptions en grand langage (LLM) sur Amazon Bedrock. Philomin a noté que les intégrations Amazon Titan sont utilisées par certains clients en combinaison avec la conception Claude2 d’Anthropic pour créer des chatbots dont la compréhension est enregistrée en externe sous forme de fichiers. La conception d’intégration Titan intègre les documents dans un espace vectoriel, tandis que Claude2 est utilisé pour les capacités conversationnelles. Cela permet au chatbot de récupérer des fragments de compréhension pertinents à partir des documents intégrés pour répondre aux questions, sans avoir besoin de réentraîner les modèles de langage à mesure que les sources de connaissances évoluent. CodeWhisperer présente de nouvelles fonctionnalités Parallèlement à l’accessibilité générale d’Amazon Bedrock, AWS a également annoncé aujourd’hui un aperçu de nouvelles fonctionnalités pour le service d’IA générative d’Amazon CodeWhisperer. Les toutes nouvelles capacités permettent désormais aux utilisateurs d’entreprise de tirer parti des référentiels de code personnels d’une organisation de manière sûre et sécurisée. « Cela débloque de tout nouveaux niveaux de productivité des développeurs », a déclaré Philomin.
« Les assistants de codage généraux constituent généralement leur fonction générale ; ils comprennent comment écrire du code normalement, mais ils ne comprendraient rien à votre code interne, car ils n’ont jamais eu la chance d’en tirer profit.
. »La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur les technologies d’entreprise transformatrices et d’effectuer des transactions.
Découvrez nos briefings.
Toute l’actualité en temps réel, est sur L’Entrepreneur