mardi, 5 décembre 2023

Rockset renforce les capacités de l’IA pour la recherche dans les bases de données vectorielles

Le fournisseur de bases de données en temps réel Rockset élargit les capacités d’IA de sa base de données de noms avec une recherche vectorielle et une évolutivité améliorées.

Les racines fondatrices de Rockset se trouvent dans l’origine du magasin de valeurs-clés open source RocksDB créé à Meta (anciennement Facebook) et une évolution de cette technologie contribuent à activer les capacités d’indexation en temps réel de Rockset. L’entreprise a levé un total de 105 millions de dollars de financement, dont un tour de table de 44 millions de dollars annoncé en août.

Avec la nouvelle mise à jour, Rockset s’enfonce davantage dans le monde de l’IA générative, avec l’accessibilité de base (GA) de la recherche vectorielle dans le cadre du plateforme de base de données en temps réel. La capacité de recherche vectorielle a été présentée pour la première fois en avril et a été élargie et améliorée au cours des derniers mois pour atteindre désormais son calendrier complet. La technologie a déjà connu un succès précoce, avec l’avion de ligne à tarif réduit JetBlue parmi les premiers à l’adopter qui ont offert un aperçu de leur utilisation de Rockset. Parallèlement à la mise à jour de la recherche vectorielle, Rockset présente également l’intégration avec l’outil LangChain couramment utilisé pour l’orchestration de l’IA et l’outil de cadre d’information LlamaIndex.

« Notre assistance pour la recherche vectorielle passe au GA et devient extrêmement avancée, maintenant. vous avez la possibilité de construire des indices de ressemblance en utilisant le voisin le plus proche (ANN) », a déclaré Venkat Venkataramani, co-fondateur et PDG de Rockset, à VentureBeat. « Vous pouvez le faire à grande échelle tout en bénéficiant de mises à jour en temps réel de vos représentations vectorielles et de vos métadonnées. »

VB Occasion

La tournée AI Impact

Entrez en contact avec la communauté de l’IA des entreprises lors du AI Impact Tour de VentureBeat qui se déroulera dans une ville près de chez vous !

Découvrez davantage Comment est Rockset

apportant indexation en temps réel vers la recherche vectorielle Le marché des capacités de recherche vectorielle est devenu extrêmement compétitif en 2023

. Les vecteurs, qui sont des représentations numériques des données, jouent un rôle essentiel dans le maintien des grands modèles linguistiques (LLM). Une variété de bases de données vectorielles spécialisées, telles que Pinecone et Milvus, ont en fait vu le jour, s’ajoutant à la gamme élargie d’innovations de bases de données existantes telles que DataStax, MongoDB et Neo4j qui facilitent désormais l’utilisation des intégrations vectorielles. Rockset s’est positionné comme une base de données en temps réel et c’est là qu’il vise également à se démarquer

avec la recherche vectorielle. Venkataramani a déclaré qu’à mesure que de nouvelles informations entrent dans une base de données Rockset, l’index de la base de données et les intégrations vectorielles sont mis à niveau en temps réel, dans des latences à un chiffre en millisecondes. Rockset a une approche que la société décrit comme une séparation calcul-calcul dans laquelle les ressources de calcul utilisées pour construire les index sont séparées des ressources utilisées pour les questions permettant l’indexation des informations en temps réel et l’efficacité des questions. « Avec pratiquement toutes les autres bases de données vectorielles que vous ne pouvez pas mettre à jour en temps réel, vous devez reconstruire votre index de temps en temps », a déclaré Venkataramani. Accélération de la recherche de ressemblance vectorielle ANN Il existe différentes manières d’autoriser la recherche vectorielle, comprenant à la fois la technique du voisin le plus proche (ANN) et la technique plus précise du voisin le plus proche K (KNN). Venkataramani a expliqué que même si ANN fournit une recherche approximative du voisin voisin, KNN trouve précisément les 10 ou 20 résultats les plus similaires, mais cela peut être très coûteux en termes de calcul, en particulier pour les grands ensembles de données avec des milliards de vecteurs. . ANN, en revanche, renvoie des résultats suffisamment proches, mais pas toujours les meilleures correspondances précises. Rockset utilise à la fois KNN et ANN en fonction de la requête et des informations. Les questions SQL de Rockset permettent de combiner la recherche vectorielle avec d’autres filtres de métadonnées. L’optimiseur de requêtes de Rockset choisit d’utiliser KNN ou ANN sous le capot en fonction

de la requête et des données pour offrir les résultats les plus rapides. Étant donné que les mises à jour en temps réel des intégrations vectorielles sont fondamentales pour Rockset, les index ANN affichent les informations les plus récentes en quelques millisecondes. Pourquoi les bases de données vectorielles ne vont pas disparaître de sitôt. Lors de la journée de développement d’OpenAI plus tôt ce mois-ci, OpenAI a annoncé une série de nouveaux services qui ont interféré avec le marché global de l’IA générative. Avec l’API de construction de maisons et d’assistants OpenAI GPT en particulier, il y a eu des discussions sur le marché sur pourquoi et si les technologies de bases de données vectorielles seraient toujours nécessaires. À certains égards, les nouveaux efforts d’OpenAI ont en fait éliminé la nécessité pour une entreprise de disposer d’une base de données vectorielles pour prendre en charge les applications d’IA. Venkataramani n’est pas trop préoccupé par les nouvelles du jour de développement d’OpenAI. Selon lui, les développements d’OpenAI auront le plus d’effet sur les chatbots fondamentaux, et non sur les applications commerciales plus importantes et les cas d’utilisation de la génération AI.  » Vous avez toujours de très grandes entreprises ayant de nombreuses exigences de sécurité et de conformité qu’elles ne peuvent pas simplement envoyer

toutes leurs données à une société tierce pour développer leurs chatbots », a-t-il déclaré. Venkataraman ne prévoit pas que les besoins en capacités de bases de données vectorielles diminueront pour les ensembles de données énormes et complexes qui contribueront à alimenter la génération augmentée de récupération (RAG). Il a également noté qu’il existe également des cas d’utilisation au-delà des chatbots, par exemple en permettant une recherche de similarité à grande échelle. « Je ne pense pas que les bases de données vectorielles vont nulle part, mais je pense que les cas d’utilisation évoluent », a déclaré Venkataraman. pour chaque cas d’utilisation, où un certain type d’application d’IA est en cours de construction, vous avez toujours besoin d’un bourreau de travail dans les coulisses. « L’objectif de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir une compréhension de la technologie commerciale transformatrice et de négocier. Découvrez nos aperçus..

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici