vendredi, 29 mars 2024

Snowflake fait appel à Python pour affronter Teradata, BigQuery et AWS Redshift

Crédit : Dreamstime

Le fournisseur d’installations de stockage d’informations basé sur le cloud, Snowflake, a présenté une marque- nouvel ensemble d’outils et de combinaisons pour gérer des entreprises concurrentes telles que Teradata et des services tels que BigQuery et Amazon Redshift.

Révélé lors de son Sommet Snowflake annuel, le tout nouveau Les capacités, qui incluent des outils d’accès à l’information et la prise en charge de Python sur le système de développement d’applications Snowpark de l’entreprise, sont destinées aux chercheurs de données, aux ingénieurs de l’information et aux concepteurs dans le but d’accélérer leur parcours d’apprentissage automatique, accélérant ainsi le développement d’applications.

Snowpark, sorti il ​​y a un an, est un environnement de développement de style dataframe développé pour permettre aux développeurs de publier leurs outils préférés sans serveur sur le moteur de calcul de l’entrepôt virtuel de Snowflake. La prise en charge de Python reste en préversion publique.

 » Python est probablement la capacité la plus demandée avec laquelle nous parlons nos clients », a déclaré Christian Kleinerman, vice-président senior des articles chez Snowflake.

Le besoin de Python est logique, car il s’agit d’un langage d’option pour les chercheurs de données, selon les analystes.

 » Snowflake rattrape vraiment son retard sur ce front, car les concurrents comprenant Teradata, BigQuery et Vertica bénéficient actuellement de l’assistance Python « , a déclaré Doug Henschen, principal expert de l’étude Constellation Research.

Dans l’une des mises à jour annoncées en haut, la société a déclaré qu’elle ajoutait une combinaison Streamlit pour le développement et la version d’applications. Streamlit, qui est une structure d’application open source en Python destinée aux équipes d’intelligence artificielle et d’ingénierie des sciences de l’information pour aider à visualiser, modifier et partager des données, a été obtenue par Snowflake en mars.

La combinaison permettra aux utilisateurs de rester dans l’environnement Snowflake, non seulement pour accéder aux données, les protéger et les gouverner, mais aussi pour établir des applications de science de l’information pour concevoir et analyser des informations, a déclaré Tony Baer, ​​analyste principal chez dbInsights.

Snowflake lance des intégrations liées à Python

Certaines des autres intégrations liées à Python incluent Snowflake Worksheets for Python, Large Memory Warehouses et SQL Artificial Intelligence.

Snowflake Worksheets for Python , qui est en avant-première privée, est créé pour permettre aux entreprises d’établir des pipelines, des conceptions d’apprentissage automatique et des applications dans l’interface utilisateur Web de l’entreprise, appelée Snowsight, a déclaré la société, ajoutant qu’elle disposait de capacités telles que le code autoc génération de logique complète et personnalisée.

Afin d’aider les chercheurs de données et les équipes de développement à effectuer des opérations gourmandes en mémoire telles que l’ingénierie de fonctions et la formation de modèles sur de grands ensembles d’informations, la société a déclaré qu’elle traitait avec une fonction appelées installations de stockage de grande mémoire.

Actuellement en phase de développement, les installations de stockage de grande mémoire offriront un support pour les bibliothèques Python grâce à l’intégration avec la plate-forme de science des données Anaconda, incluse.

 » De nombreux les concurrents sont configurables pour prendre en charge les entrepôts à grande mémoire ainsi que les fonctions Python et l’assistance linguistique, c’est pourquoi Snowflake reste à jour avec les besoins du marché », a déclaré Henschen.

Snowflake utilise également SQL Machine Learning, commençant avec des informations de séries chronologiques, en avant-première privée. Le service aidera les entreprises à intégrer des prévisions et des analyses basées sur l’apprentissage des appareils dans les applications d’intelligence organisationnelle et les panneaux de contrôle, a déclaré l’entreprise.

De nombreux fournisseurs de bases de données analytiques, selon Henschen, ont construit des modèles d’intelligence artificielle pour – exécution de la base de données.

 » La raison d’être de Snowflake en commençant par l’analyse d’informations de séries chronologiques est [qu’il s’agit] de l’une des analyses d’apprentissage automatique les plus populaires, car il s’agit de prédire des valeurs futures basées sur des données précédemment observées. valeurs », a déclaré Henschen, ajoutant que l’analyse des séries chronologiques a de nombreux cas d’utilisation dans le secteur financier.

Les mises à jour Snowflake permettent d’accéder à davantage d’informations

Partant du principe qu’un accès plus rapide aux données pourrait entraîner une progression plus rapide des applications, Snowflake a également présenté de nouvelles fonctionnalités, notamment l’assistance aux données en continu, les tables Apache Iceberg dans Snowflake et les tables externes pour le stockage sur site.

S treaming Data Assistance, qui reste en préversion personnelle, aidera à supprimer les limites entre les pipelines de streaming et de traitement par lots avec Snowpipe Streaming. Snowpipe est le service d’ingestion de données en continu de l’entreprise.

Le raisonnement derrière le lancement de la fonctionnalité, selon Henschen, est le grand intérêt pour la prise en charge d’alternatives à faible latence, y compris le streaming en temps quasi réel et réel, et de nombreux les fournisseurs de ce marché ont en fait coché la case du streaming.

 » La fonction fournit aux équipes d’ingénierie un moyen intégré d’évaluer le flux avec les données historiques, afin que les ingénieurs de l’information n’aient pas à bricoler quelque chose C’est un gain de temps « , a déclaré Henschen.

Afin de rester à jour avec le besoin de plus de formats de table open source, l’entreprise a déclaré qu’elle développait Apache Iceberg Tables pour s’exécuter dans son environnement.

« Apache Iceberg est un format de tableau open source extrêmement populaire et il gagne rapidement du terrain pour les plates-formes de données analytiques. Les formats de tableau comme Iceberg fournissent des métadonnées qui contribuent à la cohérence et à l’efficacité évolutive. Iceberg a également été récemment adopté par pour son offre Big Lake « , a déclaré Henschen.

Dans un effort pour maintenir l’engagement de ses clients sur site tout en essayant de les amener à adopter sa plate-forme d’informations cloud, Snowflake présente le stockage sur site de tables externes. Actuellement en avant-première privée, l’outil permet aux utilisateurs d’accéder à leurs données dans des systèmes de stockage sur site d’entreprises composées de Dell Technologies et de Pure Storage, a déclaré la société.

 » Snowflake avait une politique « cloud uniquement » pendant un certain temps, ils avaient donc clairement de gros clients importants qui souhaitaient une méthode pour intégrer des informations sur site dans l’analyse sans tout déplacer dans Snowflake « , a déclaré Henschen.

Encore plus, Henschen a déclaré que les concurrents composés de Teradata, Vertica et Yellowbrick utilisent sur site en plus de la mise en œuvre hybride et multi-cloud.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici