jeudi, 6 octobre 2022

Snowflake fait appel à Python pour s’attaquer à Teradata, BigQuery et Amazon Redshift

L’entreprise d’entrepôt d’informations basée sur le cloud Snowflake, lors de son Snowflake Top annuel, a présenté mardi un tout nouvel ensemble d’outils et de combinaisons pour affronter des sociétés d’analyse et de bases de données concurrentes telles que Teradata, et des services tels que BigQuery, et Amazon Redshift.

Les nouvelles capacités, qui incluent des outils d’accès aux informations et une assistance pour Python sur le système d’avancement d’applications Snowpark de l’entreprise, sont destinées aux chercheurs de données, aux ingénieurs de données et aux concepteurs, dans le but d’accélérer l’application développement, en particulier pour les programmes d’apprentissage automatique.

Snowpark, introduit il y a un an, est un environnement d’avancement de type dataframe créé pour permettre aux développeurs de publier leurs outils préférés sans serveur sur le moteur de calcul de l’entrepôt virtuel de Snowflake. La prise en charge de Python est en avant-première publique.

 » Python est probablement la capacité la plus demandée dont nous parlons avec nos consommateurs « , a déclaré Christian Kleinerman, vice-président senior des produits chez Snowflake.

Le besoin de Python est logique, car il s’agit d’un langage d’option pour les scientifiques des données, selon les experts.

 » Snowflake est en train de rattraper son retard sur ce front, car des rivaux tels que Teradata, BigQuery et Vertica bénéficient déjà de l’assistance Python « , a déclaré Doug Henschen, analyste principal chez Constellation Research.

Snowflake a également déclaré qu’il incluait une combinaison Streamlit pour l’avancement et le modèle d’application. Streamlit, qui est une structure d’application open source en Python destinée aux groupes d’intelligence artificielle et d’ingénierie des sciences de l’information pour aider à visualiser, modifier et partager des informations, a été acquise par Snowflake en mars.

La combinaison permettra aux utilisateurs de rester dans l’environnement Snowflake, non seulement pour accéder aux données, les sécuriser et les gouverner, mais aussi pour développer des applications de science des données pour concevoir et examiner les informations, a déclaré Tony Baer, ​​analyste principal chez dbInsights.

Snowflake présente des intégrations liées à Python

Certains des autres outils et intégrations liés à Python dévoilés lors du sommet incluent Snowflake Worksheets for Python, Large Memory Storage Facilities et SQL Intelligence artificielle.

Snowflake Worksheets for Python, qui est en avant-première privée, est conçu pour permettre aux entreprises d’établir des pipelines, des modèles d’intelligence artificielle et des applications au moyen de l’interface Web de l’entreprise, baptisée Snowsight, a déclaré la société, ajoutant qu’elle dispose de capacités telles que la saisie semi-automatique du code et la génération de logique personnalisée.

Afin d’aider les scientifiques de l’information et les équipes de développement à effectuer des opérations gourmandes en mémoire telles que l’ingénierie des fonctions et la formation à la conception sur des informations volumineuses ensembles, l’entreprise a déclaré qu’elle traitait avec une fonctionnalité appelée Large Memory Warehouses.

Actuellement au stade de l’avancement, les installations de Big Memory Storage fourniront un support pour les bibliothèques Python grâce à la combinaison avec la plate-forme de science des données Anaconda, a déclaré Snowflake .

« De nombreux concurrents sont configurables pour prendre en charge les installations de stockage à grande mémoire ainsi que les fonctions Python et la prise en charge du langage, c’est donc Snowflake qui suit les besoins du marché », a déclaré Henschen.

Snowflake fournit également une intelligence artificielle SQL, en commençant par des informations de séries chronologiques, en préversion privée. Le service aidera les entreprises à intégrer des prédictions et des analyses basées sur l’apprentissage des appareils dans des applications et des tableaux de bord d’intelligence de service, a déclaré l’entreprise.

De nombreux fournisseurs de bases de données analytiques, selon Henschen, ont en fait construit des modèles d’intelligence artificielle pour exécution de la base de données.

 » La raison d’être de Snowflake, qui commence par l’analyse d’informations de séries chronologiques, est [qu’elle fait] partie des analyses d’intelligence artificielle les plus populaires, car il s’agit de prédire des valeurs futures basées sur des valeurs précédemment observées », Henschen dit, y compris que l’analyse de séries chronologiques a de nombreux cas d’utilisation dans le secteur financier.

Les mises à jour Snowflake permettent un accès plus important aux informations

Avec la logique autant un accès plus rapide aux données pourrait accélérer le développement d’applications, Snowflake a également introduit mardi de nouvelles fonctionnalités comprenant l’assistance aux données en continu, les tables Apache Iceberg dans Snowflake et les tables externes pour sur site ises stockage.

La prise en charge des données de streaming, qui reste en avant-première personnelle, aidera à supprimer les frontières entre les pipelines de streaming et de traitement par lots avec Snowpipe, le service de collecte de données en continu de l’entreprise.

Le La raison d’être du lancement de la fonctionnalité, selon Henschen, est le grand intérêt à prendre en charge des alternatives à faible latence, consistant en un streaming en temps quasi réel et réel, et la plupart des fournisseurs de ce marché ont coché la case du streaming.

 » La fonctionnalité offre aux équipes d’ingénierie un moyen intégré d’évaluer le flux parallèlement aux données historiques, afin que les ingénieurs de l’information n’aient pas à assembler eux-mêmes quelque chose. C’est un gain de temps », a déclaré Henschen.

Afin de répondre au besoin de plus de formats de table open source, la société a déclaré qu’elle développait Apache Iceberg Tables pour s’exécuter dans son environnement.

 » Apache Iceberg est un format de table open source extrêmement populaire et il gagne rapidement du terrain pour les plateformes de données analytiques. Les formats de tableau comme Iceberg offrent des métadonnées qui contribuent à la cohérence et à l’efficacité évolutive. Iceberg a également été récemment adopté par pour son offre Big Lake « , a déclaré Henschen.

Dans un effort pour maintenir l’engagement de ses consommateurs sur site tout en essayant de les amener à adopter sa plate-forme d’informations cloud, Snowflake est introduisant le stockage sur site de tables externes. Actuellement en avant-première privée, l’outil permet aux utilisateurs d’accéder à leurs données dans des systèmes de stockage sur site de sociétés composées de Dell Technologies et de Pure Storage, a déclaré la société.

 » Snowflake avait une politique « cloud uniquement » pendant un certain temps, donc ils avaient clairement de gros clients cruciaux qui voulaient une méthode pour apporter des informations sur site dans l’analyse sans tout déplacer dans Snowflake « , a déclaré Henschen.

Plus encore, Henschen a déclaré que des concurrents tels que Teradata, Vertica et Yellowbrick fournissent des versions sur site ainsi que des versions hybrides et multicloud.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici