mercredi, 17 avril 2024

Travailler avec Azure Managed Instance pour Cassandra

Créer des applications cloud natives à grande échelle nécessite de bien choisir sa pile. Un outil populaire est le travail Cassandra d’Apache, une base de données NoSQL créée pour évoluer rapidement sans affecter les performances des applications. C’est une plate-forme idéale pour traiter d’énormes informations, avec des outils de réduction de carte intégrés basés sur Hadoop, en plus de son propre langage de questions. Initialement développé sur Facebook, il a été utilisé au CERN, Netflix et Uber.

Azure a initialement proposé le support Cassandra via les offres de DataStax sur Azure Marketplace avant d’ajouter le support de l’API Cassandra à sa propre base de données Cosmos distribuée, ainsi que de fournir des conseils aux utilisateurs qui souhaitent créer et publier leurs propres systèmes Cassandra sur des machines virtuelles Azure. Il développe maintenant sa propre exécution Cassandra, avec une préversion publique d’un ensemble d’instances gérées de Cassandra, développées pour fonctionner avec Universe DB.

  • Apache Cassandra sur Azure
  • Premiers pas avec les instances gérées
  • Structurer des clusters hybrides dans des clouds hybrides
  • Utiliser Managed Cassandra avec d’autres services Azure

Apache Cassandra sur Azure

Cassandra est une base de données distribuée, avec chaque nœud connecté les uns aux autres au moyen de la procédure Chatter. Les nœuds fonctionnent sur plusieurs appareils, organisés en centre de données et publiés sous forme d’anneaux de nœuds. Tous les nœuds sont des pairs, donc si un nœud est perdu, le système peut continuer à fonctionner pendant qu’un remplacement commence. Les anneaux peuvent également être appairés avec d’autres anneaux, ce qui vous permet de faire en sorte que les systèmes sur site traitent des systèmes hébergés dans le cloud, ou une zone avec d’autres pour une force internationale. Des nœuds peuvent être ajoutés ou supprimés d’un anneau si nécessaire, en utilisant une mise à l’échelle linéaire. Pour doubler l’efficacité ou la capacité, il vous suffit de doubler la variété de nœuds.

L’instance gérée Azure de Microsoft pour Apache Cassandra est peut-être mieux considérée comme une méthode d’extension des données locales dans Universe DB. La base de données Cosmos sur site a été nécessaire car peu de temps après le lancement, mais son intégration profonde avec la plate-forme Azure rend difficile pour Microsoft de la séparer. En utilisant une combinaison entre son implémentation Azure et Universe DB, il est désormais possible d’établir un anneau Cassandra hébergé sur Azure et de l’appairer avec les installations et avec Cosmos DB. Vous pouvez désormais dupliquer les informations entre les installations et le cloud, en bénéficiant des capacités de Cosmos DB à exécuter des applications distribuées à l’échelle mondiale tout en travaillant avec les circonstances locales de Cassandra pour gérer les opérations d’informations réglementées dans votre propre centre d’information.

Il existe d’autres avantages à utiliser les instances gérées, car vous pouvez transférer une grande partie des opérations quotidiennes d’un anneau Cassandra vers Azure. Il fournira immédiatement des mises à niveau et des mises à jour, traitant des correctifs afin que votre base de données exécute en permanence la variante la plus sûre et la plus sécurisée de l’application logicielle. Avec moins de frais de gestion, vous pouvez vous concentrer sur la structure des applications au lieu de conserver votre pile.

Commencer avec les instances gérées

Il y a très peu de distinction entre l’établissement et l’exécution d’Apache d’Azure et l’un des ses autres bases de données open source gérées. Commencez par vous connecter au site Web Azure, puis recherchez des circonstances gérées pour Apache Cassandra afin de créer un cluster.

Vous devrez suivre la plupart des étapes pour ajouter un service Azure à un abonnement, y compris à un groupe de ressources et en choisissant un lieu. Dans le même temps, sélectionnez un nom et sélectionnez un type de machine virtuelle hôte. Dans l’aperçu actuel, vous êtes limité aux serveurs DS14_v2, connectés à quatre disques P30. Ce sont des systèmes basés sur Xeon plutôt efficaces, avec 16 vCPU, 112 Go de mémoire et un SSD de 224 Go. Il existe une assistance pour jusqu’à 64 disques d’informations et 8 cartes réseau, avec une bande passante de 12 000 Mbps. Attendez-vous à payer au moins 2,11 $ de l’heure par serveur, selon l’endroit où vous fournissez le service. Les disques P30 utilisent 1 To de stockage par disque et coûtent un minimum de 122,88 $ par mois (avec des frais supplémentaires pour les montages).

Exécuter Casandra dans Azure ne sera pas bon marché, mais alors ce n’est pas pour les petites applications. Vous allez déplacer une grande quantité d’informations autour de votre application, même si vous ne l’utilisez que comme une entrée à Cosmos DB.

L’action suivante relie votre situation à un Azure nouveau ou existant. réseau virtuel. Tout réseau virtuel nécessite d’avoir accès à Internet, car il doit être lié à plusieurs services Azure différents. Ceux-ci consistent en une assistance pour la mise à l’échelle des machines virtuelles, la gestion des secrets de chiffrement et des certificats, ainsi que l’intégration aux services de sécurité et d’authentification d’Azure. Si vous vous connectez à un réseau virtuel existant, vous devez inclure les autorisations appropriées de l’Azure CLI, sinon votre déploiement échouera.

Vous êtes maintenant prêt à produire votre cluster. Une fois qu’il est déployé, votre prochaine étape consiste à développer un créateur virtuel de gestion avec une assistance pour les bibliothèques Cassandra. Cela vous permettra d’utiliser les outils de requête Cassandra pour gérer votre base de données, en utilisant le mot de passe administrateur que vous avez défini lors de la création du cluster. Vous pouvez maintenant commencer à travailler avec Cassandra.

Créer des clusters hybrides dans des clouds hybrides

Si vous envisagez d’utiliser Cassandra dans Azure comme pont vers Cosmos DB, vous devez configurer vos ressources Azure en tant que cluster hybride. Comme précédemment, créez et publiez un cluster Cassandra dans Azure, en définissant son nom et en le connectant à un réseau virtuel Azure. Vous devrez configurer Cassandra pour le chiffrement de fichiers nœud à nœud. Par conséquent, si votre configuration sur site ne l’utilise pas, autorisez-le. Exportez vos certificats de chiffrement et utilisez Azure CLI pour les installer dans votre cluster hébergé par Azure. Ceux-ci permettront à vos deux sites d’interagir via des connexions de chat cryptées.

Le réseau virtuel devra se connecter à votre réseau régional, soit via des connexions Express Route dédiées, soit en utilisant un VPN de site à site. Ce que vous utiliserez dépendra de la quantité de données que vous avez l’intention d’envoyer à Azure, bien que les clusters expérimentaux soient plus susceptibles d’utiliser un VPN pour éviter le coût de la configuration d’une connexion MPLS (Multiprotocol Label Switching) dédiée.

Vous devrez créer un nouveau centre de documentation dans votre cluster géré, en utilisant Azure CLI pour obtenir des détails sur ses nœuds de départ. Celles-ci sont ajoutées aux informations de configuration de votre système sur site, ainsi qu’à la spécification de votre technique de duplication de site à site. Ce processus est remarquablement simple, il suffit de quelques lignes dans le langage de requête de Cassandra.

Utilisation de Cassandra managé avec d’autres services Azure

Un élément intrigant du service est l’assistance pour Apache Glow d’Azure — outil d’analyse basé, Databricks. Si vous installez Databricks dans le même réseau virtuel que votre service Managed Cassandra, puis utilisez le port Apache Spark Cassandra pour vous connecter à vos points de terminaison, vous pouvez ensuite utiliser les blocs-notes Spark et Databricks pour exécuter des analyses sur vos informations hébergées par Cassandra.

Il est fascinant de voir comment l’engagement de Microsoft envers les opérations de cloud hybride équivaut à travailler avec des données. En offrant un itinéraire géré pour exécuter Cassandra, l’entreprise offre un pont naturel pour les informations NoSQL entre vos outils sur site et le cloud. Il s’agit d’une connexion bidirectionnelle, permettant le traitement local des données sensibles tout en bénéficiant de l’échelle du cloud pour vos applications (et éventuellement de s’étendre à l’échelle internationale de Cosmos DB).

Les propres protocoles de duplication de Cassandra offrent la bridge, tandis qu’Azure s’assure qu’il est à jour et sécurisé. Le résultat est un ensemble d’outils efficace qui résout un certain nombre de problèmes liés à la connexion du cloud et du centre de données, un qui peut bénéficier d’outils comme Apache Glow pour fournir ces informations à d’autres services Azure qui reposent sur le Big Data.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici