vendredi, 19 avril 2024

Amazon Omics vise à optimiser l’analyse des données biologiques à grande échelle

Lors de sa conférence annuelle re:Invent, Amazon Web Services a lancé mardi un nouveau service, baptisé Amazon Omics, conçu pour aider les bioinformaticiens, les chercheurs et les scientifiques à stocker et analyser les types de données génomiques et biologiques afin d’accélérer les avancées scientifiques de la médecine de précision.

Les omiques font généralement référence aux domaines d’études en biologie qui se terminent par le suffixe « omique », tels que la génomique, la transcriptomique (l’étude de l’ARN dans une cellule), la protéomique (l’étude des protéomes ou des ensembles de protéines) et la métabolomique. (l’étude des molécules dans les cellules). Les omiques impliquent généralement des études à grande échelle avec de grands ensembles de données.

Le nouveau service, selon l’entreprise, peut être utilisé par les scientifiques non seulement pour créer un énorme magasin de données, mais également pour importer de gros fichiers de données brutes tels que des séquences de génomes ou d’autres fichiers de données utilisés en médecine de précision, un domaine médical qui utilise données sur le génome et les protéines pour optimiser le traitement des maladies.

Amazon Omics peut également aider à mettre en place un flux de travail bioinformatique de base et à analyser les résultats à l’aide des services d’analyse et d’apprentissage automatique AWS existants, a déclaré AWS, ajoutant que le service provisionne automatiquement l’infrastructure sous-jacente à mesure que l’utilisation augmente.

Stockage de données optimisé pour la bioinformatique

Le nouveau service fonctionne sur la base de trois composants principaux : un stockage optimisé, un calcul géré pour les flux de travail et des magasins de données adaptés à des types d’analyse spécifiques, a écrit Channy Yun, principal défenseur des développeurs chez Amazon, dans un article de blog.

Afin de réduire les coûts, Amazon Omics utilise des options de stockage compatibles avec la bioinformatique pour stocker les données de séquence brutes. Afin d’optimiser les données pour l’exécution de l’analyse, Amazon Omics importe les données brutes dans un magasin de variantes et les transforme en un schéma prêt pour les requêtes disponible sous forme de table Apache Iceberg, selon l’entreprise.

Le service est fourni avec deux classes de stockage : active et archive.

« L’archivage automatique est activé par défaut, ce qui signifie qu’Amazon Omics déplacera automatiquement les données vers la classe de stockage la moins chère si elles ne sont pas régulièrement consultées (pendant plus de 30 jours), similaire à Amazon Simple Storage Service (Amazon S3) Classe de stockage Intelligent-Tiering, entraînant des économies pour les clients », a écrit Tehsin Syed, directeur général de Health AI chez AWS, dans un article de blog.

Amazon Omics prend également en charge l’importation de données brutes dans un Annotation Store. Les données marquées ou étiquetées par types de fichiers sont appelées données annotées.

Les scientifiques et les autres utilisateurs peuvent commencer à importer des données dans le stockage d’objets via la console du service.

Le composant de calcul géré du service fournit des ressources aux scientifiques pour exécuter des flux de travail bioinformatiques qui contiennent des scripts d’une série de tâches coordonnées conçues pour distiller de grandes quantités de données de séquence brutes, du stockage Amazon Omics ou Amazon S3, à de petites quantités de données analytiques. données, telles que les mutations du génome, a déclaré la société, ajoutant que les scientifiques et les autres utilisateurs doivent simplement spécifier les ressources de calcul nécessaires pour chaque tâche.

« En retour, cela supprime tout le travail lourd indifférencié associé à l’exécution et à la gestion de ces flux de travail à grande échelle », a écrit Syed, ajoutant que les scripts à l’intérieur des flux de travail peuvent être écrits dans des langages tels que Nextflow ou Workflow Description Language.

Le nouveau service, qui peut être utilisé en combinaison avec d’autres services tels qu’Amazon HealthLake, est désormais disponible dans le US Est (Virginie du Nord), USA Ouest (Oregon), Asie Pacifique (Singapour), Europe (Francfort), Europe (Irlande) et Europe (Londres).

La prise en charge d’autres régions devrait bientôt suivre. Le service est tarifé sur un modèle de consommation.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici