Improving Therapeutic Development at Biogen with UK Biobank Data, Databricks, and DNAnexus

Databricks

26 Aug 202025:41

Summary

TLDRDans cette présentation, Biogen, DNA Nexus et Databricks expliquent comment ils ont collaboré pour exploiter les données massives du UK Biobank, un ensemble de données génétiques et phénotypiques de plus de 500 000 participants. Les défis liés à la gestion de données volumineuses et complexes ont été surmontés grâce à des solutions de cloud et des outils spécialisés comme Titan, Apollo et Databricks. Ensemble, ils ont accéléré l'analyse de ces données, permettant à Biogen de découvrir de nouvelles cibles médicamenteuses et d'améliorer la compréhension des maladies neurodégénératives complexes.

Takeaways

😀 Le UK Biobank contient plus de 500 000 échantillons, offrant des informations génétiques et phénotypiques cruciales pour la recherche sur les maladies humaines.
😀 Biogen a utilisé les données du UK Biobank pour identifier de nouvelles cibles médicamenteuses et améliorer sa compréhension des maladies neurodégénératives complexes.
😀 Biogen a rencontré des défis pour gérer et traiter la gigantesque quantité de données, approchant un pétaoctet, ce qui a nécessité une infrastructure cloud robuste.
😀 DNA Nexus a joué un rôle clé en permettant à Biogen de traiter efficacement ces vastes ensembles de données grâce à sa plateforme Titan pour le traitement de données génomiques à grande échelle.
😀 L'utilisation d'Apollo, un produit de DNA Nexus, a permis à Biogen d'intégrer des données génomiques avec des informations cliniques pour faciliter les recherches sur la maladie.
😀 Databricks a fourni une plateforme d'analyse de données permettant de traiter des ensembles de données génomiques en réduisant de manière significative le temps de traitement (de 30 heures à moins de 40 minutes).
😀 Grâce à la plateforme Databricks et à l'utilisation de Spark, Biogen a pu accélérer les analyses du séquençage du génome humain, optimisant ainsi la découverte de nouveaux médicaments.
😀 Les outils Hail et Glow de Databricks ont facilité le traitement des données génomiques complexes et ont permis de tirer parti des calculs distribués pour accélérer l'analyse des variants génétiques.
😀 La collaboration entre Biogen, DNA Nexus et Databricks a permis de mieux comprendre l'impact des variants génétiques sur l'efficacité des traitements médicamenteux, notamment dans les maladies neurodégénératives.
😀 L'intégration des données génétiques et phénotypiques a permis de repositionner et de réorganiser le portefeuille de médicaments de Biogen, augmentant la précision de ses développements thérapeutiques.
😀 Les collaborations continues entre les équipes de Biogen, DNA Nexus et Databricks sont essentielles pour faire progresser la recherche sur les maladies humaines complexes et pour influencer l'avenir des traitements médicaux.

Q & A

Qu'est-ce que le UK Biobank et pourquoi est-il important dans le domaine de la génétique ?
-Le UK Biobank est une étude à long terme sur la prédisposition génétique et l'exposition environnementale au développement de maladies. Avec plus de 500 000 participants, il est l'une des plus grandes et des plus détaillées études de population jamais réalisées. Ce jeu de données est essentiel pour associer la génétique aux maladies et pour développer de nouveaux traitements thérapeutiques.
Quels sont les défis informatiques rencontrés par Biogen pour exploiter les données du UK Biobank ?
-Biogen a rencontré plusieurs défis informatiques pour traiter les données massives du UK Biobank, notamment un manque de capacité de stockage et de bande passante pour gérer un jeu de données d'environ un pétaoctet. De plus, leur infrastructure de calcul haute performance a souffert de pannes, ce qui a rendu nécessaire un nouveau paradigme de données pour traiter ces volumes.
Comment DNA Nexus a-t-il aidé Biogen à surmonter ces défis ?
-DNA Nexus a contribué en fournissant des outils comme les produits Titan et Apollo pour traiter, stocker et analyser les données du UK Biobank à grande échelle. Ces outils ont permis de gérer efficacement les données génomiques, d'assurer leur qualité et leur cohérence, et d'analyser rapidement les énormes volumes de données.
Qu'est-ce que l'exome et pourquoi est-il important pour l'étude des maladies génétiques ?
-L'exome est la région codante des gènes, c'est-à-dire les parties du génome qui produisent des protéines. L'étude de l'exome est cruciale pour identifier les gènes associés aux maladies, car elle permet de cibler directement les gènes qui ont un impact sur la santé humaine.
Quels outils et technologies ont été utilisés pour traiter et analyser les données du UK Biobank ?
-Pour traiter et analyser les données, Biogen a utilisé une combinaison des outils Titan de DNA Nexus pour la gestion des données génomiques et Apollo pour combiner ces données avec des informations cliniques. En outre, Databricks a optimisé les pipelines d'analyse avec des outils comme Hail et Glow pour effectuer des analyses statistiques sur ces énormes ensembles de données.
Comment Databricks a-t-il contribué à l'optimisation des pipelines de données ?
-Databricks a optimisé les pipelines de données en utilisant son environnement Spark pour paralléliser les tâches, réduire le temps de traitement des données et effectuer des analyses statistiques de manière plus rapide et plus efficace. Par exemple, le pipeline GTK a été réduit de 30 heures à moins de 40 minutes grâce à ces optimisations.
Pourquoi est-il nécessaire de partitionner les données dans le cadre de l'analyse du UK Biobank ?
-Le partitionnement des données est essentiel pour permettre des requêtes rapides et efficaces sur des ensembles de données massifs. Dans le cas du UK Biobank, les données génomiques sont extrêmement volumineuses et complexes, ce qui rend nécessaire un partitionnement intelligent basé sur des critères génétiques et cliniques afin d'optimiser les performances des requêtes.
Qu'est-ce qu'une analyse d'association génome-large (GWAS) et comment est-elle utilisée dans ce contexte ?
-Une GWAS est une analyse statistique qui cherche à établir des liens entre des variantes génétiques et des traits ou des maladies spécifiques. Dans le contexte du UK Biobank, Biogen utilise les GWAS pour identifier des associations entre les variantes génétiques et des maladies, ce qui aide à la découverte de nouveaux cibles thérapeutiques et à la compréhension des mécanismes biologiques sous-jacents.
Quelles découvertes importantes Biogen a-t-il faites grâce à l'analyse des données du UK Biobank ?
-Grâce à l'analyse des données du UK Biobank, Biogen a découvert de nouvelles cibles thérapeutiques et a pu mieux comprendre la biologie des maladies neurodégénératives. En particulier, ils ont identifié des variantes génétiques dans plusieurs gènes qui influencent l'espérance de vie humaine, contribuant ainsi à une meilleure compréhension des maladies complexes.
Quel rôle joue la collaboration entre DNA Nexus, Databricks et Biogen dans le succès de ce projet ?
-La collaboration entre DNA Nexus, Databricks et Biogen a été essentielle pour surmonter les défis liés à la gestion et à l'analyse de grandes quantités de données. DNA Nexus a fourni les outils pour traiter et analyser les données génomiques, tandis que Databricks a optimisé les performances des analyses à grande échelle avec sa plateforme Spark. Ensemble, ces technologies ont permis à Biogen de progresser rapidement dans la recherche de nouveaux traitements.

Outlines

plate

このセクションは有料ユーザー限定です。アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Mindmap

plate

このセクションは有料ユーザー限定です。アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Keywords

plate

このセクションは有料ユーザー限定です。アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Highlights

plate

このセクションは有料ユーザー限定です。アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Transcripts

plate

このセクションは有料ユーザー限定です。アクセスするには、アップグレードをお願いします。

今すぐアップグレード

関連動画をさらに表示

STT - Upgrading PostgreSQL Repository Troubleshooting (no Q&A)

My Top 8 Data Storytelling Tips as a Data Analyst

Did Adam and Eve really exist? – Surprising Science #29

Peut-on faire mentir les chiffres ? - Johanna Ghiglia /Science4All - La collab' de l'info

How Networks Work

Introduction to Transport Planning: Video 4 (Travel Surveys)

Rate This

★

★

★

★

★

5.0 / 5 (0 votes)

関連タグ

BiogenGenomiqueRecherche médicaleUK BiobankTechnologieBig DataCloud ComputingMaladies neurodégénérativesDatabricksDNA NexusGénétique

英語で要約が必要ですか？