Making data science useful. Cassie Kozyrkov (Google) Strata Data Conference UK 2019

O'Reilly
2 May 201904:58

Summary

TLDRLa science des données évolue rapidement grâce à des outils de plus en plus intuitifs et accessibles, réduisant les barrières d'entrée. Cependant, cela entraîne également des changements dans les rôles au sein du domaine, chacun nécessitant des mentalités différentes. Le discours met en évidence trois approches principales : l'analytique, axée sur l'exploration rapide des données ; les statistiques, qui se concentrent sur l'inférence rigoureuse et les décisions sous incertitude ; et l'apprentissage automatique/IA, qui vise l'automatisation à grande échelle. Ces approches, bien que distinctes, sont complémentaires et alimentent l'expansion de la science des données en de nouvelles directions créatives.

Takeaways

  • 😀 Les communautés d'ingénierie et d'expérience utilisateur reconnaissent enfin l'importance de la science des données, avec des outils plus accessibles et intuitifs.
  • 😀 L'objectif est de rendre la science des données plus rapide et facile, en éliminant les tâches difficiles et chronophages.
  • 😀 Si les outils de science des données deviennent suffisamment faciles à utiliser et à apprendre, les employeurs ne se soucieront plus des outils que vous connaissez.
  • 😀 En enlevant les tâches de base, il reste un éventail d'activités distinctes au sein de la science des données, chacune nécessitant des compétences humaines spécifiques.
  • 😀 Ces compétences humaines sont souvent appelées compétences difficiles à automatiser, bien plus que des 'soft skills'.
  • 😀 Avec des outils plus accessibles, de nouvelles façons d'utiliser ces outils émergent, élargissant ainsi le champ de la science des données.
  • 😀 L'expansion de l'univers de la science des données implique une diversité de profils et de compétences, ce qui peut alimenter un sentiment d'incompétence ou d'imposture.
  • 😀 On peut diviser les activités liées aux données en trois grandes catégories : exploration des données, prise de décision par inférence, et automatisation.
  • 😀 Les programmes d'analyse de données se concentrent sur l'exploration des données, les statistiques sur l'inférence et l'intelligence artificielle (IA) et le machine learning sur l'automatisation.
  • 😀 En matière de machine learning et d'IA, l'excellence repose sur la capacité à faire fonctionner des systèmes à grande échelle, de manière fiable et maintenable.
  • 😀 L'inférence est axée sur la rigueur et la lenteur, visant à éviter des conclusions hâtives, tandis que l'analyse vise à explorer rapidement les données pour en tirer de l'inspiration.

Q & A

  • Pourquoi les outils de science des données deviennent-ils de plus en plus accessibles ?

    -Les outils de science des données deviennent plus accessibles grâce à l'amélioration de l'interface utilisateur, à la simplification des processus complexes et à la réduction des tâches répétitives, permettant aux utilisateurs de se concentrer sur l'analyse plutôt que sur des détails techniques.

  • Quels sont les trois types d'activités principales dans la science des données, selon la transcription ?

    -Les trois activités principales sont l'exploration des données, l'inférence pour prendre des décisions éclairées sous incertitude, et l'automatisation des processus à l'aide de l'apprentissage automatique et de l'IA.

  • Qu'est-ce que l'analytique dans le contexte de la science des données ?

    -L'analytique est l'art d'explorer rapidement les données pour en tirer de l'inspiration. L'objectif n'est pas de tirer des conclusions immédiates, mais de découvrir ce qui se cache dans les données.

  • Pourquoi la statistique est-elle importante en science des données ?

    -La statistique est importante car elle permet de faire des inférences solides et bien réfléchies sous incertitude, en évitant les conclusions hâtives. Elle met l'accent sur la rigueur et la réflexion méthodique.

  • Quel est le rôle de l'apprentissage automatique et de l'IA dans la science des données ?

    -L'apprentissage automatique et l'IA se concentrent sur l'automatisation des processus et des tâches, avec un accent particulier sur la mise en production à grande échelle, la performance, la fiabilité et la maintenance des systèmes.

  • Quelles sont les compétences humaines essentielles dans la science des données ?

    -Les compétences humaines, appelées parfois 'compétences difficiles à automatiser', incluent la capacité de poser des questions pertinentes, de réfléchir de manière critique, de comprendre le contexte des données et de communiquer des résultats de manière claire.

  • Qu'est-ce que signifie la simplification des outils pour les carrières en science des données ?

    -La simplification des outils peut réduire les barrières d'entrée dans le domaine de la science des données, mais cela signifie aussi que les employeurs se concentreront moins sur les outils spécifiques maîtrisés par les candidats et plus sur leur capacité à penser de manière créative et stratégique.

  • Qu'est-ce que l'impasse de l'imposteur en science des données ?

    -L'impasse de l'imposteur dans la science des données se produit parce qu'il est difficile de maîtriser toutes les facettes du domaine, qui est en constante évolution et comprend de nombreuses spécialités très différentes les unes des autres.

  • Pourquoi la diversité des activités dans la science des données est-elle un défi pour les professionnels ?

    -La diversité des activités rend la science des données complexe, car chaque domaine d'activité nécessite des compétences et des mentalités différentes, ce qui peut entraîner des sentiments d'incertitude chez les professionnels qui essaient de couvrir toutes ces spécialités.

  • Quelles sont les compétences essentielles pour l'excellence en apprentissage automatique et IA ?

    -L'excellence en apprentissage automatique et IA repose sur l'ingénierie, où l'objectif est de faire fonctionner les systèmes à grande échelle de manière fiable, facile à surveiller et à maintenir.

Outlines

plate

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Mindmap

plate

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Keywords

plate

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Highlights

plate

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。

今すぐアップグレード

Transcripts

plate

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。

今すぐアップグレード
Rate This

5.0 / 5 (0 votes)

関連タグ
Science des donnéesOutils intuitifsAccessibilitéAutomatisationIncertitudeAnalyse de donnéesMachine learningIntelligence artificielleStatistiquesExploration de donnéesCarrières
英語で要約が必要ですか?