SQL pour Data Engineer - 8 Concepts que tu dois MAITRISER

Data From Scratch - Willis
4 Oct 202209:08

Summary

TLDRDans cette vidéo, l'auteur aborde les 8 points essentiels pour maîtriser le SQL, un outil clé pour les professionnels du secteur des données. Il insiste sur l'importance de comprendre l'ordre d'exécution des requêtes, de maîtriser les jointures, les fonctions d'agrégation et les fenêtres, les calculs analytiques, et l'utilisation des fonctions de date. Il souligne également le rôle des CTE et des sous-requêtes, et conclut par la nécessité de comprendre les plans d'exécution pour optimiser les requêtes. Un cadeau gratuit est offert pour approfondir ces compétences.

Takeaways

  • 😀 L'importance de maîtriser SQL pour les professionnels des données et les métiers liés à la data.
  • 📈 L'ordre d'exécution d'une requête SQL est crucial pour comprendre et optimiser les requêtes.
  • 🔄 Les jointures sont fondamentales pour interagir avec plusieurs tables et sont essentielles pour un data scientist ou ingénieur.
  • 📊 Les fonctions d'agrégation sont clés pour agréger des données autour de fonctions mathématiques telles que MIN, MAX, AVG, etc.
  • 🖼️ Les fonctions de fenêtre sont importantes pour réaliser des agrégations sur un ensemble de données non agrégées.
  • 📊 Les calculs analytiques, comme les KPIs, sont essentiels pour aider à la prise de décision dans les entreprises.
  • 📅 Il est important de maîtriser les fonctions de date en SQL pour travailler avec des dates et des périodes.
  • 🔄 Les CTE (Common Table Expressions) et les sous-requêtes sont des outils similaires pour aborder la complexité des données.
  • 📘 La compréhension et la lecture d'un plan d'exécution sont capitales pour optimiser les requêtes SQL et améliorer les performances.
  • 🎁 Un cadeau gratuit est offert pour aider à acquérir des compétences en SQL et en data, incluant des informations techniques, des salaires et bien plus.

Q & A

  • Pourquoi est-il important de s'abonner à la chaîne et de mettre à jour les notifications ?

    -C'est important pour être informé des toutes les nouvelles vidéos qui seront publiées dans les semaines à venir, ce qui permet de ne rien manquer sur le sujet de SQL et d'autres sujets liés aux données.

  • Quel est le contenu du cadeau gratuit mentionné dans le script ?

    -Le cadeau gratuit contient des informations nécessaires pour devenir un datant ou un analyste, y compris des compétences techniques, les salaires et d'autres informations pertinentes.

  • Quel est le premier point clé abordé dans la vidéo pour maîtriser le SQL ?

    -Le premier point clé est de connaître l'ordre d'exécution d'une requête SQL, qui est essentiel pour comprendre comment construire efficacement des requêtes.

  • Pourquoi les jointures sont-elles importantes dans SQL ?

    -Les jointures sont importantes car elles permettent d'interagir avec plusieurs tables, ce qui est un élément fondamental pour récupérer et de manipuler des données de manière efficace.

  • Quels types de jointures sont mentionnés dans le script ?

    -Les types de jointures mentionnées sont les jointures internes, les jointures externes, les jointures gauches et les jointures droites.

  • Quel est le rôle des fonctions d'agrégation dans SQL ?

    -Les fonctions d'agrégation sont utilisées pour regrouper des données à partir d'une ou plusieurs tables en utilisant des fonctions mathématiques comme MIN, MAX, AVG (moyenne), etc.

  • Quels sont les calculs analytiques mentionnés dans le script ?

    -Les calculs analytiques mentionnés incluent les KPI (indicateurs clés de performance), la rétention, le taux d'adhérence (stickiness) et le taux de churn (turnover).

  • Pourquoi est-il important de connaître comment utiliser et lire un plan d'exécution SQL ?

    -Connaître et lire un plan d'exécution SQL est essentiel pour comprendre comment le moteur SQL exécute une requête et pour optimiser ces requêtes afin d'améliorer les performances.

  • Quelle est la différence entre une CTE et une sous-requête selon le script ?

    -Une CTE (Common Table Expression) et une sous-requête font quasiment la même chose, mais il peut y avoir des différences esthétiques ou de préférence personnelle. Elles sont utilisées pour simplifier des requêtes complexes.

  • Pourquoi est-il important de maîtriser l'utilisation des fonctions de date en SQL ?

    -Il est important de maîtriser les fonctions de date en SQL car elles permettent de calculer et de manipuler des dates et des périodes de temps, ce qui est souvent nécessaire pour répondre aux besoins des données.

  • Quel conseil est donné pour aider à la carrière d'un datant ou d'un analyste dans le script ?

    -Le conseil donné est de maîtriser les concepts clés en SQL, notamment l'ordre d'exécution, les jointures, les fonctions d'agrégation, les fonctions d'analytique, la manipulation de dates, les CTE et sous-requêtes, et la lecture des plans d'exécution pour optimiser les requêtes.

Outlines

00:00

📚 Maîtrise des bases de SQL pour les métiers liés aux données

Le premier paragraphe introduit la vidéo en soulignant l'importance de la maîtrise de SQL pour les professionnels des données. Il insiste sur les quatre actions habituelles à suivre après la découverte d'une vidéo utile : s'abonner, aimer, sonner la cloche et découvrir le cadeau gratuit offert par le créateur. Ce cadeau contient des informations sur les compétences techniques, les salaires et d'autres données pertinentes pour devenir un data scientist ou un analyste. Le paragraphe se concentre ensuite sur les bases de SQL, comme l'ordre d'exécution des requêtes, les jointures, les fonctions d'agrégation et les fenêtres de données, qui sont essentielles pour interagir avec les bases de données et pour les métiers de data.

05:01

📈 Comprendre les calculs analytiques et l'importance de la gestion des dates en SQL

Le deuxième paragraphe se concentre sur l'importance de comprendre les calculs analytiques pour les métiers de données, tels que les taux d'adhésion et de perte de clients, et comment ils sont utilisés pour prendre des décisions d'entreprise. Il explique également la nécessité de maîtriser les fonctions de date en SQL, qui sont cruciales pour les analyses temporelles. Le paragraphe mentionne également les CTE (Common Table Expressions) et les sous-requêtes, qui sont des outils pour simplifier et améliorer les requêtes SQL complexes. Enfin, il souligne l'importance capitale de comprendre et de lire les plans d'exécution SQL pour optimiser les requêtes et améliorer les performances, ce qui est un élément clé du métier de datant.

Mindmap

Keywords

💡SQL

SQL, qui signifie Structured Query Language, est un langage de requête utilisé pour interagir avec des bases de données relationnelles. Dans le script, il est mentionné comme étant essentiel pour les professionnels travaillant avec les données, permettant de lire, mettre à jour, supprimer et manipuler des données. L'un des points clés du script est de maîtriser SQL pour devenir un data scientist ou un analyste de données.

💡jointures

Les jointures sont une fonctionnalité de SQL qui permet de combiner des données provenant de plusieurs tables en se basant sur des conditions spécifiques. Elles sont cruciales pour créer des requêtes inter-relating plusieurs ensembles de données, comme illustré dans le script où l'auteur insiste sur l'importance de connaître et de maîtriser les jointures pour un data analyst.

💡fonctions d'agrégation

Les fonctions d'agrégation sont utilisées pour effectuer des calculs sur un ensemble de données, telles que la somme, la moyenne, la minimum, la maximum, etc. Elles sont décrites dans le script comme un élément clé pour agréger des données autour de fonctions mathématiques, ce qui est essentiel pour les analyses de données.

💡fonctions de fenêtre

Les fonctions de fenêtre sont des calculs qui s'appliquent à un ensemble de lignes dans une requête, mais qui ne sont pas des agrégats. Elles sont mentionnées dans le script comme un outil avancé pour manipuler des données, permettant de réaliser des calculs sur une 'fenêtre' spécifique de données non agrégées.

💡calculs analytiques

Les calculs analytiques sont utilisés pour résoudre des besoins métier en fournissant des informations sur les tendances, les performances et les indicateurs clés de performance (KPI). Dans le script, ils sont liés à la création de données planes pour répondre aux besoins de l'entreprise, comme l'exemple de la rétention des utilisateurs sur une application.

💡indicateurs clés de performance (KPI)

Les KPI sont des mesures quantifiables utilisées pour évaluer les performances d'une entreprise ou d'un produit. Dans le script, ils sont mentionnés comme un aspect important des calculs analytiques, servant à aider à la prise de décision dans le contexte des données.

💡CTE (Common Table Expressions)

Les CTE sont des expressions de table courantes qui permettent de simplifier les requêtes SQL complexes en définissant une vue temporaire. Elles sont décrites dans le script comme un outil permettant de structurer et de rendre plus lisible les requêtes, en particulier lors de l'utilisation de sous-requêtes.

💡sous-requêtes

Les sous-requêtes sont des requêtes SQL imbriquées à l'intérieur d'une autre requête. Elles sont mentionnées dans le script comme étant similaires aux CTE, servant à ajouter de la complexité dans l'utilisation des données et à aider à résoudre des questions plus complexes.

💡plan d'exécution

Le plan d'exécution est la représentation de la manière dont le moteur SQL va traiter une requête. Il est décrit dans le script comme étant crucial pour comprendre et optimiser les requêtes SQL, en permettant de voir comment les données sont récupérées et manipulées.

💡optimisation de requête

L'optimisation de requête fait référence au processus d'amélioration de la performance des requêtes SQL. Dans le script, elle est soulignée comme un élément clé du métier de datant, essentiel pour gérer les grandes quantités de données et pour assurer l'efficacité des requêtes.

💡dates

La gestion des dates est un aspect important de SQL, permettant de calculer et de manipuler des dates et des heures. Dans le script, il est mentionné que les fonctions de date sont très importantes pour un data analyst junior, notamment pour effectuer des calculs sur des dates futures et passées.

Highlights

L'importance de maîtriser SQL pour les professionnels travaillant avec des données.

Les 8 points essentiels à connaître pour être à l'aise avec SQL.

L'appel à s'abonner à la chaîne et à activer la notification pour les prochaines vidéos.

Le cadeau gratuit fourni pour aider à devenir un data analyst ou un data engineer.

La définition de SQL comme un langage de requête de données.

La nécessité de connaître l'ordre d'exécution d'une requête SQL.

L'importance des jointures pour interagir avec plusieurs tables.

La compréhension des fonctions d'agrégation pour manipuler des données.

L'utilisation des fonctions de fenêtre pour effectuer des agrégations sur un ensemble de données.

La notion de calculs analytiques et leur rôle dans la création de KPI.

L'exemple de KPI comme le taux d'adhérence et la rétention des utilisateurs.

La nécessité de maîtriser les fonctions de date en SQL.

La différence entre les CTE et les sous-requêtes et leur utilisation en SQL.

L'importance capitale de comprendre et de lire un plan d'exécution SQL.

L'optimisation des requêtes SQL comme un élément clé du métier de datant.

La conclusion sur l'importance de ces 8 points pour les professionnels de données.

Transcripts

play00:00

bon on va dire les vraies affaires parce

play00:03

qu'aujourd'hui on va parler d'un sujet

play00:05

super important pour devenir d'atteindre

play00:07

unir c'est le

play00:09

SQL tu dois en tant que datant de venir

play00:13

et pour tous les métiers concernant la

play00:15

data maîtriser le SQL et justement dans

play00:18

cette vidéo on va voir les 8 points que

play00:21

tu dois au minimum connaître pour être à

play00:24

l'aise en SQL et maîtriser sans trop

play00:27

galérer et reste jusqu'à la fin parce

play00:30

que le huitième point de cette vidéo est

play00:34

fondamental mais bon avant de commencer

play00:37

sur ces 8 points en tout cas sur le

play00:40

premier point je vais te demander les

play00:42

quatre actions habituelles parce que

play00:43

j'ai remarqué que près de 70% des gens

play00:46

qui sont qui regardent mes vidéos sur la

play00:48

chaîne ne sont pas abonnées et ça c'est

play00:50

pas normal donc il va être important de

play00:53

t'abonner bien évidemment à la chaîne de

play00:56

mettre à liker la vidéo de mettre la

play00:58

cloche parce que très important pour

play01:01

être averti de toutes les vidéos qui

play01:02

vont venir dans les semaines à venir et

play01:04

mon quatrième point c'est mon cadeau

play01:06

gratuit dans mon cadeau gratuit tu

play01:08

trouveras toutes les informations

play01:10

nécessaires pour devenir soit d'atteinte

play01:13

d'une heure soit d'être analyse soit

play01:15

data les compétences techniques les

play01:18

salaires et encore plein d'autres

play01:19

informations le tout dans ce cadeau

play01:23

gratuit que tu trouveras en description

play01:25

bien évidemment ce cadeau Nathan que toi

play01:28

être d'atteindre unir c'est surtout

play01:31

maîtriser le SQL dans une journée en

play01:34

étant d'une manière passent énormément

play01:35

de temps à coder du SQL le SQL c'est un

play01:39

langage qui permet de requêter des

play01:41

données donc de soit les lire soit les

play01:44

milliers de mettre à jour soit les

play01:46

supprimer le SQL tourne vraiment sur

play01:48

l'interaction avec la donnée donc dans

play01:51

cette vidéo je vais considérer que tu

play01:53

connais le minimum en SQL tu sais faire

play01:56

un select étoile d'iliter une table

play01:59

vider une bref des trucs assez assez

play02:02

basique et on va creuser un peu plus

play02:04

loin justement avec le premier point qui

play02:06

est tu dois connaître l'ordre

play02:08

d'exécution d'une requête SQL je te le

play02:11

mets là l'ordre d'exécution d'une Corée

play02:13

SQL parce que c'est important de savoir

play02:15

l'ordre donc c'est tordre ça te permet

play02:17

d'avoir une vision un peu plus profonde

play02:19

de comment construire ton SQL c'est très

play02:22

très important à connaître et ça va être

play02:24

mon premier point le deuxième point

play02:26

c'est les jointures si quelque chose de

play02:29

base et de fondamental à connaître les

play02:32

jointures que ce soit liner John left

play02:35

John le rise John et or il y en a encore

play02:37

d'autres il est important pour un

play02:39

d'atteindre unir de pouvoir interagir

play02:42

avec pas juste une seule table mais

play02:44

plusieurs tables une jointure et des

play02:47

jointures je dirais même permettre

play02:48

d'interagir avec plus en table et ça

play02:50

c'est fondamental donc ça c'est le

play02:53

deuxième point connaître et maîtriser

play02:55

les jointures le troisième point c'est

play02:57

les fonctions d'agrégation donc par

play03:00

exemple comparé et tout ce qui tourne

play03:02

autour du groupe bail donc le groupe

play03:04

bike te permet d'agréger des données qui

play03:06

se trouvent dans une base de données

play03:07

dans une table ou plusieurs tables et tu

play03:10

vas l'agréger autour de fonctions

play03:11

mathématiques comme minimum maximum

play03:14

moyenne donc average etc c'est

play03:17

fondamental de connaissance en tant que

play03:19

vous êtes ingénieur parce que finalement

play03:20

c'est le cœur du métier d'atteindre

play03:22

lumière c'est de récupérer des données

play03:23

les transformer les stockés et c'est

play03:25

avec ça qu'on les récupère les stocks et

play03:27

les transformer donc ça c'était le

play03:29

troisième point les fonctions

play03:30

d'agrégation le quatrième point c'est un

play03:33

peu dans le même genre mais un peu plus

play03:34

poussé c'est les fonctions fait étrages

play03:36

ça te permet de réaliser des agrégations

play03:38

mais précisément sur une fenêtre de

play03:42

données donc sur un ensemble de données

play03:44

non agrégées bref je te mets des

play03:46

éléments en description pour t'informer

play03:48

sur si tu ne sais pas ce que c'est parce

play03:49

que c'est capital de connaître de

play03:52

savoir-faire un lac de savoir faire un

play03:54

lead ça va faire un max un 40 tout ça ça

play03:57

va être fondamental pour justement créer

play03:59

tes dat et jouer avec la donnée donc ça

play04:02

c'est évident que tu dois le maîtriser

play04:05

donc ça c'est bon quatrième point le

play04:07

cinquième point c'est connaître les

play04:09

calculs analytiques calcul analytique je

play04:13

vais le préciser parce que c'est assez

play04:14

vague en tant que Jenny souvent notre

play04:17

boulot créer les dates planes pour

play04:19

répondre à des besoins business si

play04:21

besoin business on aide à on est de à

play04:24

apporter des réponses à partir de KPI je

play04:27

te les mets la définition là de Kepy et

play04:30

l'équipage sont des indicateurs qui te

play04:32

permettent justement d'aider à la prise

play04:34

de décision donc toi en tant que lumière

play04:36

tu dois mettre en place des Data

play04:38

pipeline qui calcule souvent des PPI et

play04:40

donc tu dois connaître les képiailles de

play04:42

base de différents produits mais dont

play04:45

Facebook souvent le cœur de Facebook

play04:48

c'est la rétention c'est le nombre de

play04:50

personnes qui restent sur l'application

play04:51

c'est le nombre de personnes qui se

play04:54

connectent tous les jours toutes les

play04:55

semaines tous les mois donc ça on va

play04:57

appeler ça le dahu le WA U le Mau donc

play05:01

délit active user montre lit active user

play05:04

vous clip active user autre exemple il

play05:07

peut être aussi intéressant pour un

play05:08

business de connaître la sticky note la

play05:10

stickness et taux d'adhérence sur une

play05:12

application par exemple mettons Netflix

play05:14

imaginons Netflix souhaite savoir

play05:17

combien de temps une personne reste tous

play05:20

les jours sur l'application donc sur une

play05:22

semaine voilà donc on va calculer le

play05:24

stick Inès de cette manière donc toi en

play05:26

tant qu'ingénierie tu dois connaître ce

play05:28

que c'est que le stick Inès dernier

play05:30

exemple c'est connaître ce que c'est

play05:31

qu'un turn c'est la proportion de

play05:33

clients perdue sur une application ou

play05:36

sur un service donc globalement tu es

play05:37

sur Netflix tu regardes Netflix pendant

play05:40

une semaine et puis d'un coup tu décides

play05:42

de plus regarder sur un mois par exemple

play05:44

et donc l'idée c'est que Netflix veut

play05:47

savoir le turn pour justement calibrer

play05:50

l'application calibrée le besoin et

play05:53

comprendre pourquoi les gens restent pas

play05:55

sur l'application Netflix ou en tout cas

play05:57

sur l'interface Netflix

play06:00

donc ça c'est des calculs analytiques

play06:01

assez classiques qui sont réalisés le

play06:03

plus souvent par des dates unir avec

play06:05

l'aide et data scientist et dataïs parce

play06:07

que c'est souvent c'est de personnes qui

play06:09

sont garants des règles métier et donc

play06:11

c'est important pour un datant du nier

play06:13

de comprendre toutes ces subtilités donc

play06:15

ça c'est mon cinquième point le 6e point

play06:17

c'est simple c'est basique c'est de

play06:20

connaître et jouer avec les dates en SQL

play06:23

il y a de très nombreuses fonctions

play06:24

dates pour calculer les dates futures

play06:27

les dates passées la semaine le mois

play06:30

l'année etc donc pendant que d'atteindre

play06:32

junior il est important de maîtriser

play06:34

tout simplement l'ensemble des fonctions

play06:36

date très très important à ne pas

play06:39

oublier bon parlons maintenant des CTE

play06:41

ou sous requêtes les deux sont très

play06:44

similaires je te mets la définition en

play06:46

description parce que c'est assez proche

play06:48

vraiment ça fait quasiment la même chose

play06:49

c'est juste des questions esthétiques

play06:50

moi à titre personnel je préfère les

play06:52

sites mais bref en tant que datinaire il

play06:54

est capable de pouvoir soit faire une

play06:57

citeuse soit faire des sous roquettes

play06:59

parce que justement avec les

play07:01

sous-roquets tout c'était pas m'aider

play07:02

une complexité dans l'utilisation de la

play07:05

donnée lorsque tu fais des sellettes

play07:07

quand tu fais un INCERT etc donc c'est

play07:10

capital pour un atteindre de maîtriser

play07:12

c'est de notions donc encore une fois je

play07:15

te mets des informations en description

play07:17

et le 8e point et pour moi le point le

play07:20

plus important c'est maîtriser

play07:22

l'utilisation et la lecture d'un plan

play07:26

d'exécution un plan d'exécution c'est

play07:28

quoi un plan d'exécution c'est tout

play07:30

simplement la manière dont le moteur SQL

play07:33

va exécuter ta quirie ta requête

play07:37

estuelle ces capitales de savoir lire un

play07:40

plan d'exécution parce que c'est ça qui

play07:41

va t'amener à notre niveau de lecture et

play07:44

ça peut être ça va t'aider tout

play07:45

simplement aussi à optimiser ta requête

play07:48

SQL l'optimisation de requitation est un

play07:51

élément cœur du métier d'atteindre parce

play07:53

que souvent les dates indignes grd

play07:55

volume énorme de données donc clairement

play07:58

il va falloir que tu une maîtrise cette

play08:01

huitième notion cette huitième

play08:03

connaissance parce que clairement ça va

play08:05

faire la différence entre quelqu'un qui

play08:07

maîtrise ce point et quelqu'un qui a une

play08:09

maîtrise pas voilà et donc clairement ça

play08:11

va faire la différence entre quelqu'un

play08:12

qui maîtrise et quelqu'un qui maîtrise

play08:14

pas la lecture d'un point d'exécution

play08:16

c'est capital de connaître ça de

play08:19

connaître ce point tout simplement et

play08:21

donc voilà on a vu les 8 points à

play08:24

connaître en SQL les 8 concepts à

play08:27

maîtriser en Suède il est capital que tu

play08:30

maîtrises ces points et c'est pas les

play08:32

seuls à connaître mais là je t'ai fait

play08:34

un résumé rapide parce que sinon on y

play08:36

passerait vraiment une heure c'est super

play08:38

important je veux être vraiment concis

play08:40

et donc j'espère que cette vidéo t'a plu

play08:43

tu as aidé dans ta carrière et pour

play08:45

savoir comment maîtriser et qu'est-ce

play08:47

que tu as surtout à mes besoin de

play08:48

maîtriser en SQL si c'est le cas je te

play08:50

laisse mettre un like à la vidéo et bien

play08:53

évidemment tu as mon cadeau gratuit qui

play08:55

est là super important parce que tu

play08:56

trouves également plein d'informations

play08:58

sur le SQL mais encore sur plein

play09:01

d'autres choses sur ce c'était data from

play09:04

scratch c'était Willis et je te dis à la

play09:07

prochaine

Rate This

5.0 / 5 (0 votes)

相关标签
SQLDataFormationVidéoCompétencesGratuitJointuresAgrégationCTEOptimisation
您是否需要英文摘要?