Les éléments INDISPENSABLES pour devenir un VRAI DATA ENGINEER

Data From Scratch - Willis
1 Nov 202208:57

Summary

TLDRThe video discusses the complexities and rapid evolution of the data science profession. The speaker emphasizes the importance of documentation, mastering programming languages (SQL, Python, Java, Scala), continuous learning, understanding business models, effective communication, independence, collaboration, distributed systems, proactivity, and having a 'data mindset.' These ten key points are crucial for thriving and standing out in the data science field. The video also highlights the significance of liking, subscribing, and hitting the notification bell for more valuable content, and offers a free gift with insights into technical skills and salary information.

Takeaways

  • 📝 Takeaway 1: Documentation is crucial in data science and software development, often underestimated but essential for maintaining and understanding code over time.
  • 🐍 Takeaway 2: Mastery of programming languages like SQL, Python, Java, or Scala is fundamental for a data scientist, with Python being a good starting point due to its accessibility.
  • 🌐 Takeaway 3: Continuous learning is vital in the fast-evolving field of data science; staying updated with daily advancements helps avoid being left behind.
  • 💼 Takeaway 4: Understanding the business model and how it operates is key for a data scientist to positively impact the business with data-driven insights.
  • 🗣️ Takeaway 5: Effective communication is indispensable for collaboration in a team setting, crucial for a data scientist working in a collective environment.
  • 🏋️ Takeaway 6: Independence in problem-solving is important for a data scientist, enabling them to advance projects and contribute to team success.
  • 🤝 Takeaway 7: Collaboration, both in terms of communication and technical aspects such as code readability and documentation, is a core skill for a data scientist.
  • 🔄 Takeaway 8: Grasping the workings of distributed systems, commonly used in data science for handling large datasets and complex computations, is vital.
  • 🔎 Takeaway 9: Proactivity in seeking opportunities and work is key to standing out in the competitive field of data science.
  • 🧠 Takeaway 10: Cultivating a 'data mindset', which involves analytical thinking and the ability to identify issues within datasets, is the most challenging but also the most valuable attribute for a data scientist.

Q & A

  • What is the main focus of the video script?

    -The main focus of the video script is to discuss the complex and rapidly evolving profession of data science, highlighting 10 important points to consider in order to succeed and feel comfortable in the field.

  • Why is documentation considered important in data science and software development?

    -Documentation is important because it helps maintain the understandability and maintainability of code over time. Without proper documentation, teams may lose the ability to work on or understand the code, which can lead to significant financial losses in the industry.

  • What programming languages are emphasized in the script for mastering in data science?

    -The script emphasizes the importance of mastering SQL, Python, and suggests learning Java or Scala as well. Python is recommended as an accessible starting point, with Java or Scala being considered for more advanced or specific needs.

  • What does the script suggest for continuous learning in the field of data science?

    -The script suggests that continuous learning is crucial in data science due to its fast-paced nature. It encourages doing research and staying updated with new concepts and techniques to avoid being left behind by the competition.

  • Why is understanding the business model important for a data scientist?

    -Understanding the business model is important because it allows the data scientist to have a vision of how they can positively impact the business with their work. It helps in making informed decisions that can contribute to the growth and profitability of the company.

  • What role does communication play in the success of a data scientist?

    -Communication plays a vital role as data science is largely a team sport. Effective communication with colleagues, clients, or managers is essential for collaboration and ensuring that the work done by the data scientist aligns with the business goals.

  • Why is being independent important for a data scientist?

    -Being independent is important because it allows a data scientist to advance projects on their own. It shows an ability to work autonomously, which is a valuable skill in a field that requires problem-solving and self-direction.

  • What does the script say about the importance of collaboration in data science?

    -The script emphasizes the importance of collaboration both in terms of communication and technical aspects. It includes understanding how to work with others, comment on code, make code readable, and use documentation to facilitate teamwork.

  • Why should a data scientist understand distributed systems?

    -A data scientist should understand distributed systems because they are widely used in the data science world for processing large amounts of data efficiently. Knowledge of how these systems work is crucial for leveraging cloud services like AWS, Azure, or Google Cloud.

  • What does the script suggest as the most important point for a data scientist?

    -The script suggests that the most important point is having a 'data mindset' or an analytical approach. This mindset involves being able to look at a dataset and identify potential issues and insights, which comes with experience.

  • How does the script encourage viewers to advance their data science career?

    -The script encourages viewers to apply the discussed points to their career, emphasizing the importance of continuous learning, understanding business models, effective communication, and having an analytical mindset. It also offers a free gift in the description for further insights into data science careers.

Outlines

00:00

📘 The Complexity and Evolving Nature of Data Science

This paragraph introduces the video's focus on the intricate and rapidly evolving field of data science. The speaker emphasizes the importance of not just technical skills but also other crucial aspects that contribute to success in this domain. They outline a list of 10 key points to be discussed, which go beyond technical mastery and delve into essential skills such as documentation, continuous learning, and understanding business models. The speaker also encourages viewers to engage with the content by liking, subscribing, and using the notification bell for updates, and teases a free gift that provides further insights into technical skills, diplomas, and salary expectations in data science.

05:01

🔍 Essential Skills for Aspiring Data Scientists

The second paragraph delves into the specific skills and mindset required to excel in data science. It starts with the importance of independence, the ability to work solo and advance projects without constant guidance. Collaboration is highlighted as a key team skill, with the need for clear communication and documentation to facilitate teamwork. Understanding distributed systems and cloud technologies like AWS, Azure, or Google Cloud is identified as crucial for handling big data scenarios. The paragraph also stresses the importance of being proactive and developing a 'data mindset', which involves the analytical ability to identify issues and patterns within datasets.

Mindmap

Keywords

💡Data Science

Data Science is an interdisciplinary field that uses scientific methods, processes, algorithms, and systems to extract knowledge and insights from structured and unstructured data. In the video, the speaker emphasizes the importance of various skills for someone aspiring to be a data scientist, highlighting that it's not just about technical skills but also includes understanding business models and having an analytical mindset.

💡Documentation

Documentation in the context of the video refers to the practice of creating written records or manuals that describe how a system, software, or process works. The speaker mentions that documentation is often underestimated in data science and software development, but it is crucial for maintaining and understanding code over time.

💡SQL

SQL, or Structured Query Language, is a domain-specific language used in programming and designed for managing data held in a relational database management system. The script suggests mastering SQL as one of the key technical skills for a data scientist, as it is fundamental for querying and managing databases.

💡Python

Python is a high-level programming language known for its readability and versatility, making it a popular choice for beginners and experts alike. The video script recommends mastering Python as it is accessible and widely used in data science for tasks such as data analysis and machine learning.

💡Continuous Learning

Continuous learning is the concept of consistently acquiring new knowledge and skills throughout one's life. The speaker stresses the importance of learning something new every day to stay ahead in the fast-paced field of data science, as it helps in adapting to new tools and technologies.

💡Business Understanding

Having a business understanding means being aware of how a company operates, including its business model and profitability. The video emphasizes that a data scientist should not only be technically proficient but also understand the business context to positively impact the company's activities and profitability.

💡Communication

Communication is key in any team-based work environment, and the video script highlights its importance for data scientists when working with colleagues, clients, or managers. Effective communication helps in conveying complex data insights in a clear and understandable manner.

💡Independence

Independence in the context of the video refers to the ability of a data scientist to work autonomously, find solutions on their own, and advance projects without constant supervision. This trait is valued as it contributes to a data scientist's problem-solving skills and overall productivity.

💡Collaboration

Collaboration is the process of working together to achieve a common goal. The script mentions that being able to collaborate effectively, both in terms of communication and technical aspects like code readability and documentation, is essential for a data scientist's success in a team environment.

💡Distributed Systems

Distributed systems are a type of system where components, which can be computers or services, are located on different networks. The video mentions the importance of understanding distributed systems for a data scientist, as they are widely used in data processing and cloud computing environments.

💡Proactivity

Proactivity is the ability to act or initiate something without being prompted by external influences. The speaker encourages data scientists to be proactive in seeking opportunities and taking initiative, which can lead to greater success in the competitive field of data science.

💡Data Mindset

A data mindset refers to the ability to analyze and interpret data to identify patterns, trends, and insights. The video script identifies this mindset as the most important attribute for a data scientist, as it involves seeing the bigger picture and understanding the implications of data for decision-making.

Highlights

The profession of data science is complex, rapidly evolving, and not easy to grasp.

Focus is often on technical skills, but they are not the most important for becoming a fulfilled data scientist.

The importance of documentation in data science and software development to prevent loss of knowledge and billions of dollars.

Mastering SQL and Python is fundamental for a data scientist, with Python being more accessible for beginners.

The necessity of continuous learning and staying updated in the fast-paced field of data science.

Understanding the business model and how a data scientist can positively impact a company's profitability.

The importance of communication skills for collaboration within a team and with clients or managers.

Being independent in problem-solving and advancing projects without constant guidance.

Transcripts

play00:00

bon le métier d'atteindre lumière comme

play00:01

tu sais est un métier très complexe qui

play00:03

évolue très vite et qui n'est pas facile

play00:05

à saisir donc j'ai décidé de faire une

play00:07

vidéo assez cool dans laquelle je te

play00:09

parle de ce que c'est et surtout de 10

play00:11

points qui sont importants à connaître

play00:12

pour tenter à l'aise dans le métier

play00:14

l'idée c'est que on se focus souvent sur

play00:17

la technique bien évidemment c'est

play00:18

important et je vais t'en parler mais

play00:20

c'est pas forcément le plus important

play00:22

c'est pas ce qui t'aidera à devenir

play00:24

d'atteindre venir épanoui et ça

play00:27

justement je veux t'en parler de manière

play00:28

honnête dans cette vidéo et juste avant

play00:31

de te parler de ces 10 points je vais te

play00:33

demander des quatre actions que tu

play00:35

connais c'est mettre un like à la vidéo

play00:37

parce que c'est très important pour le

play00:39

référencement de ces vidéos ensuite

play00:41

c'est abonné à la chaîne parce que si tu

play00:43

apprécies mes vidéos il y a pas de

play00:45

raison que tu t'abonnes pas en vérité la

play00:46

troisième action c'est de mettre la

play00:48

cloche pour être averti de toutes les

play00:49

vidéos qui vont venir dans les semaines

play00:51

à venir et la quatrième action c'est mon

play00:54

cadeau gratuit dans mon cadeau gratuit

play00:56

justement je te parle des compétences

play00:58

techniques pour devenir

play01:02

te parle aussi des diplômes des

play01:05

compétences techniques mais surtout des

play01:07

salaires et crois-moi que les salaires

play01:08

sont assez énormes en data science

play01:11

d'atteindre tu trouveras le tout en

play01:14

description vas-y va choper ça ça dépend

play01:18

que toi dans cette vidéo je voulais

play01:20

vraiment parler de ce qui est pour moi

play01:22

important en tant que vous êtes à venir

play01:24

ça fait longtemps que je suis en

play01:26

informatique donc j'ai souvent je décèle

play01:28

des points souvent des manquements que

play01:30

les gens ont et pour moi ça me choque

play01:32

parce que je me dis comment la personne

play01:34

ne veut pas savoir ça c'est super

play01:35

important de savoir ces points et

play01:37

justement on va commencer par le premier

play01:39

point qui est la documentation la

play01:40

documentation c'est vraiment un point

play01:42

qui est sous estimé en tant que datant

play01:44

du NIR et globalement dans le

play01:45

développement informatique le cycle

play01:47

informatique c'est quoi la plupart du

play01:48

temps une équipe fait un logiciel fait

play01:50

un produit en informatique et après

play01:52

quelques années bah plus personne n'est

play01:54

capable de code plus personne ne

play01:56

comprend le code tout simplement parce

play01:57

qu'il y a pas de documentation donc

play01:59

ouais c'est vraiment pas ouf et ça fait

play02:01

perdre des milliards de dollars

play02:03

l'industrie donc soit un peu différent

play02:06

et fait la documentation je sais que

play02:08

c'est chiant mais je le répète c'est

play02:10

super important de faire la

play02:12

documentation et ça t'aidera à te

play02:14

différencier en tant que dire donc ça

play02:16

c'était mon point numéro 1 mon point

play02:18

numéro 2 j'ai pas la technique et je

play02:21

t'en ai parlé dans les deux vidéos

play02:22

précédentes c'est maîtrise le SQL et

play02:25

maîtrise le python en tout cas maîtrise

play02:27

un langage de programmation soit depuis

play02:29

ton le Java ou le Scala je te conseille

play02:31

de faire du python en premier parce que

play02:32

c'est quand même plus facile d'accès et

play02:34

puis après quelques mois ou années

play02:36

d'expérience de partir sur du Java ou du

play02:38

Scala puis si tu fais les trois bah tu

play02:40

es genre un boss et ça c'est cool pour

play02:42

ta carrière bref la connaissance de ces

play02:45

langages SQL python Scala Java et

play02:48

fondamental pour être à l'aise épanouie

play02:51

et trouver du travail tout simplement en

play02:52

tant que data indien c'est un métier qui

play02:54

avance vite et si tu connais déjà ses

play02:56

bases tu vas pouvoir t'adapter très

play02:57

facilement parce que ce qui avance c'est

play03:00

surtout les outils et pas tant les

play03:01

langages on passe au troisième point le

play03:03

troisième point c'est être capable

play03:04

d'apprendre un peu tous les jours et il

play03:07

faut faire de la veille j'en parle

play03:08

souvent sur cette chaîne mais c'est

play03:09

fondamental de faire de la veille en

play03:12

tant que datant du lien si tu fais pas

play03:13

de la veille tu vas te laisser dépasser

play03:15

tu vas être dépasser en fait et

play03:17

clairement tu vas te faire rouler dessus

play03:19

par la concurrence par tes collègues ou

play03:21

par des gens qui vont être recruter

play03:22

c'est pas une compétition c'est pas un

play03:23

métier de compétitif mais quand même il

play03:25

faut savoir apprendre pour en fait être

play03:28

capable d'apprendre des nouvelles

play03:29

notions un peu tous les jours et ça va

play03:31

vraiment t'aider dans ta carrière et ça

play03:33

c'est vraiment un point très très

play03:35

important qui est souvent sous-estimé

play03:37

par les gens mais souvent parler nouveau

play03:39

qui disent ah bah ça y est je suis

play03:40

arrivé c'est facile mais non il faut

play03:42

vraiment que tu sois capable d'apprendre

play03:45

un peu tous les jours et ça c'est mon

play03:46

troisième point apprend un peu tous les

play03:49

jours quatrième point c'est le business

play03:51

comprend le business un datant de

play03:54

Lignières travaille dans un entreprise

play03:55

donc un business donc il y a un business

play03:57

model il y a une rentabilité à avoir

play03:59

l'idée c'est de comprendre comment le

play04:01

business fonctionne pour justement avoir

play04:04

une vision de comment toi en tant que

play04:07

lumière tu peux impacter positivement du

play04:09

business pour moi par exemple tu

play04:11

travailles avec un produit de toner tu

play04:12

dois également l'aider à justement

play04:14

prendre des décisions business et lui

play04:16

dire ok moi là j'ai une base de données

play04:19

avec des données peut-être que les

play04:20

données financent peut-être que les

play04:22

données activités monétisation peuvent

play04:24

t'aider à justement croître l'activité

play04:26

croître améliorer l'activité la

play04:28

rentabilité de la société c'est

play04:30

important c'est quelque chose qui est

play04:32

souvent négligé par les datant du lien

play04:33

ne pas comprendre le business donc là je

play04:35

te parle de la CP financier mais ça peut

play04:37

être l'aspect amélioré je sais pas une

play04:40

application

play04:41

ergonomie une application etc donc c'est

play04:43

important en tant que génial de

play04:45

comprendre le cœur et de business pour

play04:47

justement l'impact et fortement et

play04:50

correctement donc ça c'était mon

play04:51

quatrième point comprendre le business

play04:53

cinquième point c'est la communication

play04:55

il est fondamental de correctement

play04:58

communiquer avec ensemble de tes

play05:01

collègues de tes clients ou même de ton

play05:03

manager c'est important parce que être

play05:05

d'atteindre être développeur c'est

play05:07

surtout un sport d'équipe mais bref je

play05:10

t'en parle un peu plus loin dans la

play05:11

vidéo donc reste accroché ici parce

play05:13

qu'on en parle un peu plus on va

play05:14

développer un peu plus ça je parlais de

play05:16

collaborer juste avant et justement je

play05:18

vais te dire une chose qui est

play05:19

importante c'est savoir être indépendant

play05:22

en tant que d'atteindre un lien si des

play05:24

métiers qui sont quand même assez

play05:25

indépendant c'est à dire que tu dois

play05:27

être capable de trouver tout seul

play05:28

c'est-à-dire que bien évidemment aussi

play05:31

tu ne comprends pas posé des questions

play05:32

mais quand on te donne un sujet il faut

play05:34

que tu fasses avancer le sujet et plus

play05:36

tu seras indépendant plus tu auras une

play05:39

fête une capacité de travail qui sera

play05:40

qui va aider ton équipe donc être

play05:43

indépendant donc être capable de

play05:44

travailler seul et quelque chose de très

play05:46

important et qui te permettra de

play05:48

différencier évidemment si tu es bloqué

play05:51

ne soit pas timide pose des questions ça

play05:53

c'est évident septième point c'est

play05:55

savoir collaborer je t'en parlais un peu

play05:57

avant sur la communication mais savoir

play05:59

collaborer ses capitales donc je te dis

play06:01

savoir collaborer en termes de

play06:03

communication on sert aussi en termes

play06:04

d'outils il est important de commenter

play06:06

ton code il est important de faire du

play06:09

code lisible il est important de faire

play06:10

la documentation parfois je t'en ai

play06:12

parlé il est aussi important de savoir

play06:13

faire du guide et comprendre comment

play06:15

fonctionnent la collaboration en guide

play06:17

bref collaborer d'un point de vue humain

play06:19

d'un point de vue technique sont des

play06:21

capacités capitales en tant que encore

play06:24

une fois si les métiers qui avancent

play06:25

très vite donc tu dois être capable de

play06:27

voir en fait d'apprendre des autres pour

play06:29

justement éviter de tout apprendre donc

play06:31

ça c'était mon septième point donc pour

play06:34

ce huitième point il est capital de

play06:37

comprendre comment fonctionne un système

play06:38

distribué les systèmes distribués sont

play06:41

très utilisés dans le monde de la data

play06:44

scène c'est du Data parce que c'est

play06:46

vraiment on part sur la logique de

play06:47

diviser pour mieux régner donc faut

play06:49

comprendre comment cette logique de

play06:51

diviser pour mieux régner a été mise en

play06:53

place par des providers par des

play06:55

fournisseurs comme AWS azur ou Google

play06:59

Cloud très important de comprendre les

play07:02

biens de signes de ces technologies en

play07:05

tant que datant à venir mais pas que

play07:06

parce que aussi les Data scientistes

play07:08

États-Unis ils utilisent ces

play07:09

technologies donc peut être amené à

play07:11

comprendre et analyser ces systèmes

play07:13

neuvième point il faut être proactif oui

play07:17

parce que dans le monde de taille il y a

play07:19

énormément de travail il y a énormément

play07:21

de Job et d'opportunités et plus vous

play07:24

êtes proactif plus tu es proactif plus

play07:26

tu vas vraiment tirer ton épingle du jeu

play07:29

et vraiment pouvoir devenir un vrai

play07:31

datant de généreux dixième point qui est

play07:34

pour moi le point le plus important

play07:35

c'est l'esprit data c'est probablement

play07:39

l'élément le plus difficile à acquérir

play07:42

mais cet esprit vient avec l'expérience

play07:44

et si je devais définir concrètement

play07:46

c'est être capable de voir un jeu de

play07:48

données et de voir les problématiques

play07:51

qui ce que tu rencontreras dans ce jeu

play07:53

de données parce que tu constates qu'il

play07:54

y a beaucoup de gens à nuls beaucoup

play07:57

trop de données sur une certaine date

play07:58

des doublons etc donc ça c'est vraiment

play08:00

un esprit data un esprit analytique qui

play08:03

s'acquiert avec l'expérience et qui est

play08:05

très important à avoir surtout pour

play08:08

devenir d'atteindre venir donc voilà

play08:10

avec ces 10 points je voulais vraiment

play08:12

te parler des compétences qui te font

play08:15

devenir un vrai tatin général parce que

play08:17

clairement sinon tu peux apprendre plein

play08:20

de technologies mais tu te sens très

play08:22

toujours pas à l'aise dans le métier de

play08:23

Data indien c'est des points qui peuvent

play08:25

être utiles à des tasser un tisses ou

play08:27

data Naïs donc pareil data c'est un

play08:29

artiste est un analyste et n'hésitez pas

play08:31

à prendre ces points pour justement

play08:32

booster bah votre carrière forcément sur

play08:36

ces 10 points j'espère que ces 10 points

play08:38

ton service ils vont te servir dans ta

play08:40

carrière bien évidemment tu trouveras

play08:43

comme d'habitude mon cadeau gratuit en

play08:45

description ou tu trouveras plein

play08:47

d'informations sur les métiers de la

play08:49

data ne fais pas le timide et va choper

play08:51

sur ce je te laisse c'était Willis pour

play08:54

d'autres from scratch bye

Rate This

5.0 / 5 (0 votes)

Related Tags
Data ScienceCareer TipsTechnical SkillsSQL MasteryPython ProficiencyContinuous LearningBusiness UnderstandingCommunicationTeamworkDistributed SystemsProactivity