O que é CORRELAÇÃO e como analisar os Gráficos

Nerd dos Dados
14 Oct 202214:05

Summary

TLDRIn this informative video, creator Jefferson explains the concept of correlation in data science, emphasizing its importance in predictive modeling and machine learning. He illustrates how to measure and interpret the strength and direction of correlations between variables using the correlation coefficient, ranging from -1 to 1. Through examples and visual aids like scatter plots and heat maps, viewers learn to identify weak, strong, and perfect correlations, and understand their significance in building intelligent models.

Takeaways

  • 📊 Correlation is a vital concept in data science, measuring the relationship between two variables.
  • 🔢 The correlation is quantified by a coefficient that ranges from -1 to 1, indicating the strength and direction of the relationship.
  • 📈 A value close to 1 suggests a strong positive correlation, while a value near -1 indicates a strong negative correlation.
  • ↔️ A correlation coefficient of exactly 1 or -1 represents a perfect positive or negative correlation, respectively.
  • ➡️ As the script explains, a correlation of around 0 implies no correlation or a null relationship between variables.
  • 📈 The script uses scatter plots to visually demonstrate the correlation between variables, such as the relationship between car age and value.
  • 🚗 An example provided shows a positive correlation between car age and its value, indicating that newer cars have higher values.
  • 🔍 The script also illustrates a negative correlation, such as between car engine size (cylinders) and fuel consumption, where larger engines tend to consume more fuel.
  • 📊 The Hit map is introduced as a visual tool to interpret correlation coefficients, showing the strength of relationships through color gradients.
  • 📉 The diagonal of the Hit map always shows a correlation of 1, representing the relationship of a variable with itself.
  • 🔑 Understanding correlation is crucial for predictive modeling in machine learning and artificial intelligence, as it helps in assigning weights and metrics to variables.

Q & A

  • What is the main topic of the video script?

    -The main topic of the video script is explaining the concept of correlation in data science, its importance, and how to interpret it through graphs.

  • Who is the creator of the channel mentioned in the script?

    -The creator of the channel is Jefferson.

  • What is the purpose of the correlation coefficient in data science?

    -The correlation coefficient is used to measure the relationship between two variables, indicating the strength and direction of the correlation.

  • What does a correlation coefficient value close to 1 or -1 indicate?

    -A correlation coefficient value close to 1 indicates a strong positive correlation, while a value close to -1 indicates a strong negative correlation.

  • What is the significance of a correlation coefficient value of exactly 1 or -1?

    -A correlation coefficient of exactly 1 indicates a perfect positive correlation, while a value of exactly -1 indicates a perfect negative correlation.

  • What does a correlation coefficient value near 0 represent?

    -A correlation coefficient value near 0 represents no correlation or a null correlation between the variables.

  • How can one visualize the correlation between two variables using a scatter plot?

    -In a scatter plot, the correlation between two variables can be visualized by observing the direction and slope of the line formed by the plotted points. A positive correlation will have an upward slope, while a negative correlation will have a downward slope.

  • What is a hit map graph and how is it used in the context of the script?

    -A hit map graph is a visual representation that shows the correlation coefficients of variables in a matrix format, with colors indicating the strength of the correlation. It is used to quickly identify strong and weak correlations between variables.

  • What is the significance of correlation in predictive modeling and machine learning?

    -Correlation is significant in predictive modeling and machine learning because it helps algorithms identify which variables are related to each other and should be given more weight in the model's mathematical function.

  • How does the script suggest to determine if a correlation is strong or weak?

    -The script suggests using a scatter plot to visually determine if a correlation is strong or weak, and also mentions that a correlation coefficient above 0.6 is considered strong, above 0.8 is very strong, and at 1 is perfect.

  • What is the role of the correlation coefficient in exploratory data analysis?

    -In exploratory data analysis, the correlation coefficient helps in identifying relationships between variables, which can be crucial for understanding data patterns and making informed decisions in further analysis.

Outlines

00:00

📊 Introduction to Correlation in Data Science

In this introductory segment, the speaker, Jefferson, creator of the channel, explains the concept of correlation in data science. He discusses the importance of understanding how variables relate to one another, whether one variable's increase leads to another's decrease or vice versa. The speaker introduces the correlation coefficient, a numerical value ranging from -1 to 1, to measure the strength and direction of the relationship between variables. A value close to 1 indicates a strong positive correlation, while a value close to -1 indicates a strong negative correlation. The speaker also mentions that a value near zero suggests no correlation. He uses graphical illustrations to help viewers understand these concepts better and promises to demonstrate how to identify and interpret correlations through graphs in the subsequent parts of the video.

05:02

📈 Understanding and Visualizing Positive and Negative Correlations

This paragraph delves deeper into the concept of positive and negative correlations, providing examples and visual explanations. The speaker explains that a strong positive correlation is indicated when the correlation coefficient is above 0.6, with 0.8 and above being considered very strong, and a perfect correlation being represented by the value 1. He uses scatter plots to illustrate the correlation between car age and its value, showing a positive correlation as newer cars have higher values. Conversely, a negative correlation is demonstrated using cylinders and car fuel consumption per liter, where an increase in engine power leads to a decrease in fuel efficiency. The speaker emphasizes the importance of visual representation through graphs for easy interpretation of correlation strength and direction.

10:03

📉 Evaluating Correlation Strength with Heat Maps and Hit Maps

In this segment, the speaker discusses how to evaluate the strength of correlations using heat maps and hit maps. He explains that these graphical tools can visually represent the correlation coefficients, making it easier to identify strong and weak correlations at a glance. The speaker provides examples of how to interpret these maps, pointing out that the diagonal of the hit map always shows a correlation of 1, as it represents the relationship of a variable with itself. He also demonstrates how to find the correlation between different variables, such as between car age and cylinders, and how to understand the color coding in heat maps to quickly assess the strength of correlations. The speaker concludes by emphasizing the importance of correlation in predictive modeling and machine learning, as it helps algorithms assign weights and metrics based on the relationships between variables.

Mindmap

Keywords

💡Correlation

Correlation is a statistical term that refers to a measure that expresses the extent to which two variables are linearly related. In the context of the video, it is the main theme, explaining how variables can be positively or negatively related. For example, the script discusses how 'ano' (year) and 'valor de tabela' (table value) have a positive correlation, meaning as the year increases, the value also increases.

💡Coefficient of Correlation

The coefficient of correlation is a numerical value that represents the strength and direction of the linear relationship between two variables. The script mentions that this coefficient ranges from -1 to 1, where values close to 1 or -1 indicate strong positive or negative correlations, respectively. For instance, the video uses the coefficient to quantify the relationship between car 'cilindradas' (cylinders) and 'consumo por litro' (consumption per liter).

💡Data Science

Data Science is a field that uses scientific methods, processes, algorithms, and systems to extract knowledge and insights from data. The video is set within the realm of data science, as it discusses the importance of understanding correlation in analyzing data and making predictions, which is a fundamental aspect of this field.

💡Scatter Plot

A scatter plot is a type of plot that shows the relationship between two variables. The video script describes generating a scatter plot to visualize the correlation between 'ano' and 'cilindradas', and another between 'ano' and 'valor de tabela', using these plots to illustrate the presence or absence of correlation.

💡Positive Correlation

Positive correlation refers to a relationship between two variables where an increase in one variable is associated with an increase in the other. The script provides an example of this with the relationship between the 'ano' of a car and its 'valor de tabela', indicating that newer cars generally have higher values.

💡Negative Correlation

Negative correlation is the opposite of positive correlation, where an increase in one variable is associated with a decrease in the other. The video explains this concept using the relationship between 'cilindradas' and 'consumo por litro', showing that as the engine size increases, the fuel efficiency decreases.

💡Machine Learning

Machine learning is a subset of artificial intelligence that provides systems the ability to learn and improve from experience without being explicitly programmed. The video emphasizes the importance of correlation in machine learning models, as these models use correlations between variables to make predictions and decisions.

💡Heatmap

A heatmap is a graphical representation of data where individual values are represented as colors. The script describes using a heatmap to visualize the coefficients of correlation, providing a quick and intuitive way to understand the strength and direction of correlations between different variables.

💡Data Frame

In the context of data science and programming, a data frame is a two-dimensional data structure with labeled columns. The video mentions importing a data frame to demonstrate the concept of correlation, using it to store and manipulate the example data for visualization.

💡Correlation Coefficient

The correlation coefficient is a statistical measure that indicates the extent of the linear relationship between two variables. The script explains that a coefficient of exactly 1 or -1 indicates a perfect positive or negative correlation, respectively, while values closer to 0 suggest a weaker correlation.

💡Exploratory Data Analysis

Exploratory Data Analysis (EDA) is the process of analyzing data sets to summarize their main characteristics, often with visual methods. The video script uses EDA to identify correlations between variables, which is a critical step in understanding the data before building predictive models.

Highlights

Correlation is a crucial concept in data science, measuring the relationship between variables.

The video explains what correlation is, its purpose, and how to interpret it through graphs.

Correlation is identified through a coefficient that ranges from -1 to 1, indicating the strength and direction of the relationship.

A value close to 1 signifies a strong positive correlation, while a value near -1 indicates a strong negative correlation.

A correlation coefficient of exactly 1 or -1 denotes a perfect positive or negative correlation, respectively.

Scatter plots are used to visually assess the correlation between two variables.

A flat line in a scatter plot suggests no correlation between the variables.

An upward-sloping line indicates a positive correlation, while a downward-sloping line suggests a negative correlation.

Correlation coefficients can be interpreted as weak, moderate, or strong based on their values relative to 0, 0.6, and 0.8.

The video provides an example of a positive correlation between car age and its trade-in value.

A negative correlation example is given with car engine size and fuel consumption per liter.

Heat maps are introduced as a visual tool to represent correlation coefficients between variables.

Diagonal values in a heat map always show a correlation of 1, as they represent the relationship of a variable with itself.

The video demonstrates how to interpret heat maps to understand the strength of correlations.

Correlation is essential for building predictive models in machine learning and artificial intelligence, as it helps in assigning weights and metrics.

The video encourages viewers to subscribe for detailed, step-by-step content and source code availability.

The presenter offers to answer questions and suggestions in the comments section for further clarification.

Transcripts

play00:00

Você já ouviu falar ou você sabe o que é

play00:02

correlação ou seja correlação entre

play00:05

variáveis a correlação ela é muito

play00:07

importante dentro da ciência de dados

play00:09

Então nesse vídeo eu quero te explicar

play00:11

tudo bem detalhes O que é correlação

play00:13

para que ela serve e como que a gente

play00:16

interpreta isso identifica isso através

play00:18

de gráficos Então bora lá aprender vem

play00:20

comigo

play00:23

Olá se você ainda não me conhece meu

play00:25

nome é Jefferson eu sou o criador do

play00:27

canal e aqui comigo Você é muito

play00:29

bem-vindo Bora colocar a mão na massa

play00:31

aqui entender o que que é correlação

play00:33

vamos lá primeiramente eu não vou ler

play00:35

aqui eu vou te explicar o seguinte com

play00:37

relação nada mais é do que uma relação

play00:39

que uma variável tem com outra ou seja o

play00:43

valor de uma variável aumenta o outro

play00:45

valor diminui ou vice-versa tem alguma

play00:48

causa algum Impacto uma variável com a

play00:51

outra então a correlação nada mais é do

play00:53

que é mensurar através do seu

play00:55

coeficiente de correlação Qual que é a

play00:58

relação de uma variável com outra e

play01:00

quando a gente tá ali interpretando E

play01:03

analisando as variáveis se tem

play01:05

correlação uma com a outra a gente

play01:07

utiliza para medir isso o coeficiente de

play01:10

relação que é um número que vai de um a

play01:12

menos um nunca vai ser menor que menos

play01:15

um e nunca vai ser maior que um e a

play01:18

gente diz o seguinte quando o valor É

play01:20

próximo de um ou se aproxima de um é um

play01:24

se diz que existe uma correlação forte

play01:27

positiva e quando a correlação o valor

play01:30

se aproxima de -1 significa e a gente

play01:34

diz que existe uma correlação forte

play01:36

negativa através desse imagem aqui a

play01:39

gente consegue ilustrar melhor Olha lá

play01:41

aqui no zero é quando não existe

play01:44

correlação ou a correlação é nula eu vou

play01:47

te mostrar mais abaixo os gráficos e te

play01:49

explicar como interpretá-los mas aqui é

play01:51

o seguinte mas quando a gente tem aqui

play01:53

por exemplo a correlação mais próxima de

play01:56

-1 a gente tem uma correlação negativa

play01:58

forte ou uma correlação forte negativa

play02:01

né cada pessoa fala de um jeito mas o

play02:03

conceito em si é esse tá e quando a

play02:06

gente tem ali o valor próximo de um a

play02:09

gente tem uma correlação positiva forte

play02:11

é uma correlação forte positiva quando é

play02:14

exatamente um ou menos um se diz que é

play02:17

uma correlação negativa perfeita e

play02:20

quando é um exatamente um coeficiente de

play02:23

correlação se diz que é uma correlação

play02:25

positiva perfeita Então olha lá agora

play02:28

para a gente montar os nossos gráficos

play02:30

aqui a gente vai importar os pacotes só

play02:32

para a gente poder gerar os gráficos ali

play02:33

a gente vai importar esse arquivo aqui

play02:36

tá que vai ser o nosso Data Frame vamos

play02:39

visualizar então aqui é um Data Frame de

play02:42

exemplos com números de exemplos Não se

play02:44

apegue a o valor desse carro é esse

play02:47

mesmo há um ano desse carro custa isso

play02:50

mesmo não aqui os valores são apenas

play02:53

para a gente demonstrar ali as

play02:55

correlações Ok Então olha lá aqui se a

play02:57

gente gerar aqui um gráfico Descartes

play03:00

plot quando a gente gera um gráfico de

play03:03

caterpórter entre duas variáveis aqui a

play03:06

gente tá comparando aqui ó no eixo X

play03:08

nosso eixo X é o horizontal e o nosso Y

play03:12

é o eixo vertical então quando a gente

play03:14

gera um Skater plot a gente tá fazendo o

play03:18

seguinte a gente tá querendo ver a

play03:21

correlação da variável cilindradas

play03:23

uma variável ano pode observar que aqui

play03:26

olha a linha como ela tá aqui ó ou seja

play03:29

isso não tem correlação a gente diz que

play03:31

é uma correlação nula não existe aqui

play03:33

relação nenhuma entre a variável ano e a

play03:36

variável cilindradas uma não tem relação

play03:39

nenhuma com a outra tá então aqui a

play03:41

gente tem uma correlação neutra uma

play03:43

correlação nulo ou seja não existe com

play03:45

relação agora vamos ver um outro exemplo

play03:47

aqui agora a gente vai querer avaliar a

play03:49

variável ano em relação ao valor de

play03:52

tabela Olha lá se a gente gerar aquilo

play03:54

um gráfico novamente Opa aqui já tem uma

play03:57

correlação e como que a gente interpreta

play04:00

esse gráfico né aqui olha só aqui a

play04:03

gente tem o ano e o valor de tabela

play04:05

então a medida que o ano aqui vai

play04:08

aumentando os valores aqui do veículo no

play04:11

caso o valor da tabela ele também

play04:12

aumenta ou seja aqui ó por exemplo nos

play04:16

pontinhos aqui são os dados tá onde a

play04:19

gente tem os nossos dados então em 2015

play04:22

por exemplo se tem um carro ali no que o

play04:25

ano dele é 2015 o valor de tabela dele

play04:28

tá em torno de 25 mil se aumentou o ano

play04:32

Ou seja que o carro é mais novo então

play04:34

consequentemente o valor dele é mais

play04:36

caro 2017 2018 2019 2020 e assim por

play04:41

diante ou seja a cada ano que aumenta ou

play04:45

seja conforme o carro vai ser no mais

play04:46

novo significa que o valor do preço dele

play04:49

tá aumentando tá vendo Então aqui a

play04:52

gente tem uma correlação e é uma

play04:55

correlação positiva a gente não sabe

play04:58

ainda se é forte ou se não é porque a

play05:01

gente pode ter uma correlação média tá

play05:04

uma correlação forte é quando tá acima

play05:07

de 0.6 aí já é considerado uma

play05:09

correlação forte uma correlação acima de

play05:12

0.8 é considerado muito forte e quando a

play05:16

correlação é um é considerado perfeita

play05:18

então ali ó acima de meio né 0.5 0.6

play05:23

com relação já forte que nos modelos de

play05:26

machine learning já tem muita relevância

play05:28

Então olha lá aqui a gente já conseguiu

play05:30

ver que a medida que o ano aumenta ou

play05:33

seja o carro é mais novo o valor aumenta

play05:35

então aqui a gente Já identificou que

play05:37

existe uma correlação positiva e antes

play05:39

da gente prosseguir agora que avaliar os

play05:43

outros gráficos de correlação eu quero

play05:45

dizer caso você ainda não seja inscrito

play05:47

se escreve aqui no canal Porque toda

play05:49

segunda quarta e sexta eu posso vídeos

play05:51

novos sempre com conteúdo bem detalhado

play05:54

tudo passo a passo na prática e ainda

play05:57

disponibiliza os códigos fonte para

play05:59

vocês então se inscreve aqui porque eu

play06:01

creio que isso vai te ajudar bastante e

play06:03

vamos voltar aqui agora e continuar

play06:05

analisando nossas correlações agora

play06:07

vamos ver se outro exemplo aqui que vai

play06:10

gerar uma correlação negativa olha só

play06:12

aqui nesse caso a gente tem uma

play06:14

correlação negativa porque a gente tá

play06:17

comparando ali a cilindradas com o

play06:20

consumo por litro do carro ou seja

play06:22

quantos quilômetros faz por litro agora

play06:24

aqui é o contrário Então como que eu sei

play06:26

primeiramente é pela linha tá vendo aqui

play06:29

a linha ela está ao contrário dessa

play06:31

linha aqui então aqui é correlação é

play06:33

positiva A linha está subindo aqui como

play06:36

a correlação é negativa A linha está

play06:38

descendo E aí o que significa né A

play06:42

medida que o meu carro aumenta a

play06:44

potência o consumo dele ou seja fica

play06:47

pior diminui Então olha só se eu tiver

play06:50

aqui um carro de 1000 cilindradas que tá

play06:54

aqui bem abaixo tá vendo no eixo Y Eu

play06:56

tenho um carro 1.0 quantos quilômetros

play06:59

por litro faz esse carro 12 agora por

play07:02

exemplo eu aumentei a potência do meu

play07:04

carro para 1.6 potência do carro 1.6

play07:07

quanto que ele gasta 10 tá vendo já

play07:09

diminuiu Eu aumentei a potência para 2.0

play07:13

então quanto com carro 2.0 faz por litro

play07:16

6 e um carro 2.4 Ah tá fazendo 4 Km por

play07:21

litro então a medida que aumentando aqui

play07:24

a potência eu tô diminuindo meu consumo

play07:28

aqui tá vendo aqui são os pontos de

play07:30

dados né Onde tá o nosso nosso valor ali

play07:33

do Data Frame então a medida que eu

play07:35

aumento aqui ó essa potência esse eixo

play07:38

aqui que é o eixo Y A minha variável X

play07:41

em vez de aumentar ela tá diminuindo

play07:44

certo consumo aqui ó ele tá consumindo

play07:47

mais então tem uma correlação negativa e

play07:51

agora como que eu sei se a correlação é

play07:54

forte negativa forte positiva aqui eu já

play07:57

deixei marcado Tá vendo porque eu vou

play07:59

disponibilizar aqui esse aqui para você

play08:02

fazer no download tanto o arquivo aqui

play08:04

como conjunto de dados para vocês

play08:05

poderem fazer aí na máquina de vocês tá

play08:08

mas para a gente avaliar que se ela é

play08:10

forte se ela é fraca como que a gente

play08:12

faz aqui se a gente pegar o nosso Data

play08:15

Frame e colocar aqui ó esse método cor

play08:18

co-r Abrir fechar parênteses a gente tem

play08:21

aqui os coeficientes de relação ele vai

play08:24

nos mostrar que o coeficiente de relação

play08:26

de cada variável Agora imagina se você

play08:28

tiver milhares milhões de dados aqui a

play08:31

gente tem 1520 só para demonstrar mas

play08:34

você vai ficar olhando aqui tudo e

play08:36

fazendo conta para calcular ali ver se o

play08:39

coeficiente é forte ou não não tem

play08:41

necessidade disso porque através de

play08:43

gráficos a gente verifica isso um

play08:45

gráfico muito legal da gente Observar

play08:47

isso que a gente bate o olho já

play08:48

interpreta isso é o gráfico de Hit map

play08:51

Olha lá eu vou gerar aqui para gerar Ele

play08:53

é bem simples tá aqui ó eu só tô

play08:55

determinando o tamanho aqui que vai ser

play08:58

o gráfico na tela e aqui ó é que eu tô

play09:01

gerando o gráfico com Ciborne a gente

play09:03

gera que o hit map né E vai passar os

play09:06

dados ele vai gerar um gráfico para nós

play09:07

eu vou mostrar aqui para vocês como aqui

play09:10

o intuito é só demonstrar e falar sobre

play09:12

a correlação e não sobre como gerar

play09:15

gráfico Como deixar os gráficos melhores

play09:17

mais visualmente ali atrativos eu já fiz

play09:21

um outro vídeo eu vou deixar o link aqui

play09:22

na descrição que é um vídeo onde eu

play09:25

mostro como gerar mais de 40 tipos de

play09:27

gráfico diferente é bem legal vale a

play09:29

pena dar uma olhada e olha lá aqui a

play09:31

gente tirando agora esse Hit map Olha o

play09:33

que que a gente tem então aquele gera o

play09:35

gráfico de Hit map para nós e como que a

play09:37

gente interpreta isso né pode observar

play09:39

que tanto no eixo Y como no eixo X nós

play09:43

temos as mesmas variáveis certo ó são

play09:45

exatamente as mesmas só que ele coloca

play09:48

aqui os coeficientes de correlação e

play09:51

aqui ó o gráfico ele nos mostra um

play09:53

termômetro Ou seja a cor mais clarinha

play09:55

aqui a correlação está em um tá aqui ó

play10:00

que não é menos um aqui ó esse pontinho

play10:03

Aqui é do termômetro tá então aqui é um

play10:06

e Aqui ó pode observar que aqui a gente

play10:08

tem ó no caso aqui o -1 - 75 - 50 - 25 e

play10:14

aí como que a gente interpreta isso Bom

play10:16

primeiramente é que sempre na diagonal

play10:18

você vai ter um porque no caso aqui ó é

play10:23

com relação da variável ano com ela

play10:26

mesmo tá ano com um ano sempre vai ser

play10:30

um aqui a mesma coisa cilindradas com

play10:32

cilindradas vai ser um e assim por

play10:35

diante então sempre a diagonal vai ser

play10:36

um agora por exemplo eu quero ver a

play10:39

variável ano a correlação dela com a

play10:43

variável cilindradas Então qual que é a

play10:46

correlação dela com a variável

play10:47

cilindradas é aqui ó

play10:50

0.005 menos

play10:53

0.005 pode ver que ele tá rosa ou seja

play10:56

ele tá meio que muito próximo de zero

play10:59

que é 0.005 tá então se a gente pegar lá

play11:04

uma correlação que a gente viu aqui no

play11:06

nosso escape

play11:07

cilindradas com consumo por litro se a

play11:11

gente olhar aqui ó se ligadas aqui e

play11:14

consumo por litro então a gente vem aqui

play11:16

ó por litro

play11:18

cilindrada cilindrada consumo por litro

play11:22

Olha onde bate aqui ó

play11:24

0.96 ela tá próximo da onde a de uma

play11:27

correlação muito forte né não é isso que

play11:30

o gráfico aqui ó nos mostrou aí a gente

play11:33

olhando aqui ó esse valor do coeficiente

play11:36

de correlação a gente sabe que ela é

play11:39

muito forte né ela é forte vamos pegar

play11:41

um outro exemplo que a gente viu de

play11:43

correlação positiva Olha lá valor de

play11:45

tabela com um ano Então vamos olhar lá

play11:48

interpretar isso no nosso Hit map de

play11:50

correlação Então olha lá o ano com o

play11:54

valor tabela certo ó

play11:56

0.98 aqui ó variável ano com valor

play11:59

tabela tá vendo com valor tabela 0.98

play12:03

Aonde tá aqui ó próximo de um então é

play12:06

uma correlação forte positiva e as

play12:08

outras variáveis a gente interpreta da

play12:10

mesma forma a essa variável aqui ó olha

play12:14

lá tá vendo eu tenho

play12:17

0.45 de ela já tá quase ali sendo forte

play12:21

né mas vamos pegar uma que tem um

play12:23

pouquinho mais deixa eu ver aqui ó uma

play12:26

correlação essa aqui ó 0.8 ela já tá bem

play12:30

forte tá vendo o próximo de um se a

play12:32

gente pegar aqui ó cilindradas né com

play12:35

peso ali do veículo ela dá 0.85 vamos

play12:39

gerar um escape aqui para a gente ver eu

play12:42

vou copiar aqui ó vou colocar aqui

play12:44

embaixo só para a gente gerar então aqui

play12:46

ó é cilindradas cilindradas com nome da

play12:51

variável é peso kg Olha lá vamos gerar

play12:54

aqui ó olha lá tá vendo mostrou aqui

play12:58

para nós uma correlação positiva

play13:00

exatamente o que a gente tem aqui ó peso

play13:03

com a cilindrada da 0.85 E ela tá bem

play13:07

próximo de um Então ela é forte Então

play13:09

ela é uma correlação aqui positiva forte

play13:13

viu que legal e viu como é fácil

play13:15

interpretar isso eu quis trazer para

play13:17

vocês alguns muito simples mas tudo bem

play13:20

detalhado passo a passo porque

play13:22

correlação é algo muito importante

play13:23

porque porque quando a gente tá montando

play13:25

modelos preditivos modelos de machine

play13:28

learning modelos de Inteligência

play13:29

Artificial quando os algoritmos ali eles

play13:32

estão trabalhando para criar a sua

play13:34

função matemática ali do modelo

play13:36

preditivo Ele sempre vai olhar as

play13:38

variáveis numéricas as variáveis que tem

play13:41

correlação entre si Ou seja que se

play13:44

relacionam entre si e com base nisso ele

play13:46

vai atribuindo pesos e métricas para

play13:48

isso por isso que ela é tão importante

play13:51

e a gente fazendo uma análise

play13:53

exploratória sabendo identificar isso

play13:54

isso nos ajuda muito se você ficou com

play13:57

alguma dúvida eu tiver alguma sugestão

play13:59

deixa para mim aqui nos comentários que

play14:00

eu te respondo mais rápido possível

play14:02

Muito obrigado e até o próximo vídeo

Rate This

5.0 / 5 (0 votes)

Related Tags
Correlation AnalysisData ScienceMachine LearningPredictive ModelingCorrelation CoefficientScatter PlotData VisualizationStatistical ConceptsVideo TutorialEducational Content