Estatística Básica para Ciência de Dados

Nerd dos Dados
18 Oct 202315:58

Summary

TLDREl script ofrece una introducción a las medias móviles, una técnica estadística utilizada en el análisis de series temporales. El presentador, Jeferson, explica cómo identificar tendencias en datos a lo largo del tiempo, con aplicaciones en áreas como la logística y la finanza. Se muestra cómo generar datos aleatorios en Python utilizando pandas y random, y luego calcular medias móviles para evaluar periodos de tiempo específicos. Se ilustra el proceso paso a paso, incluyendo la creación de un DataFrame y el uso del método Rolling para calcular la media móvil de ventanas de tiempo variadas. El objetivo es proporcionar una guía práctica para que los espectadores puedan implementar el análisis de medias móviles en sus propios proyectos.

Takeaways

  • 😀 El video ofrece una introducción al concepto de la media móvil en estadísticas y cómo aplicarla en Python.
  • 📈 Se explica que la media móvil es una herramienta utilizada para identificar tendencias en conjuntos de datos de series temporales.
  • 🛠️ El video muestra cómo utilizar Python para trabajar con medias móviles, incluyendo la importación de paquetes como pandas y random.
  • 📅 Se crea un conjunto de datos utilizando pandas, estableciendo un rango de fechas y generando datos aleatorios para pruebas.
  • 🔢 Los datos generados incluyen ventas en dinero y cartão, y se etiquetan con información de fecha, tipo de día y forma de pago.
  • 🗓️ Se utiliza la función `date_range` de pandas para establecer el período de tiempo para el análisis.
  • 📊 Se muestra cómo agregar datos a una lista y luego convertir esa lista en un DataFrame de pandas para su análisis.
  • 🔧 Se abordan comandos de Python para manipular y analizar los datos, como el uso de bucles `for` y funciones de agregación.
  • 📉 El video destaca el uso de la función `Rolling` en pandas para calcular la media móvil de un conjunto de datos.
  • 📈 Se ejemplifica el cálculo de medias móviles para diferentes ventanas de tiempo, como 2 días, 3 días y 7 días.
  • 📝 Se enfatiza la importancia de la media móvil en áreas como la logística, supply chain, recursos humanos, compras y finanzas.

Q & A

  • ¿Qué es un concepto de estadística que se discute en el script del video?

    -El concepto de estadística discutido en el script es la 'media móvil'.

  • ¿Para qué se utilizan las medias móviles según el script?

    -Las medias móviles se utilizan para identificar la tendencia de un conjunto de datos en una serie temporal, como en análisis de ventas, cantidad de stock, etc.

  • ¿En qué áreas se pueden aplicar las medias móviles según el video?

    -Las medias móviles se pueden aplicar en áreas como logística, supply chain, recursos humanos, compras y logística, especialmente en el área financiera como acciones y bolsa de valores.

  • ¿Qué es lo primero que se hace para trabajar con la media móvil en Python según el script?

    -Lo primero que se hace es importar los paquetes 'pandas' y 'numpy' para generar datos y trabajar con ellos.

  • ¿Cómo se crea el conjunto de datos para evaluar la media móvil en el script?

    -Se crea un conjunto de datos utilizando un bucle 'for' para iterar sobre un rango de fechas y generar datos aleatorios para las ventas.

  • ¿Cómo se identifica si es un día laborable o un fin de semana en el script?

    -Se utiliza la función 'WeekDay' para identificar el día de la semana y si es mayor que cuatro (sábado o domingo), se identifica como un fin de semana.

  • ¿Qué función de pandas se utiliza para convertir una lista en un DataFrame?

    -Se utiliza la función 'pd.DataFrame' para convertir una lista en un DataFrame.

  • ¿Qué función de pandas permite calcular la media móvil de un DataFrame?

    -La función 'Rolling' de pandas permite calcular la media móvil de un DataFrame.

  • ¿Cómo se calcula la suma de las ventas para un rango de tiempo específico en el script?

    -Se utiliza la función 'Rolling' con un parámetro de ventana para sumar las ventas de un rango de tiempo específico y se almacena en una nueva columna.

  • ¿Cómo se calcula la media móvil de 7 días para las ventas en el DataFrame según el script?

    -Se utiliza la función 'Rolling' con un parámetro de ventana de 7 días y se especifica que se debe usar la columna 'data' para la ventana y la columna 'qtd_vendas' para calcular la media.

  • ¿Qué función de pandas permite realizar operaciones como sumar o calcular la media móvil?

    -La función 'Rolling' de pandas permite realizar operaciones como sumar o calcular la media móvil.

  • ¿Cómo se puede utilizar la media móvil para análisis en diferentes áreas de negocio?

    -La media móvil puede utilizarse para realizar análisis temporales en diferentes áreas de negocio, como la evaluación de tendencias de ventas, el monitoreo de inventarios y la predicción de movimientos en el mercado financiero.

Outlines

00:00

📊 Introducción a las Medias Móviles con Python

El primer párrafo presenta el tema principal del video, que es la explicación de las medias móviles y su aplicación en el análisis temporal de datos utilizando Python. El orador, Jeferson, creador del canal, se presenta y se compromete a mostrar paso a paso cómo utilizar las medias móviles en Python. Se menciona que las medias móviles son útiles para identificar tendencias en series temporales y son aplicables en áreas como logística, supply chain, recursos humanos, compras y finanzas. Se habla de la importancia de prestar atención al proceso y se anuncia la creación de un conjunto de datos para ilustrar el concepto.

05:01

🔢 Creación de un Conjunto de Datos con Python

En el segundo párrafo, el script se centra en la creación de un conjunto de datos en Python. Se describe el proceso de importación de los paquetes 'pandas' y 'numpy', y se utiliza la función 'date_range' para generar un rango de fechas. Luego, se crea una lista vacía llamada 'dados' para almacenar los datos. Se implementa un bucle 'for' para recorrer el rango de fechas y, dentro de este bucle, se generan valores aleatorios para las ventas en efectivo y con tarjeta, así como se determina si el día es fin de semana o no. Estos datos se anexan a la lista 'dados' con información sobre la fecha, el tipo de día y las ventas.

10:01

📈 Análisis de Medias Móviles con Pandas

El tercer párrafo se enfoca en el análisis de medias móviles utilizando el paquete 'pandas'. Se explica cómo se puede utilizar la función 'Rolling' para calcular la suma y la media móvil de los datos. Se muestra cómo crear columnas adicionales en el DataFrame para almacenar los resultados de las sumas y medias móviles de diferentes ventanas de tiempo, como dos días o tres días. Se ejemplifica con código cómo se realiza el cálculo y se visualiza el DataFrame resultante con las nuevas columnas.

15:02

👨‍🏫 Conclusión y Recursos Adicionales

El último párrafo del script es una conclusión donde el orador anima a los espectadores a suscribirse al canal y activar las notificaciones para recibir nuevos contenidos. También se menciona la intención de proporcionar material adicional y código fuente para ayudar a los espectadores a comprender mejor las medias móviles y su implementación en Python. Se ofrecen recursos adicionales sobre listas y bucles 'for' y se invita a los espectadores a dejar comentarios con preguntas o sugerencias.

Mindmap

Keywords

💡Média Móvel

La 'Média Móvel' es un concepto estadístico utilizado para identificar la tendencia de un conjunto de datos en una serie temporal. En el video, se utiliza para analizar datos como cantidades de ventas o valores en diferentes períodos de tiempo, lo que es crucial para la toma de decisiones en áreas como logística, recursos humanos y finanzas.

💡Python

Python es un lenguaje de programación ampliamente utilizado en la creación de scripts y aplicaciones. En el video, se emplea Python para demostrar cómo trabajar con la media móvil a través de ejemplos prácticos, mostrando su relevancia en el análisis de datos.

💡Pandas

Pandas es una biblioteca de Python que proporciona estructuras de datos y herramientas de análisis de datos. En el video, se importa el paquete Pandas para generar y manipular conjuntos de datos, que luego se utilizan para calcular la media móvil.

💡Data Frame

Un 'Data Frame' es una estructura de datos en Pandas que permite almacenar y manipular conjuntos de datos tabulares. En el video, los datos generados aleatoriamente se convierten en un Data Frame para facilitar su análisis y cálculo de la media móvil.

💡Randomico

El término 'Randomico' se refiere a la generación de números o eventos de forma aleatoria. En el contexto del video, se utiliza para crear un conjunto de datos de ventas que simulan valores reales y son utilizados para示范strar cómo se calcula la media móvil.

💡Rolling

El método 'Rolling' en Pandas se refiere a la función que permite el cálculo de agregados a lo largo de un 'rolling window', es decir, una ventana deslizante. En el video, se utiliza para calcular la media móvil de los datos de ventas en diferentes ventanas de tiempo.

💡Análisis Temporal

El 'Análisis Temporal' es el estudio de los datos a lo largo del tiempo para identificar patrones y tendencias. En el video, la media móvil es una herramienta clave para el análisis temporal de conjuntos de datos en series temporales.

💡Logística y Cadena de Suministro

La 'Logística' y la 'Cadena de Suministro' son áreas de negocio donde se realizan análisis temporales para evaluar el flujo de productos y optimizar el almacenamiento y la distribución. En el video, se menciona cómo la media móvil puede ser útil en estas áreas para analizar el tiempo que un producto permanece en el inventario.

💡Finanzas

El sector financiero es uno de los campos donde la 'Média Móvil' es particularmente útil, especialmente en la evaluación de la evolución de precios en el mercado de valores. El video destaca cómo la media móvil puede aplicarse en el análisis de acciones y otros activos financieros.

💡Machine Learning

El 'Machine Learning' es una rama de la inteligencia artificial que se centra en el desarrollo de algoritmos que permiten a las máquinas aprender y predecir a partir de los datos. En el video, se sugiere la posibilidad de utilizar las columnas calculadas con la media móvil en un modelo de machine learning para mejorar las predicciones.

💡Loop For

Un 'Loop For' es una estructura de control de flujo en programación que se repite mientras se cumple una condición, ejecutando un bloque de código específico. En el video, se utiliza un loop for para generar un conjunto de datos aleatorios que luego se utilizan para calcular la media móvil.

Highlights

Introdução ao conceito de médias móveis e sua aplicação em análise temporal.

Explicação sobre como médias móveis são usadas em áreas como logística, supply chain, vendas, recursos humanos e finanças.

Demonstração passo a passo de como implementar médias móveis no Python.

Importação dos pacotes necessários: pandas, numpy e random.

Criação de um conjunto de dados utilizando pandas e geradores de números aleatórios.

Uso do pandas para gerar datas e a alocação de dados em uma estrutura de Data Frame.

Como trabalhar com datas e identificar dias de final de semana no conjunto de dados.

Explicação sobre como inserir dados em uma lista e depois converter essa lista em um Data Frame.

Demonstração de como calcular a soma de quantidades de vendas por janelas de tempo específicas.

Como calcular a média móvel de sete dias usando o método Rolling do pandas.

Aplicação da função Rolling para realizar cálculos de média móvel em séries temporais.

Exemplo de como as médias móveis podem ser utilizadas em análises financeiras, como ações e bolsa de valores.

Como adicionar colunas ao Data Frame para armazenar resultados de cálculos de média móvel.

Apresentação de como a média móvel pode ser aplicada em modelos de machine learning.

Oferecimento de recursos adicionais, como links para vídeos sobre listas e loops for, para ajudar na compreensão.

Convite para inscrever-se no canal e ativar as notificações para receber novos conteúdos.

Ressaltando a importância de entender listas e loops for antes de trabalhar com médias móveis.

Oportunidade para o público deixar dúvidas e sugestões nos comentários para interação com o criador do conteúdo.

Transcripts

play00:00

hoje eu vou trazer um conceito bem legal

play00:01

de estatística para vocês e vou mostrar

play00:04

exemplos e como a gente utiliza isso no

play00:06

Python tudo bem passo a passo e na

play00:08

prática vamos falar sobre médias móveis

play00:11

que são muito utilizadas quando a gente

play00:13

faz análise temporal quando a gente

play00:15

precisa avaliar uma janela de tempo seja

play00:17

valores seja quantidade eu vou mostrar

play00:20

aqui para vocês tudo bem passo a passo

play00:22

na prática Então vamos lá começar vem

play00:27

comigo Olá se você não me conhece meu

play00:30

nome é Jeferson eu sou o criador do

play00:32

canal e é sempre um prazer ter você aqui

play00:34

comigo bora lá começar então na prática

play00:36

a ver aqui os nossos conceitos e algumas

play00:39

coisas no Python sobre média móvel

play00:42

primeira coisa conceitualmente Falando

play00:44

em estatística o que seria a média móvel

play00:47

eu até deixei descrito aqui para vocês

play00:49

eu vou deixar esse material para vocês

play00:51

disponível Tá bom mas é muito importante

play00:54

você prestar atenção no passo a passo

play00:55

que eu vou te explicar todos os comandos

play00:57

aqui para te mostrar como funciona isso

play00:59

na na prática utilizando Python em

play01:02

estatística a média móvel é um recurso

play01:04

utilizado para se identificar a

play01:06

tendência de um conjunto de dados

play01:09

dispostos em uma série de tempo ou seja

play01:12

Resumindo pra gente avaliar determinados

play01:15

dados de um tempo tal até um tempo tal

play01:18

de uma data D até uma data final quais

play01:22

dados a gente pode analisar qualquer

play01:23

tipo de dados quantidade de vendas por

play01:26

exemplo valores de vendas quantidade de

play01:29

estoque valor em stoque isso é muito

play01:31

utilizado na área de logística supply

play01:33

chain por quê Porque a gente precisa

play01:36

fazer algumas análises temporais para

play01:38

verificar determinado produto quanto

play01:40

tempo ficou no estoque quanto tempo saiu

play01:42

do estoque Enfim uma série de análises

play01:45

que a gente pode fazer isso para venda

play01:47

para recursos humanos para compras para

play01:50

logística qualquer área de negócio

play01:52

principalmente área financeira ações

play01:55

bolsa de valores e por aí vai então

play01:57

vamos começar aqui no Python que eu vou

play01:59

te mostrar agora como que é simples

play02:00

trabalhar com essa média móvel Olha lá

play02:03

primeira coisa que a gente vai fazer

play02:04

aqui a gente vai importar aqui o pandas

play02:06

o n pai e vamos importar Esse pacote

play02:09

handle Esse pacote ROM faz o quê

play02:11

simplesmente pra gente gerar números

play02:13

aleatórios randomicamente Tá ok então

play02:16

vamos importar esses três pacotes agora

play02:19

que nós já importamos esses pacotes O

play02:21

que que a gente vai fazer aqui a gente

play02:23

vai criar um conjunto de dados em vez da

play02:26

gente importar um conjunto de dados tudo

play02:29

eu vou criar é um conjunto de dados

play02:30

também trago alguns comandos novos aqui

play02:32

para vocês como por exemplo o date Range

play02:35

tá pra gente poder fazer esses testes e

play02:38

poder fazer essa análise eu explicar

play02:40

melhor isso para vocês então a primeira

play02:42

coisa que a gente vai fazer aqui a gente

play02:44

vai criar aqui ó uma lista vazia chamada

play02:47

dados tá então vai ser nossos dados aqui

play02:49

é uma lista vazia como que eu sei que é

play02:51

uma lista vazia que a gente abriu e

play02:53

fechou o colchetes eu já fiz um vídeo

play02:56

aqui no canal também falando muito bem

play02:58

em detalhes sobre listas vou deixar o

play03:01

link aqui na descrição depois vale a

play03:02

pena dar uma olhada então aqui a gente

play03:04

vai agora criar aqui um período que a

play03:06

gente vai fazer esse essa avaliação de

play03:09

tempo então a gente vai colocar aqui ó

play03:11

pd que é nosso pandas ponto date

play03:14

underline Range essa função aqui é uma

play03:17

função do pandas que ele vai criar um

play03:19

período com essa data 1/01 de 2023 até

play03:23

1/07

play03:25

de2022 aqui poderia também ser um

play03:27

período 1/06 de2020

play03:30

poderia ser um mês dois meses período

play03:32

que você achar melhor vou até mudar

play03:34

vamos deixar um do 6 de 2023 aí o que

play03:37

que a gente vai fazer agora para Popular

play03:40

o nosso conjunto de dados que vai ser a

play03:42

nossa lista ali vazia inicialmente tá

play03:45

essa lista aqui ó chamada dados a gente

play03:47

vai inserir dados lá dentro vai

play03:49

converter num Data Frame que que a gente

play03:51

vai fazer aqui a gente vai fazer um loop

play03:53

for E aí para cada interação do nosso

play03:56

loop for a gente vai fazer o quê a gente

play03:59

vai a cada interação aqui nesse nosso

play04:02

período de data ele vai ter todas as

play04:04

datas ali que nós colocamos aqui desse

play04:06

período ele vai fazer o quê a cada

play04:09

interação do loop for cada vez que esse

play04:11

for for executado tá ele vai criar aqui

play04:15

ó uma variável que chama vendas

play04:17

underline dinheiro e uma que chama

play04:20

vendas underline cartão e aí nós vamos

play04:23

colocar aqui ó Random pon Random init

play04:26

vai de 1 a 10 e aqui Random p ROM it e

play04:30

vai de 1 a 10 também ou seja o que

play04:34

estamos fazendo aqui nesse início nesse

play04:37

trecho de código a gente simplesmente tá

play04:39

gerando de forma aleatória números que

play04:42

estão entre 1 a 10 é isso que a gente tá

play04:45

fazendo aqui e atribuindo nessas

play04:47

variáveis aqui venda dinheiro e venda

play04:49

cartão depois a gente vai colocar aqui ó

play04:51

tipo dia igual dia semana a gente vai

play04:55

colocar aqui ó tipo dia igual dia da

play04:57

semana e aí a a gente vai verificar o

play05:00

seguinte se o nosso período data entre

play05:05

coates o i o que que é esse i é a linha

play05:08

que o for tá fazendo naquele momento

play05:10

ponto Week Day esse Week Day é o qu ele

play05:14

pega o número do dia da semana por maior

play05:17

que quatro por que maior que quatro no

play05:20

Python o dia da semana começa em zero

play05:23

então é 0 1 2 3 4 5 6 7 dias na semana E

play05:29

se for maior que quatro significa o quê

play05:31

Se for número cinco ou seis significa

play05:35

que é sábado ou domingo então pro Python

play05:38

o Week Day número 5 é sábado e o Week

play05:41

Day número 6 é domingo e o zero até

play05:45

quatro é segunda-feira é de segunda a

play05:48

sexta tá então aqui se for maior que

play05:51

quatro ou seja se for cinco ou se vai

play05:54

ser sábado ou domingo então ele vai

play05:56

mudar aqui ó a informação do tipo dia

play05:58

para final de semana OK sen não vai

play06:01

manter dia da semana aí a gente vai

play06:05

fazer o qu dados P append aí entre

play06:09

parênteses vamos transformar isso aqui

play06:11

numa string tá o período data Porque até

play06:14

então ele é uma data vamos transformar

play06:17

um string da mesma forma que vamos

play06:19

colocar o i que é aquela data que o

play06:21

nosso for está passando ponto date aí

play06:25

vamos fechar o parênteses vírgula tipo

play06:28

dia vírgula dinheiro vírgula vendas

play06:32

dinheiro ou seja a gente tá inserindo na

play06:34

nossa lista porque o append ele vai

play06:37

inserir na nossa lista ele inserir dados

play06:39

na nossa lista ele vai inserir na nossa

play06:41

lista essas informações aqui venda

play06:44

dinheiro e de venda cartão então toda

play06:47

vez que o for tiver passando ele vai

play06:49

fazer todo esse procedimento e vai

play06:52

inserir aqui na nossa lista vazia vai

play06:54

fazer isso para todas as datas que

play06:56

estiverem aqui nesse período E lembrando

play06:59

que que esse período data são as datas

play07:01

que nós atribuímos aqui para criar o

play07:03

nosso intervalo Ok feito isso o que que

play07:08

a gente vai fazer ele vai rodar aqui no

play07:10

for se tiver lá 100 datas ele vai fazer

play07:12

100 vezes o for 200 e assim

play07:16

consecutivamente e aí depois que ele

play07:18

terminar o for a gente vai aqui no dados

play07:21

vai pegar dados que vai ser igual

play07:24

pd.dataframe.loc

play07:29

que a gente vai converter agora essa

play07:31

lista é a nossa lista aqui que chama

play07:34

dados em um Data Frame Então a gente vai

play07:36

fazer pd dataframe entre parênteses

play07:40

Vamos colocar aqui dados é a nossa lista

play07:43

tá que agora ela não está mais vazia ela

play07:45

está populada conforme a gente fez no

play07:47

for vírgula colunas colunas cols n que a

play07:52

gente vai passar também aqui o nome das

play07:54

nossas colunas que vai ser o quê coluna

play07:56

de data tipo dia for de pagamento e

play08:00

quantidade de vendas e aí você observou

play08:03

que aqui nós temos quatro Campos e aqui

play08:06

a gente inseriu quatro Campos na nossa

play08:08

lista ou seja esse aqui ó período data P

play08:12

date é a nossa data o tipo dia vai ser

play08:15

aqui a coluna tipo dia o dinheiro ou

play08:19

cartão aqui essa descrição vai ser a

play08:21

forma de pagamento e aqui vendas

play08:24

dinheiro e vendas cartão nada mais é do

play08:26

que a quantidade de vendas pra gente

play08:28

poder a nossa média móvel então aqui a

play08:31

gente tá só criando um conjunto de dados

play08:33

para avaliar a nossa média móvel E aí

play08:35

feito isso a gente vai colocar aqui ó

play08:38

dados né o nosso campo data que vai ser

play08:41

igual pd P datetime data a gente tá

play08:45

convertendo aqui para date time porque

play08:48

aí quando a gente for trabalhar lá logo

play08:51

abaixo com os comandos para ver a média

play08:53

móvel a gente consegue passar períodos

play08:55

de data de uma forma bem simples vocês

play08:57

vão ver já já então vamos executar aqui

play08:59

agora esse comando ó já executamos e ele

play09:02

já fez tá vendo ele já rodou todo o

play09:04

nosso loop fora ali já converteu para um

play09:07

Data Frame se a gente olhar agora o

play09:09

nosso Data Frame chama dados Olha lá a

play09:12

gente tem então todas as datas que nós

play09:14

passamos ali aquele período o tipo do

play09:17

dia se é final de semana ou se é dia da

play09:19

semana a forma de pagamento dinheiro

play09:22

cartão e a quantidade de vendas que nós

play09:24

geramos aqui aleatoriamente toda vez que

play09:27

a gente fez o for viu então assim a

play09:29

gente criou um dataframe ali pra gente

play09:31

poder fazer nossas análises e agora eu

play09:33

vou mostrar para vocês umas funções

play09:35

prontas do pandas que a gente já

play09:37

consegue avaliar a nossa média móvel as

play09:39

nossas janelas de tempo tudo de acordo

play09:41

ali com as datas do nosso dataframe tudo

play09:43

com uma linha de código bem simples só

play09:46

que antes se você não tiver inscrito se

play09:48

inscreve aqui no canal Porque toda

play09:50

semana eu trago conteúdos novos tudo

play09:52

muito bem detalhado passo a passo na

play09:55

prática explico tudo muito bem em

play09:57

detalhes para vocês e ainda

play09:59

disponibilizo todo esse material todo

play10:00

esse código fonte eu creio que isso vai

play10:03

te ajudar bastante então se inscreve

play10:05

aqui no canal ativa o Sininho das

play10:07

notificações para você sempre ficar por

play10:08

dentro dos novos vídeos e bora lá voltar

play10:11

aqui e olha lá como que a gente faz

play10:13

agora o cálculo da nossa média móvel

play10:15

quantidade somar quantidade por janelas

play10:18

de tempo muito simples o pandas ele tem

play10:22

já essa função aqui que chama Rolling Ou

play10:25

seja é uma rolagem significa uma rolagem

play10:28

E aí a gente entre parênteses passa um

play10:30

parâmetro ali de janela porque o Window

play10:33

é o quê uma janela essa janela significa

play10:35

o quê 2 3 4 a quantidade de registros ou

play10:40

uma janela de tempo no caso para avaliar

play10:43

as datas quando a gente tá trabalhando

play10:45

com séries temporais por exemplo Ah eu

play10:47

quero saber a média móvel do da

play10:49

temperatura dos últimos 8 dias ou eu

play10:53

quero saber a média móvel da última

play10:56

semana em relação ao preço de uma

play10:58

determinada ação de um determinado ativo

play11:00

da Bolsa de Valores a gente pode fazer

play11:03

com esse comando Rolling ele já é nativo

play11:05

do próprio pandas Então olha lá primeira

play11:08

coisa que a gente vai fazer aqui ainda

play11:09

não é a média móvel a gente vai

play11:12

simplesmente pegar aqui ó vamos criar né

play11:15

uma coluna chamada soma underline dois

play11:18

dias que vai ser igual o dados que é o

play11:20

nosso dataframe ponto Rolling Window 2

play11:24

que significa o qu que a gente quer

play11:27

pegar os dois registros

play11:29

tá E aí sempre fazer isso de dois em

play11:32

dois A cada dois registros eu vou fazer

play11:33

o quê Vou pegar o campo quantidade de

play11:36

vendas então pon qtd underline vendas PS

play11:40

para somar Olha só vamos executar aqui ó

play11:43

executamos e se a gente agora visualizar

play11:47

os nossos dados olha só tá vendo aqui

play11:50

por que que ele colocou n ou seja not a

play11:53

Number um valor Miss um valor nulo Por

play11:55

que que ele não colocou nada aqui e

play11:57

deixou nulo porque a aqui é o primeiro

play11:59

valor então ele não tem um valor para

play12:01

trás para ele calcular dois dias ali por

play12:03

isso que o primeiro sempre vai ficar

play12:05

nulo no segundo ele já colocou ali ó a

play12:08

soma dos dois dias é o quê é 7 4 + 3 7

play12:13

aí nesse daqui 5 por quê 3 + 2 5 esse

play12:19

daqui 7 2 + 5 7 aqui 10 por qu 5 + 5 10

play12:24

e assim consecutivamente ele sempre vai

play12:27

pegando de dois em dois Vai somando e

play12:29

vai atribuindo em uma nova coluna Ok

play12:31

Isso foi que a gente fez a soma a gente

play12:34

pode fazer isso também considerando três

play12:36

dias os três dias não perdão três

play12:38

registros porque aqui ainda a gente não

play12:40

tá olhando a data a gente tá olhando

play12:42

quantidade ali de linhas do dataframe Ok

play12:45

então vamos criar aqui uma coluna soma

play12:47

TRS Dias dados P Rolling Window = 3 P

play12:51

etd under vendas psan se a gente

play12:54

executar e agora vamos avaliar novamente

play12:58

esse noso nosso dataframe Olha lá aqui

play13:01

da mesma forma como a gente quer sempre

play13:03

de três linhas as duas primeiras vão

play13:05

ficar não vão ficar nula aí aqui a

play13:08

partir da terceira ele já tem três

play13:10

valores aqui ó para calcular Lembrando

play13:13

que a gente não tá olhando essa coluna

play13:15

aqui tá Porque essa já foi uma coluna

play13:16

calculada a gente tá olhando a coluna

play13:18

qtd vendas Então se a gente pegar e

play13:21

fizer a soma 4 + 3 + 2 Vai dar 9 se a

play13:26

gente pegar aqui ó essa deu 10 então 3

play13:28

mais 2 5 + 5 10 e assim consecutivamente

play13:33

então aqui da mesma forma que a gente

play13:35

fez com a soma a gente vai fazer com a

play13:37

média então a gente executa aqui para

play13:40

ver a média de dois registros e para ver

play13:42

a média ali de três registros se a gente

play13:44

olhar aqui o nosso Data Frame de novo a

play13:47

gente vai ver que agora em vez de fazer

play13:49

a soma ele fez o quê ele fez ó tá vendo

play13:53

a média de dois dias e a média de TRS

play13:55

dias com o mesmo procedimento que

play13:57

anteriormente e E aí agora que a gente

play14:00

chega na média móvel olhando por período

play14:02

por faixa de tempo da mesma forma com o

play14:05

mesmo comando dados pon Rolling né dados

play14:08

é o nosso dataframe ponto Rolling é a

play14:11

função do pandas Então a gente vai criar

play14:13

aqui ó dados pon média móvel 7 dias que

play14:16

vai ser igual dados nosso dataframe pon

play14:19

Rolling E aí entre parênteses o Window é

play14:22

o qu é uma janela ali que que a gente

play14:24

quer 7D 7D do qu 7 dias então a gente

play14:29

coloca 7D de 7 dias vírgula on é

play14:33

obrigatório a gente colocar aqui esse on

play14:36

para dizer para ele qual coluna do

play14:38

dataframe ele vai usar Então a gente vai

play14:40

fazer o quê S dias ou na coluna data

play14:43

Então a gente vai olhar PR essa coluna

play14:45

data essa coluna data lembra que a gente

play14:47

colocou ela já como date time justamente

play14:50

pra gente poder usar isso daqui

play14:52

justamente pra gente poder colocar aqui

play14:54

7D on data P qtd vendas pon mim então se

play14:59

a gente executar Esse comando e agora se

play15:02

a gente olhar aqui na nossa coluna que a

play15:03

gente criou média underline móvel

play15:06

underline 7 dias a gente sempre vai ter

play15:08

a média dos últimos sete dias então aqui

play15:11

ele vai pegar sempre os sete dias os

play15:13

últimos sete dias e vai fazendo a média

play15:16

móvel isso a gente pode usar para

play15:18

qualquer coisa para qualquer Data Frame

play15:20

quando a gente quiser medir algum dado

play15:21

num intervalo de tempo e um determinado

play15:24

período a gente faz dessa forma com esse

play15:27

simples comando aqui de um uma linha a

play15:29

gente pode ir criando colunas no nosso

play15:31

dataframe para posteriormente a gente

play15:33

fazer mais análises fazer isso inserir

play15:35

isso no modelo de machine learning E por

play15:38

aí vai e como aqui nesse vídeo a gente

play15:40

falou bastante de lista e de loop Force

play15:42

se você não tiver familiarizado eu vou

play15:44

deixar esses dois vídeos aqui tudo bem

play15:47

em detalh sobre listas e sobre loop for

play15:49

e se você ficou com alguma dúvida ou

play15:51

tiver alguma sugestão deixa para mim

play15:52

aqui nos comentários que eu te respondo

play15:54

o mais rápido possível Muito obrigado e

play15:57

até o próximo vídeo

Rate This

5.0 / 5 (0 votes)

関連タグ
EstadísticaPromedios MóvilesPythonAnálisis TemporalSeries de TiempoPandasData FrameMédia MóvelLogísticaFinanzas
英語で要約が必要ですか?