Master Data Analysis on Excel in Just 10 Minutes

Kenji Explains
26 Feb 202311:31

Summary

TLDREste vídeo enseña los fundamentos del análisis de datos dividiéndolo en cuatro áreas clave: transformación de datos, creación de estadísticas descriptivas, análisis de datos y creación de un informe para visualizar los resultados. Se muestra cómo limpiar datos en Excel, usar fórmulas para redondear y agregar columnas, y cómo detectar duplicados. Además, se explica cómo realizar estadísticas descriptivas y análisis de datos con herramientas como el análisis de datos y tablas dinámicas, y cómo generar informes interactivos con validación de datos y formateo condicional.

Takeaways

  • 😀 Aprenderás los fundamentos del análisis de datos divididos en cuatro áreas principales: transformación de datos, creación de estadísticas descriptivas, análisis de datos y creación de un informe para visualizar los resultados.
  • 🧼 El primer paso es transformar y limpiar los datos utilizando herramientas como Excel y técnicas de limpieza como la función TRIM para eliminar espacios innecesarios.
  • 📈 Se utiliza la función ROUNDUP para redondear los valores decimales a números enteros, lo cual es crucial cuando los datos representan cantidades físicas como comida.
  • 🗺️ Añadir información relevante como los países asociados a las ciudades en los datos puede ofrecer un contexto más completo y ser útil para el análisis.
  • 🔍 Comprobar y eliminar duplicados en los datos es esencial para garantizar la precisión y la calidad del análisis.
  • 📊 La creación de estadísticas descriptivas, como el promedio, mínimo, máximo y moda, ayuda a entender mejor los datos utilizando herramientas como el análisis de datos en Excel.
  • 📊 La utilización de gráficos de caja y bigotes (box and whisker) permite identificar outliers y comprender la distribución de los datos.
  • 📊 Para una mayor profundidad en el análisis, es posible desglosar los datos por categorías específicas, como el nombre del gerente, para identificar tendencias o problemas.
  • 📊 El análisis de datos también incluye responder a preguntas específicas, como qué producto es el más vendido, cuál es el ingreso total y cómo se distribuye el ingreso por método de pago.
  • 📊 La creación de tablas dinámicas como las tablas dinámicas de Excel permite desglosar y analizar datos de manera eficiente y efectiva.
  • 📊 La finalización del análisis con la creación de un informe que incluye validación de datos, fórmulas y formato condicional para presentar los resultados de manera clara y accionable.

Q & A

  • ¿Qué áreas principales se abordan en el video sobre análisis de datos?

    -El video se divide en cuatro áreas principales: transformación de datos, creación de estadísticas descriptivas, análisis de datos y creación de un informe para visualizar los resultados.

  • ¿Cómo se transforma y limpia el conjunto de datos en Excel?

    -Para transformar y limpiar los datos en Excel, se convierte el conjunto de datos en una tabla, se eliminan espacios extra en la columna del gerente usando la función TRIM, se redondean los números decimales en la columna de cantidad al número entero más cercano usando la función ROUNDUP y se eliminan duplicados.

  • ¿Qué función de Excel se utiliza para eliminar los espacios innecesarios en una columna?

    -Para eliminar los espacios innecesarios en una columna, se utiliza la función TRIM.

  • ¿Cómo se redondea un número a un entero completo en Excel?

    -Para redondear un número a un entero completo en Excel, se utiliza la función ROUNDUP, especificando el número y el número de dígitos, que en este caso es cero.

  • ¿Cómo se pueden agregar países a una lista de ciudades en Excel?

    -Para agregar países a una lista de ciudades en Excel, se utiliza la función de tipos de datos geográficos, donde se puede añadir una columna que asocie un país o región con cada ciudad.

  • ¿Qué herramienta en Excel permite realizar análisis estadísticos descriptivos rápidamente?

    -La herramienta de análisis de datos en Excel permite realizar análisis estadísticos descriptivos rápidamente, proporcionando información como la media, mediana, moda, mínimo, máximo, suma y más.

  • ¿Cómo se crea un gráfico de caja y bigotes en Excel para identificar outliers en los precios?

    -Para crear un gráfico de caja y bigotes en Excel, se seleccionan los precios, se utiliza la opción de gráfico de caja y bigotes y se personaliza para mostrar la distribución de datos, incluyendo los outliers.

  • ¿Cómo se determina el producto más vendido y el análisis de la estructura de ingresos por método de pago en el video?

    -Para determinar el producto más vendido y el análisis de la estructura de ingresos por método de pago, se utiliza una tabla dinámica, donde se calcula el ingreso total multiplicando el precio por la cantidad y se muestran los resultados como porcentajes del total general.

  • ¿Qué es el certificado de análisis de datos de Google y cómo se relaciona con el contenido del video?

    -El certificado de análisis de datos de Google es un programa diseñado para enseñar habilidades laborales para cualquier rol de análisis de datos. Se menciona en el video como una opción para aquellos que quieran profundizar en el aprendizaje de habilidades de análisis de datos.

  • ¿Cómo se crea un informe final en Excel que incluya validación de datos y formateo condicional?

    -Para crear un informe final en Excel, se utiliza la validación de datos para permitir la selección de un gerente, lo que provoca que otros datos como país y ciudad se actualicen dinámicamente usando la función VLOOKUP. Además, se aplican barras de datos usando el formato condicional para representar visualmente la información.

  • ¿Cómo se activa el Analysis Toolpack en Excel si no está disponible inicialmente?

    -Para activar el Analysis Toolpack en Excel, se va a Archivo > Opciones > Complementos, se selecciona el Analysis Toolpack y se hace clic en Ir y luego en OK.

Outlines

00:00

📊 Análisis de datos básico: Transformación y limpieza de datos

Este primer párrafo explica cómo iniciar el análisis de datos con la transformación y limpieza de datos. Se menciona la necesidad de limpiar los datos para su análisis y se presenta un ejemplo práctico utilizando un archivo de Excel para un cajero automático. Se detalla cómo transformar un conjunto de datos en una tabla, cómo limpiar espacios en columnas específicas utilizando la función TRIM y cómo cambiar los nombres de las columnas. Además, se aborda la problemática de los decimales en la cantidad de productos y cómo redondear estos valores al número entero utilizando la función ROUNDUP. También se discute la adición de información relevante como los países asociados a las ciudades y cómo eliminar duplicados en los datos.

05:01

📈 Análisis descriptivo y visualización de datos

El segundo párrafo se enfoca en el análisis descriptivo de los datos y la creación de informes visuales. Se describe cómo activar herramientas de análisis de datos en Excel y cómo generar estadísticas descriptivas para los precios y las cantidades de productos. Se explica el uso de la herramienta de análisis de datos para obtener la media, mediana, moda, mínimo, máximo y otros datos relevantes. Además, se menciona cómo identificar outliers utilizando un gráfico de caja y bigote y cómo profundizar en el análisis al desglosar los datos por nombre de gerente. Se sugiere la importancia de la visualización de datos y cómo se puede mejorar la presentación de los datos en un informe final.

10:05

💼 Análisis de datos avanzado y creación de informes

El tercer párrafo trata sobre el análisis de datos avanzado y cómo presentar los resultados en un informe. Se describe cómo calcular el ingreso total y el desglose por método de pago utilizando tablas dinámicas y cómo determinar el producto más vendido. Se explica cómo crear un informe final que incluya validación de datos, fórmulas de búsqueda y barras de datos condicionadas para presentar de manera clara y efectiva los resultados del análisis. Se enfatiza la importancia de la presentación y cómo se puede personalizar el informe para diferentes gerentes y productos.

Mindmap

Keywords

💡Análisis de datos

El análisis de datos es el proceso de examinar, limpiando y transformar datos para extraer información útil, conocimiento o insights. En el vídeo, el análisis de datos se centra en transformar los datos, crear estadísticas descriptivas y generar informes para visualizar los hallazgos. Se utiliza para comprender mejor los datos de una cadena de comida rápida, como el tipo de productos y las ventas.

💡Transformación de datos

La transformación de datos es el acto de modificar y limpiar los datos para su análisis. En el guion, se menciona que el primer paso es transformar los datos limpiándolos, lo que implica corregir errores, rellenar espacios en blanco y asegurarse de que los datos estén en el formato correcto para el análisis.

💡Estadísticas descriptivas

Las estadísticas descriptivas son resúmenes numéricos que proporcionan información sobre una muestra de datos, como el promedio, la mediana, la moda, el mínimo y el máximo. En el vídeo, se utilizan para comprender mejor los datos de precios y cantidades de los productos.

💡Visualización

La visualización hace referencia a la representación de datos a través de gráficos y diagramas para facilitar la interpretación y la comunicación de los datos. En el vídeo, se menciona la creación de un informe que incluye gráficos y barras de datos para mostrar los resultados del análisis.

💡Limpieza de datos

La limpieza de datos es el proceso de identificar inexactitudes, duplicados, valores perdidos o incorrectos y corregirlos o eliminarlos de los datos. En el guion, se muestra cómo limpiar los datos eliminando espacios adicionales en una columna y redondeando números decimales a enteros.

💡Formularios de Excel

Los formularios de Excel son una herramienta que se utiliza para transformar un conjunto de datos en una tabla organizada. En el vídeo, se menciona cómo cambiar un conjunto de datos en un formulario de Excel para facilitar la limpieza y el análisis.

💡Redondeo

El redondeo es el proceso de cambiar un número para que tenga un cierto número de decimales o sea un número entero. En el vídeo, se utiliza la función 'ROUNDUP' para redondear los valores decimales de la cantidad de productos a un número entero.

💡Duplicados

Los duplicados son datos que aparecen más de una vez en un conjunto de datos. En el vídeo, se menciona cómo buscar y eliminar duplicados en una tabla de datos para asegurarse de que los análisis sean precisos.

💡Análisis de caja y bigotes

El análisis de caja y bigotes es una técnica de visualización de datos que muestra la distribución de los datos, incluyendo los valores mínimos y máximos, los cuartiles y los outliers. En el vídeo, se utiliza para identificar outliers en los precios de los productos.

💡Pivot table

Una tabla dinámica es una herramienta de Excel que se utiliza para resumir, analizar y explorar rápidamente los datos. En el vídeo, se utiliza para analizar qué producto es el más vendido, el total de ingresos y la distribución de ingresos por método de pago.

💡Validación de datos

La validación de datos es el proceso de confirmar que los datos son precisos y útiles. En el vídeo, se menciona cómo usar la validación de datos en un informe final para asegurarse de que los datos seleccionados sean correctos y se muestren de manera dinámica.

Highlights

Introduction to the fundamentals of data analysis

Data transformation and cleaning

Creating descriptive statistics for better understanding

Data analysis techniques

Visualization of findings through report creation

Sponsor mention: Coursera

Transforming data by converting it into a table

Cleaning up data by removing extra spaces

Rounding up quantities to whole numbers

Adding country information to city data

Removing duplicates from the dataset

Introduction to Google's data analytics professional certificate

Calculating descriptive statistics using Excel

Using Data Analysis tool for quick statistics

Creating a box and whisker chart to identify outliers

Analyzing data by manager to identify potential data entry issues

Calculating revenue by multiplying price and quantity

Using pivot tables for data analysis

Determining the best selling product

Calculating total revenue

Revenue breakdown by payment method

Creating a dynamic report with data validation

Using conditional formatting for data bars

Transcripts

play00:00

in this video you're going to learn all the  fundamentals of data analysis and we'll break  

play00:05

this down into four main areas first we're  going to be looking at transforming the data  

play00:10

so cleaning it up secondly we're going to be  looking at creating descriptive statistics to  

play00:15

understanding better third we're going to be  looking at data analysis and finally we'll get  

play00:21

into creating a report to visualize our findings  so let's get into it and thank you to Coursera  

play00:27

for sponsoring this video more on them later the  first step here is to transform the data and for  

play00:34

this here's the Excel file that we'll be working  with which you can download for free in the video  

play00:38

description so as you can see this is going to  be for a fast food chain you can see the types  

play00:43

of products here and the first step is simply  to clean this up but for that we're going to  

play00:47

go to control T So to change this into a table  so change the data set into a table then we'll  

play00:54

head on OK from here for the cleanup part you can  see that under the manager column we seem to have  

play01:00

some very odd spacing here so let's go ahead and  clean that up here we're going to go to equals  

play01:06

trim hit the top key and this formula is going  to remove these old spaces I'm going to hit enter  

play01:12

there you can see that's going to Auto populate  for all of these we'll change this name to manager

play01:19

and then for all of these that are  currently linked to this column over  

play01:23

here we're going to paste them as values  so we're going to go Ctrl shift down  

play01:28

Ctrl C and then we're gonna paste this as a value  so alt h v v is a shortcut for that and now that  

play01:36

means that we can go ahead and remove this column  by hitting Ctrl minus there you go then under  

play01:42

quantity you might notice that we've got these  decimals which don't make too much sense you can't  

play01:47

really have half a burger and so for this we're  basically gonna have to round up to a whole number  

play01:52

for that we're going to use the Roundup formula so  equals round up hit the top key there the number  

play01:59

is this one comma and the number of digits for  us is going to be zero because we want the full  

play02:04

number close those brackets and hit enter so this  is going to be our quantity now hit enter there  

play02:10

and we basically wanna Ctrl shift down Ctrl C  and then paste as values so alt h v v v again  

play02:20

there you go so now we can remove this column  here so we're going to select it and control minus  

play02:26

then you'll notice that under City here we have  the city names but we don't necessarily have  

play02:30

the countries that would be a nice thing to add so  for this we can actually head over to the data tab  

play02:36

and go under data types you'll find  geography here so just click on that  

play02:42

once you start to see that icon it means that  it's loaded up what you want to do here is  

play02:47

hit over to this icon to the side under add  column and we basically want to add a country  

play02:53

or a region associated with that City and you  can see that we have the corresponding country  

play02:57

for each City if you want to move this city  column next to the country you can actually  

play03:03

go ahead and select it up top and we start to  see these arrows when you hover over it just  

play03:08

press the shift key and then just drag it across  like so that should allow you to move everything  

play03:13

one final thing we haven't done here is test  if there's any duplicates so for this we can  

play03:18

simply go under data again and we're just going to  remove duplicates by going to this icon over here  

play03:24

so we'll click on that and it's going to be  for that whole table and we'll simply hit on OK  

play03:30

and you can see here that we get a notification  saying that five duplicate values were found and  

play03:35

removed so we'll hit on OK there and speaking  of data analysis if this is something that  

play03:41

you want to learn more about you can check out  Google's data analytics professional certificate  

play03:47

it's designed to teach you job ready skills  for any data analytics role so you can learn  

play03:52

all the skills required in less than six months  the program currently has well over 1 million  

play03:59

students in a 4.8 star rating now if you're  wondering if you need any prior experience no  

play04:06

there's no prior experience required and it's  all fully self-paced in the program you learn  

play04:11

key analytical skills including data cleaning  analysis and visualization using some of the  

play04:19

most common industry tools such as spreadsheets  SQL or R programming upon completion you'll  

play04:26

receive a Google professional certification which  you'll be able to share on your CV and Linkedin  

play04:33

so if you're interested sign up for a seven day  free trial Now using the link in the description  

play04:39

below alright back to the video great now  that we've done step one and step two it's  

play04:45

all about the descriptive statistics so really  seeing things like what's the average price what  

play04:50

about the minimum the maximum and so on so for  this let's hop over to the side and you could  

play04:56

try to find for the price and for the quantity say  the average going one by one so type the average  

play05:01

formula then doing the same thing with the minimum  the maximum so on but there is a much faster way  

play05:07

that's actually using a tool called Data analysis  for that we're gonna have to activate it it should  

play05:13

be over here to the side under the data ribbon  if you don't have it like me we can go ahead  

play05:18

and activate it so we'll head over to file  go over to the bottom where it says options  

play05:26

from here we're gonna go into add-ins and we want  to click on the analysis toolpack here and hit on  

play05:32

go from here we want to select analysis toolpack  like I said and we'll hit OK now you can see that  

play05:39

we have this data analysis option under the data  ribbon so that's the one that we want to select

play05:46

from here we want the descriptive  statistics and we'll hit on OK there  

play05:52

and the input range is going to be all of  our prices so we'll go Ctrl shift down there  

play05:57

and then we want it to be a summary statistics and  where do we want this let's say we want an output  

play06:03

range which is going to be up over here so right  next to the table let's say we put it here to the  

play06:09

side there we're just going to hit on OK and now  you can see that for the price which is what we've  

play06:15

selected we've gotten everything from the mean  the median mode minimum maximum sum and a bunch  

play06:21

of other useful information let me repeat that  same process for the quantity awesome now we've  

play06:28

got the breakdown by price and by quantity as well  but one thing that this doesn't quite account for  

play06:33

is the fact that there could be outliers in our  price so for that we can go ahead down over here  

play06:38

we're gonna basically create a new chart which  is going to be a box and whisker so let's first  

play06:44

select all of the prices so Ctrl shift down  and down over here you're gonna find this icon  

play06:51

click on that and we want a box and whisker  basically this one over here and don't worry  

play06:57

if you can't interpret it we'll look at it just  in a second let me move that all the way up  

play07:02

so once we have it in here this is basically  telling us a few different things so first  

play07:06

these top and bottom lines are telling us  the maximums so the Max and the Min if you  

play07:11

will and then in here this box represents the  first and the third quartile and then you can  

play07:17

see that we've got that X which is the average  then we've got a line which is going to be the  

play07:22

median and finally we've got these dots over here  which represent all of our outliers in our price  

play07:28

now if we want to dig a bit further into this  it would be nice to see the x-axis maybe we can  

play07:34

put something like the manager's name to see where  exactly this is coming from maybe it's one manager  

play07:39

that might be reporting the data wrong so we'll  go to right click for that go under select data  

play07:46

edit the horizontal category access label  here and what we're going to do is put the  

play07:51

managers so we're going to select all  of these Ctrl shift down and hit on OK  

play07:57

and hit on OK again now if we go all the way back  up you can see what that breakdown looks like  

play08:03

by manager and it seems to be that all of these  outliers are accumulated with Joel maybe we should  

play08:08

have a word with him now moving on to step 3 which  is data analysis so over here you can see that  

play08:15

we've got three different questions that we want  to solve which is what is our best selling product  

play08:20

what is our total revenue and that's what's our  Revenue breakdown by payment method so if we go  

play08:26

back to the table here you notice that we don't  actually have a column for Revenue so that's one  

play08:31

that we're going to have to calculate simply  by multiplying the price and the quantity so  

play08:35

we'll do that over here let me add an extra column  there and let's call this something like Revenue

play08:44

and the formula for it is going to be equals the  quantity multiplied by the price and we'll just  

play08:50

hit enter there that should be calculated for us  and then we'll go up over here again and for all  

play08:56

of this analysis we can actually do most of it  with a pivot table so we'll head over to insert  

play09:02

pivot table the table or range we're interested in  is all of this range so once we select one of the  

play09:09

cells we can just go to control a that's going to  select all of them and we want this in a location  

play09:15

in an existing worksheet which we already selected  so we'll hit OK great from here we can start doing  

play09:22

all the breakdown so what's our best selling  product so let's do this by quantity we're going  

play09:27

to select the products as the rows just hover that  over and then we're gonna check the quantity over  

play09:34

here as the values great now we have all of that  breakdown if we want to sort it from highest to  

play09:40

lowest we can go to right click and go to sort  and we'll sort largest to smallest and now you  

play09:47

can see that beverages is our largest at 35 000.  then secondly we've got what is our total revenue  

play09:54

for this one we're simply going to have to select  the revenue so first we'll remove these let's take  

play10:00

this out and we'll take this out as well and  we just have to select the revenue and put it  

play10:05

under values that should give us the sum of total  revenue which seems to be 812 000. and finally our  

play10:13

Revenue breakdown by payment method so for that  we're gonna get all of the payment methods and  

play10:19

put those under the rosie like so but to see the  breakdown better it probably makes more sense as  

play10:25

a percentage so what we can actually do is go to  right click and from here go to summarize show  

play10:32

values ask sorry and we're going to show them as a  percentage of the grand total now you can see that  

play10:38

full breakdown and it seems like credit cards are  the most dominant here now that you've seen how to  

play10:44

do some of the data analysis let me show you what  a final report might look like this one here is  

play10:50

fairly simplified so you can see that we've got  this drop down which is using data validation  

play10:54

to select the manager and everything dynamically  changes so if I select dwell I'm able to see which  

play11:01

country and city is from using the X lookup and  then just below that using the sum ifs I'm able  

play11:08

to derive his particular revenue for fries and  the other products as well as his total revenue  

play11:15

and these data bars over here are done using  the conditional formatting if you're unsure  

play11:20

how to do this type of formulas you can check  out this video over here or this link over here  

play11:26

to take our Excel codes hit the like and that  subscribe and I'll catch you in the next one

Rate This

5.0 / 5 (0 votes)

関連タグ
Análisis de datosExcelLimpieza de datosEstadísticasVisualizaciónFormación en líneaCurso de ExcelReportesData AnalyticsCertificación
英語で要約が必要ですか?