AI Portfolio Project | I built a MACHINE LEARNING MODEL using AI in 10 MINUTES

Mo Chen
22 Jan 202409:58

Summary

TLDREn este video, el creador demuestra cómo construir un poderoso modelo de aprendizaje automático utilizando una asistente de IA sin necesidad de codificar. Utilizando la herramienta pcan, el creador guía a los espectadores a través del proceso de generar un modelo de pronóstico de ingresos, simplemente interactuando con el asistente de IA y respondiendo a preguntas orientadoras. El asistente construye automáticamente las consultas SQL necesarias y entrena el modelo. El video destaca lo accesible que se ha vuelto el aprendizaje automático gracias a las últimas tecnologías de IA, aunque enfatiza que las habilidades técnicas sólidas siguen siendo esenciales para optimizar aún más los modelos.

Takeaways

  • 🤖 La inteligencia artificial ha simplificado enormemente la creación de modelos de aprendizaje automático, permitiendo a los usuarios construir modelos potentes sin necesidad de codificación.
  • 🚀 Herramientas como pcan democratizan el acceso al aprendizaje automático, haciendo posible que tanto principiantes como expertos construyan modelos de predicción con facilidad.
  • 📊 El usuario creó un modelo de pronóstico de ingresos a nivel de cliente utilizando pcan, destacando cómo la IA puede guiar a los usuarios a través del proceso con preguntas orientativas.
  • 🔗 Pcan facilita la conexión con diversas fuentes de datos, permitiendo a los usuarios cargar y analizar grandes conjuntos de datos eficientemente.
  • 🛠️ Aunque la plataforma permite construir modelos sin codificar, ofrece la opción de ajustar y personalizar el código, lo que brinda flexibilidad a los usuarios con habilidades técnicas.
  • 📈 El modelo generado proporciona métricas y visualizaciones para evaluar su precisión, mostrando la efectividad de las herramientas de IA en la generación de modelos confiables.
  • 💡 La importancia de la columna en los modelos predice qué tan significativas son las diferentes variables para los resultados del modelo, ofreciendo insights valiosos para los usuarios.
  • 🎓 Mientras que las herramientas de IA simplifican la creación de modelos, el conocimiento técnico y la comprensión de los fundamentos matemáticos y estadísticos siguen siendo cruciales para optimizar los modelos.
  • 🔄 El usuario puede elegir la frecuencia de las predicciones, lo que muestra la adaptabilidad de pcan a diferentes necesidades de pronóstico.
  • 🌐 La facilidad de uso de pcan y la capacidad de procesar grandes volúmenes de datos destacan su potencial para democratizar el aprendizaje automático, haciéndolo accesible para un público más amplio.

Q & A

  • ¿Qué herramienta utiliza el autor del video para construir un modelo de machine learning sin necesidad de codificar?

    -El autor utiliza pcan para construir un modelo de machine learning sin necesidad de codificar.

  • ¿Cuál es el objetivo principal del modelo de machine learning construido en el video?

    -El objetivo principal del modelo es realizar una predicción de ingresos a nivel de cliente.

  • ¿Cómo interactúa el autor con la herramienta pcan para construir su modelo?

    -El autor interactúa con la herramienta pcan a través de un asistente de IA que le hace preguntas guía para ayudarle a construir su modelo.

  • ¿Se necesita experiencia en machine learning para utilizar la herramienta mencionada en el video?

    -No, la herramienta está diseñada para ser utilizada tanto por principiantes como por expertos en machine learning, permitiendo construir modelos precisos sin necesidad de codificación.

  • ¿Qué tipo de datos utiliza el autor para construir su modelo y dónde se pueden encontrar?

    -El autor utiliza un archivo CSV de una competencia de Kaggle que fue limpiado previamente. El enlace para descargar el conjunto de datos se proporciona en la descripción del video.

  • ¿Es posible conectar la herramienta pcan a diferentes fuentes de datos?

    -Sí, pcan tiene varios conectores disponibles para conectar con conjuntos de datos que estén en servidores SQL o con proveedores de nube populares.

  • ¿Qué hace el 'notebook predictivo' que genera pcan?

    -El 'notebook predictivo' actúa como el cerebro o sala de control del proceso de construcción del modelo, conteniendo las consultas SQL y los pasos necesarios para entrenar el modelo.

  • ¿Qué son los atributos en el contexto del modelo de machine learning mencionado?

    -Los atributos son los datos que el modelo utiliza para identificar y aprender los patrones que luego le permitirán hacer predicciones precisas.

  • ¿Cuánto tiempo tardó en entrenarse el modelo en el video y qué factores influyen en este tiempo?

    -El modelo se entrenó en aproximadamente una hora, pero el tiempo puede variar dependiendo de la complejidad del modelo de machine learning.

  • ¿El autor cree que las habilidades de codificación son irrelevantes debido a la existencia de herramientas como pcan?

    -No, el autor enfatiza que la capacidad de leer, escribir, entender e interpretar código sigue siendo muy importante, ya que complementa el uso de herramientas de IA como pcan.

Outlines

00:00

🤖 Construyendo Modelos de Aprendizaje Automático sin Código

El video comienza destacando la facilidad con la que ahora se pueden construir modelos de aprendizaje automático poderosos gracias a las herramientas de inteligencia artificial, como pcan. El narrador comparte su experiencia en análisis predictivo y cómo ha cambiado con el advenimiento de estas herramientas, facilitando el aprendizaje y la ejecución de tareas complejas sin necesidad de conocimientos de codificación profundos. A través de un tutorial patrocinado por pcan, demuestra cómo construir un modelo de pronóstico de ingresos a nivel de cliente sin escribir código, utilizando solo la asistencia de IA de pcan para guiarlo a través del proceso. El video invita tanto a principiantes como a expertos en aprendizaje automático a explorar la simplicidad y eficacia de utilizar tecnologías avanzadas para construir modelos, enfatizando que la accesibilidad y la rapidez en la construcción de modelos precisos son posibles con las herramientas adecuadas.

05:01

📊 Profundizando en la Construcción de Modelos con pcan

El narrador continúa explicando el proceso de construcción del modelo utilizando pcan, detallando cómo la asistencia de IA formula preguntas guía para facilitar la creación del modelo y cómo se pueden utilizar consultas SQL y notebooks generados automáticamente para personalizar el modelo sin necesidad de codificación manual. Se describe la importancia de los atributos y cómo influencian en las predicciones del modelo, así como la flexibilidad para añadir más datos si se desea. Finalmente, se resalta la facilidad y rapidez con la que se pueden entrenar modelos de alta calidad en pcan, y se discute la relevancia de las habilidades técnicas y el conocimiento estadístico en la mejora y afinación de los modelos de aprendizaje automático, concluyendo que la capacidad de utilizar herramientas de IA de última generación complementa pero no reemplaza la necesidad de competencias técnicas sólidas.

Mindmap

Keywords

💡Predicción de ingresos

La predicción de ingresos es el proceso de estimar la cantidad de dinero que una empresa, producto o proyecto generará en el futuro. En el video, este concepto se utiliza como el caso práctico principal para demostrar cómo se puede construir un modelo de aprendizaje automático sin codificación, utilizando pcan como herramienta. La predicción de ingresos a nivel de cliente significa que el modelo intentará prever los ingresos generados por cada cliente individualmente.

💡Aprendizaje automático

El aprendizaje automático es una rama de la inteligencia artificial que se centra en la construcción de sistemas capaces de aprender y mejorar a partir de la experiencia sin ser explícitamente programados para ello. El video discute cómo las herramientas modernas, como pcan, han simplificado enormemente el proceso de crear modelos de aprendizaje automático, haciéndolo accesible incluso para aquellos sin experiencia en codificación.

💡Sin codificación

El término 'sin codificación' se refiere al uso de plataformas y herramientas que permiten a los usuarios crear aplicaciones, realizar análisis o desarrollar modelos de aprendizaje automático sin escribir código manualmente. En el contexto del video, demuestra cómo se puede utilizar pcan para construir un modelo de predicción de ingresos mediante un asistente de IA, sin la necesidad de escribir código.

💡Asistente de IA

Un asistente de IA es un sistema de inteligencia artificial diseñado para interactuar con el usuario, facilitando tareas específicas mediante el uso del lenguaje natural. El video muestra cómo el asistente de IA de pcan guía al usuario a través del proceso de construcción de un modelo de aprendizaje automático, haciendo preguntas dirigidas y tomando decisiones basadas en las respuestas.

💡pcan

pcan es una herramienta mencionada en el video que facilita la construcción de modelos de aprendizaje automático sin necesidad de codificación. Ofrece una interfaz de usuario amigable y un asistente de IA que guía a los usuarios a través del proceso, desde la definición del problema hasta la formación del modelo, haciendo que el aprendizaje automático sea más accesible.

💡Conectores de datos

Los conectores de datos son interfaces o herramientas que permiten la integración y el acceso a datos de diferentes fuentes, como bases de datos SQL o servicios en la nube. En el video, se menciona que pcan soporta una amplia variedad de conectores de datos, lo que facilita a los usuarios la carga de sus datasets para la construcción de modelos.

💡DataBricks

DataBricks es una plataforma de análisis basada en la nube mencionada en el video como parte de la infraestructura que utiliza pcan para procesar grandes conjuntos de datos. Su inclusión subraya la capacidad de pcan para manejar y analizar grandes volúmenes de información, lo que es crucial para el entrenamiento de modelos de aprendizaje automático eficaces.

💡Columna de importancia

La columna de importancia es una métrica utilizada en el análisis de modelos de aprendizaje automático para identificar qué variables (o columnas de datos) tienen mayor influencia en las predicciones del modelo. El video menciona este concepto al revisar los resultados del modelo, señalando que la columna 'cantidad' fue la más influyente para las predicciones de ingresos, lo que ayuda a entender cómo el modelo toma decisiones.

💡Notebook predictivo

Un notebook predictivo es un documento interactivo que contiene código, datos y visualizaciones para construir, entrenar y evaluar modelos de aprendizaje automático. En el video, se genera automáticamente un notebook dentro de pcan que organiza y ejecuta el proceso de construcción del modelo de predicción de ingresos, destacando la facilidad de uso de la herramienta sin requerir codificación manual.

💡Evaluación de modelos

La evaluación de modelos es el proceso de determinar el rendimiento y la precisión de un modelo de aprendizaje automático. En el video, después de entrenar el modelo de predicción de ingresos, se utilizan métricas y visualizaciones en la pestaña de evaluación de modelos para juzgar qué tan bien el modelo puede predecir los ingresos, destacando la eficacia de las herramientas modernas de aprendizaje automático.

Highlights

I can build a powerful machine learning model nowadays just by chatting to an AI assistant.

With AI tools and services on the rise, the barrier to learning anything really has been lowered.

I'll show you the simplest way I know to build a strong machine learning model with no actual coding involved.

I used pcan, who have kindly also sponsored this video, but as always, all opinions, thoughts and reflections on the tool will of course be absolutely of my own.

You'll get to see how simple and effective it can be to utilize the latest technologies to build your own machine learning models regardless of your experience.

Even though you can build precise models with zero coding involved, you can of course adjust your code within pcan.

I walked through how I built a revenue forecasting model, but you could obviously predict other things like LTV, customer turn or winback, marketing mix or how to up and cross sell.

I got to interact with the pcan AI assistant, which asked me some guiding questions to help me build my machine learning model.

The assistant recommended the subject of my prediction, the target value, and all I had to do was to confirm that all was good so far.

The tool asked me how far into the future I'd like to predict the revenue, and I went with the most popular future time horizon - a month.

I chose to go with predicting on a monthly basis, but could have triggered predictions based on specific events.

Pcan generated the Predictive Analytics question for me, and I moved on to connecting to my data by uploading a CSV file.

The AI assistant looked at the schema of the file and recommended the column mappings based on the schema for each column type.

Pcan did all the heavy lifting for me in the background, so all I had to do was to click on generate notebook and go to it.

The predictive notebook acted as the brains or the control room of the entire model building process, with SQL queries and explanations built by the AI assistant.

Transcripts

play00:00

I truly think it's insane that I can

play00:02

build a powerful machine learning model

play00:04

nowadays just by chatting to an AI

play00:06

assistant I remember when I first

play00:08

started my career doing Predictive

play00:10

Analytics was hard really hard with AI

play00:14

tools and services on the rise the

play00:16

barrier to learning anything really has

play00:18

been lowered or at the very least you

play00:20

can learn whatever you want quicker if

play00:22

you know what tools to use and how to

play00:24

use them in the most efficient way in

play00:27

today's video I'll show you the simplest

play00:30

way I know to build a strong machine

play00:32

learning model with no actual coding

play00:34

involved I used pcan who have kindly

play00:37

also sponsored this video but as always

play00:40

all opinions thoughts and Reflections on

play00:42

the tool will of course be absolutely of

play00:45

my own whether you're a machine learning

play00:47

newbie or have some or maybe lots and

play00:50

lots of experience training your own

play00:51

models I'd encourage you to stick around

play00:54

as you'll get to see how simple and

play00:56

effective it can be to utilize the

play00:58

latest Technologies to build build your

play01:00

own machine learning models regardless

play01:02

of your experience and I say regardless

play01:05

of experience because even though you

play01:07

can build precise models with zero

play01:10

coding involved you can of course adjust

play01:12

your code within pcan I'll show you

play01:14

later how so I'll walk you through how I

play01:17

built a revenue forecasting model but

play01:19

you could obviously predict other things

play01:21

like LTV customer turn or winback

play01:24

marketing mix or how to up and cross

play01:26

sell you can try and build your own

play01:28

model the same way by the way ass

play01:30

signing up to pcan is completely free

play01:32

I'll put the link in the description

play01:34

below along with the link to the exact

play01:37

data set that I used so after I logged

play01:40

in straight away I got to interact with

play01:42

the pcan AI assistant the way the

play01:44

assistant works is that it asked me some

play01:47

guiding questions to help me build my

play01:49

machine learning model so I answered the

play01:52

first question and told the AI assistant

play01:55

that I would like a revenue forecast

play01:56

model at the customer level this simply

play01:59

means that I want to predict what the

play02:01

revenue is for each and every customer

play02:04

the assistant is pretty smart as it

play02:06

recommended the subject of my prediction

play02:09

which was the customer of course and my

play02:11

target value which was the revenue and

play02:14

all I had to do was to confirm that all

play02:17

was good so far then I got another

play02:19

guiding question asking me how far into

play02:21

the future I'd like to predict the

play02:23

revenue for each customer you can choose

play02:26

whatever you want really next week month

play02:28

quarter or even year but I went with

play02:31

probably the most popular future time

play02:33

Horizon a month year then the tool asked

play02:36

me on what recurring basis I'd like to

play02:38

make these Revenue predictions again I

play02:41

went with something simplistic here so I

play02:43

said that I'd like the frequency of the

play02:45

predictions to be monthly I also had the

play02:48

options to trigger my predictions based

play02:50

on specific events for example when a

play02:52

customer makes a purchase but for this

play02:54

exercise for this model I chose to go

play02:57

with predicting on a monthly basis then

play03:00

pcan generated the Predictive Analytics

play03:03

question for me all I had to do was to

play03:05

confirm that everything still looked

play03:07

good and I moved on to connecting to my

play03:10

data I uploaded my CSV file which is

play03:12

actually a kaggle competition file that

play03:14

was cleaned up a bit and as I said

play03:16

before the link is in the description

play03:18

below so you can go ahead and download

play03:21

it and build your own machine learning

play03:23

model now of course pcon has a bunch of

play03:26

connectors when it comes to connecting

play03:28

to your data sets so if you have

play03:30

something sitting on SQL servers or with

play03:33

popular Cloud providers that's not a

play03:36

problem at all pcan is um capable of

play03:39

processing lots and lots of information

play03:41

as it uses data bricks so you should

play03:43

feel confident about loading massive

play03:46

data sets after the file upload was

play03:48

complete I simply sent it to the chat

play03:51

and let the tool do its work with

play03:52

analyzing the data the AI assistant

play03:55

looked at the schema of the file and

play03:57

recommended the column mappings of the

play03:59

data set based on the schema for each

play04:01

column type I quickly saw what the data

play04:03

type was I confirmed that everything

play04:06

looked good and moved on this time the

play04:09

tool actually figured it out that the

play04:11

user ID column was the customer ID the

play04:14

amount represented the revenue for each

play04:16

transaction and the event time was the

play04:19

date or timestamp that I needed again I

play04:22

confirmed that everything looked good

play04:25

and then I got a summary with my

play04:27

predictive question the schema my Target

play04:30

table Target value column Target table

play04:32

date column and the target entity pcan

play04:36

did all the heavy lifting for me in the

play04:38

background so now all I had to do was to

play04:41

click on generate notebook and then go

play04:43

to it to see what's actually in there

play04:46

think of the predictive notebook that I

play04:47

just generated as the brains or the

play04:50

control room of the entire model

play04:52

building process I had my SQL queries in

play04:56

here that the AI assistant built for me

play04:58

you can also see that all of the steps

play05:00

were clearly explained each query had a

play05:03

name and was actually saved kind of like

play05:06

a view so then the next query or sell

play05:08

could utilize the data from the query

play05:10

above for example the sampled customers

play05:13

table could utilize the information from

play05:15

the monthly sampling table so Pan's AI

play05:18

assistant constructed the core set for

play05:20

me by using the answers I provided to

play05:23

the guided questions now what do I mean

play05:26

by a coret it is the data that allowed

play05:28

my model to to know what it needs to

play05:30

learn and where it needs to learn from

play05:33

so the coret was a final table that

play05:35

consisted of all users sample dates and

play05:38

the target value which in my case was

play05:40

the revenue within 1 month after the

play05:42

sample date now the last thing in my

play05:45

notebook was the attribute section and

play05:47

if you have no idea what this is don't

play05:49

worry as I'm going to explain this in a

play05:51

very simple way and attribute is the

play05:54

data that my model will use to identify

play05:57

and find the patterns that will then

play05:59

tell my my model what the predictions

play06:01

will be so when the model is training

play06:03

it's learning the patterns to produce

play06:06

the correct Target values long story

play06:08

short use the training set to predict

play06:11

your Target on an ongoing basis then use

play06:14

your model in real life pcan also has

play06:16

the option to add more attributes if I

play06:18

wanted to so I could have easily added

play06:21

more by adding more data whether it was

play06:23

just me uploading some files or

play06:25

connecting to one of the many databases

play06:27

that are supported now of of course if I

play06:30

added more data I could have just used

play06:31

the AI assistant to replace my already

play06:34

existing query so that it runs on my new

play06:37

data set again no coding involved just

play06:40

pure AI magic I wanted to keep my model

play06:43

nice and light so I chose not to add any

play06:45

more attributes I just went with the one

play06:48

I already had my notebook had everything

play06:51

I needed to train my model using the

play06:53

data set I uploaded into the chat

play06:55

earlier I hit run all which ran all of

play06:58

my SQL queries

play07:00

then I trained my model now I had two

play07:03

options fastest which is by no surprise

play07:06

fast as it only takes about 10 to 30

play07:08

minutes to train a model and production

play07:10

quality which provides better

play07:12

performance but takes a little longer to

play07:14

train I know it says several hours here

play07:17

but my model was actually built in about

play07:19

an hour or so the time it takes will of

play07:22

course depend on how complex your

play07:23

machine learning model is so once I hit

play07:26

train model P can quickly rans some data

play07:29

valid ations to check that my data was

play07:30

actually fit for building a predictive

play07:33

model and that was it I sat back and

play07:35

waited for about an hour and I had my

play07:37

Model results with some cool metrics and

play07:40

visualizations that helped me to gauge

play07:42

how good my model actually was I could

play07:45

see on the model evaluation tab under

play07:48

model performance that my model was very

play07:51

precise meaning the model was very close

play07:53

to the actual values the pan platform

play07:56

has a really powerful engine behind it

play07:58

hence the really good result results

play07:59

clearly their data teams know what

play08:02

they're doing now the model evaluation

play08:04

tab has a bunch of other metrics as well

play08:07

and I won't go through all of them but I

play08:09

will highlight column importance which

play08:11

was very useful to know in my model I

play08:14

could see that the amount column was by

play08:16

far the top contributing column to the

play08:19

model predictions which makes sense

play08:22

another helpful tab I used for

play08:24

interpreting my Model results was the

play08:26

model output tab I could quickly see

play08:29

what the prediction was for each user

play08:31

for each month I'm getting more and more

play08:33

used to how much and how fast AI can do

play08:35

things but at times it is still

play08:37

mindboggling to me that it allows me to

play08:40

do such difficult tasks like building a

play08:42

strong machine learning model just by

play08:44

interacting with an AI chat assistant

play08:47

now does this mean that coding is

play08:49

useless absolutely not the ability to

play08:53

read write understand and interpret code

play08:55

is still very very important in my

play08:57

opinion just think of this who can

play09:00

develop the better machine learning

play09:01

model in a shorter time frame the person

play09:04

who knows how to use the latest AI tools

play09:06

but has no real technical expertise or

play09:09

the person who also knows how to use the

play09:12

latest AI tools and has extremely strong

play09:15

technical skills surely the person with

play09:17

the strong technical skills will be able

play09:19

to fine-tune the model better and faster

play09:21

using the same AI tools compared to the

play09:24

person with little technical expertise

play09:27

not to mention all of the underlying

play09:29

math and statistical knowledge that is

play09:31

of course also essential to building

play09:33

good machine learning models anyway I'm

play09:36

going to end this video here if you

play09:38

enjoy content like this make sure to

play09:41

check out some of my other videos right

play09:43

here thank you so much for watching and

play09:46

I shall see you in the next

play09:51

[Music]

play09:57

one