BIG DATA en Ecommerce. Modelos Predictivos de Consumo y Segmentación mediante Técnicas Analíticas
Summary
TLDREl profesor Alex Rabasa de la Universidad Miguel Hernández de Elche, en una presentación virtual en el Blackhat SEO y Grow de Commerce, aborda los modelos predictivos de consumo y segmentación en el comercio electrónico. Distingue entre modelos descriptivos y predictivos, explicando técnicas analíticas de big data como reglas de asociación, segmentación de usuarios, alertas de abandono de página y predicción del embudo de conversión. Destaca la importancia de la selección automática de variables para manejar grandes volúmenes de datos y mejorar la competividad, mencionando técnicas como el Support Vector Machine, el análisis discriminante y algoritmos genéticos.
Takeaways
- 👋 Alex Rabasa, profesor de la Universidad Miguel Hernández de Elche, agradece la oportunidad de hablar en el evento BlackHat SEO y Grow de Commerce.
- 🔍 Distinguimos entre modelos descriptivos y predictivos en análisis analíticos, donde los primeros describen datos hasta un momento actual y los segundos predice comportamientos futuros.
- 📊 Se utiliza la técnica de 'reglas de asociación' en análisis descriptivos para encontrar patrones de productos demandados simultáneamente en una sesión de navegación.
- 👥 La segmentación de usuarios es clave en e-commerce, creando grupos según perfiles de navegación y compra, utilizando técnicas de análisis de clúster.
- 🛒 Los algoritmos como Apriori, Tease y Cummings son fundamentales para el análisis de asociación y segmentación de usuarios.
- ⏰ La detección temprana del abandono de la página sin compra es un problema predictivo importante, donde se intenta predecir el comportamiento del usuario para evitar la pérdida de ventas.
- 📉 El 'embudo de conversión' es otro desafío predictivo, donde se busca predecir el gasto total del cliente basándose en su perfil de navegación.
- 🌐 La analítica big data en e-commerce se ha vuelto más compleja debido a la gran cantidad y diversidad de datos disponibles desde diversas fuentes.
- 🔑 La selección de variables más importantes, también conocida como 'feature selection', es una técnica crítica para manejar grandes volúmenes de datos y mejorar la eficiencia del análisis.
- 🛠️ Técnicas como el Support Vector Machine, el Análisis Discriminante y los Algoritmos Genéticos son algunas de las herramientas utilizadas en el 'automatic set' o selección de variables.
- 📈 La finalidad de estas técnicas es reducir la dimensión de los problemas de análisis sin perder información ni precisión, permitiendo respuestas más rápidas y eficientes.
Q & A
¿Quién es Alex Rabasa y qué profesión desempeña?
-Alex Rabasa es profesor de la Universidad Miguel Hernández de Elche.
¿En qué evento participó Alex Rabasa y cómo lo hizo?
-Alex Rabasa participó en un evento organizado por Blackhat SEO y Grow de Commerce, y lo hizo de manera virtual.
¿Cuáles son las dos categorías principales de modelos analíticos que Alex Rabasa menciona en su presentación?
-Las dos categorías principales de modelos analíticos mencionadas son los modelos descriptivos y los modelos predictivos.
¿Qué diferencia hay entre los modelos descriptivos y los predictivos según la presentación de Alex Rabasa?
-Los modelos descriptivos se utilizan para describir los datos hasta un instante actual, mientras que los modelos predictivos intentan predecir el comportamiento futuro a partir de un histórico de datos.
¿Qué es el análisis de reglas de asociación y cómo se utiliza en el e-commerce según la presentación?
-El análisis de reglas de asociación es una técnica clásica utilizada para encontrar patrones de productos que han sido demandados simultáneamente en una misma sesión de navegación en el e-commerce.
¿Qué es la segmentación de usuarios y cómo es relevante para el e-commerce?
-La segmentación de usuarios es el proceso de crear grupos de usuarios según sus perfiles de navegación y compra, lo que permite personalizar la experiencia del cliente y mejorar las estrategias de marketing.
¿Cuál es el objetivo de la segmentación de usuarios en tiempo real en el e-commerce?
-El objetivo de la segmentación en tiempo real es identificar y agrupar a los usuarios según sus comportamientos y patrones de navegación, para ofrecerles experiencias personalizadas y relevantes.
¿Qué técnica se utiliza para predecir el abandono de una página sin compra en el e-commerce?
-Para predecir el abandono de una página sin compra, se utilizan técnicas predictivas como las reglas de clasificación, que analizan patrones de navegación y otros datos para inferir el comportamiento del usuario.
¿Qué es el 'embudo de conversión' en el e-commerce y cómo se aborda en la presentación?
-El 'embudo de conversión' se refiere al proceso de reducir el número de visitantes potenciales a clientes finales. En la presentación, se menciona la predicción de este embudo a través de modelos analíticos que trabajan con variables numéricas o alfanuméricas.
¿Qué cambios ha habido en la analítica big data en e-commerce según lo discutido por Alex Rabasa?
-Según Alex Rabasa, la analítica big data en e-commerce ha evolucionado de manejar grandes volúmenes de datos a lidiar con una fuente de datos heterogénea y rica, lo que requiere técnicas como la selección de variables más importantes para mejorar la competividad del portal.
¿Qué técnicas analíticas están posicionándose como críticas en la investigación de selección de variables en el e-commerce?
-Las técnicas analíticas que están posicionándose como críticas en la selección de variables incluyen el Support Vector Machine, el análisis discriminante, el análisis de clúster y los algoritmos genéticos.
Outlines
😀 Introducción a Modelos Predictivos y Segmentación en E-commerce
El profesor Alex Rabasa de la Universidad Miguel Hernández de Elche inicia su presentación agradeciendo a Blackhat SEO y Grow de Commerce por la oportunidad de hablar sobre modelos predictivos de consumo y segmentación en técnicas de ecommerce. Destaca la importancia de distinguir entre modelos descriptivos y predictivos, y cómo estos se aplican en análisis analíticos de big data. Expone la idea de utilizar técnicas descriptivas para describir datos históricos y técnicas predictivas para anticipar comportamientos futuros basados en el historial. Ejemplifica con la segmentación de usuarios y análisis de carritos de compra en plataformas como Amazon, utilizando algoritmos de asociación para encontrar patrones de productos demandados simultáneamente.
🔍 Segmentación de Usuarios y Alertas de Abandono de Página
Continúa el análisis de técnicas analíticas en ecommerce, enfocándose en la segmentación de usuarios según sus perfiles de navegación y compra en tiempo real. Muestra cómo se representan estos segmentos mediante gráficos de nubes de puntos y cómo se pueden clasificar usuarios según su gasto y tiempo de navegación. Aborda el problema de predecir el abandono de la página sin realización de compra, utilizando datos de navegación y perfiles demográficos para inferir patrones que podrían indicar un abandono inminente. Introduce el uso de algoritmos de clasificación como C4.5 y RBS para generar reglas predictivas y se adentra en el análisis predictivo del 'embudo de conversión', buscando modelos analíticos que permitan cuantificar el gasto total de los usuarios basándose en sus patrones de navegación.
📈 Selección de Variables y Tendencias en Análisis de Big Data
En el tercer párrafo, se discuten las complejidades del análisis de big data en ecommerce, donde la información proviene de múltiples fuentes heterogéneas. Se resalta la necesidad de la selección de variables importantes para manejar la creciente cantidad de datos sin perder precisión en los modelos predictivos. Se menciona que esta técnica, conocida como 'selección de variables automática', es fundamental para mejorar la competividad y para realizar análisis eficientes en tiempo real. Se destaca el uso de técnicas como el Máquina de Soporte Vectorial (SVM), el Análisis Discriminante y los Algoritmos Genéticos, que están mostrando buenos resultados en diferentes contextos. Concluye la presentación con una invitación a las preguntas y un agradecimiento por la oportunidad de participar en el congreso.
Mindmap
Keywords
💡Profesor
💡Modelos predictivos
💡Segmentación de usuarios
💡E-commerce
💡Big Data
💡Análisis descriptivo
💡Reglas de asociación
💡Algoritmos de agrupamiento
💡Selección de variables
💡Análisis de conversión
Highlights
Alex Rabasa, profesor de la Universidad Miguel Hernández de Elche, agradece la oportunidad de participar en la conferencia virtual.
Distinguir entre modelos descriptivos y predictivos en análisis de datos para el comercio electrónico.
Modelos descriptivos se utilizan para describir datos hasta un momento actual, mientras que los predictivos intentan predecir comportamientos futuros.
Señalamiento de la importancia de técnicas analíticas de big data en el comercio electrónico.
Explicación de cómo los modelos analíticos se combinan para abordar problemas específicos del comercio electrónico.
Problema de análisis de carritos de compra y la búsqueda de patrones de productos demandados simultáneamente.
Uso de reglas de asociación como algoritmos Apriori y Tear para encontrar patrones de navegación en portales de comercio electrónico.
Importancia de la segmentación de usuarios en función de sus perfiles de navegación y compra en tiempo real.
Representación bidimensional o tridimensional de nubes de puntos para segmentar a los usuarios según su comportamiento de navegación.
Algoritmos de clúster como Cummings, K-Means y variantes utilizados en segmentación de usuarios.
Desarrollo de alertas tempranas para predecir el abandono de la página sin compra basado en el perfil de navegación del cliente.
Uso de algoritmos de clasificación como C4.5, RBS para generar reglas que predecirán el comportamiento del usuario.
Predicción del 'embudo de conversión' en el comercio electrónico, intentando inferir el gasto total del cliente a partir de su navegación.
Uso de modelos de regresión con árboles y sistemas de regresión del tipo M5 para abordar problemas predictivos con variables numéricas.
Cambio en la analítica big data hacia la gestión de datos heterogéneos y fuentes de información más ricas.
Selección de variables más importantes (feature selection) como técnica fundamental para manejar información abrumadora.
Support Vector Machine y análisis discriminante mejorados como técnicas efectivas en selección de variables.
Algoritmos genéticos como campo abierto en la selección de variables y optimización de modelos analíticos.
Conclusión enfatizando la importancia de técnicas de selección de variables para análisis eficientes y respuestas en tiempo real.
Transcripts
hola buenas soy alex rabasa soy profesor
de la universidad miguel hernández de
elche y bueno antes de hacer esta breve
exposición pues quiero agradecer a la
organización de blackhat seo y grow de
commerce la posibilidad de estar hoy
aunque sea de manera virtual con todos
vosotros y bueno sin más pues quiero en
unas pocas transparencias en unas pocas
slides contar un poquito acerca de los
modelos predictivos de consumo y también
de segmentación que se dan actualmente
en las técnicas ecommerce a través de
técnicas analíticas de big data en
primer lugar hay que distinguir entre
los modelos analíticos que más se
emplean en el mercado en general en
cualquier tipo de problema de análisis y
hay que distinguir en estos modelos
analíticos entre modelos descriptivos y
modelos predictivos puramente dichos
entonces realmente aunque hay muchos
matices en la principal diferencia entre
ambos modelos está en que intentemos
estar describiendo los datos e intentar
describir los datos desde
el tiempo de inicio de que tengamos
recogidos hasta un instante actual
siempre que intentamos describir esa
información estamos utilizando técnicas
puramente descriptivas pero si
intentamos describir los datos
adelantándonos a su comportamiento a
partir de un histórico desde un instante
de tiempo actual hacia el futuro
entonces estaremos hablando ya de
técnicas predictivas en la gráfica
podéis ver cómo efectivamente se puede
producir a partir de un instante de
tiempo actual esa especie de cola de
caballo se produce ahí donde asignamos
una probabilidad de que ocurran unos
determinados valores otros u otros que
aparecen en la gráfica en amarillo el
naranja o en o en rojo bien
distinguiendo entre los dos tipos de
técnicas que hay tanto descriptivas como
predictivas una vez nos metemos en todo
el ámbito del ecommerce se pueden
producir perfectamente de manera
combinada bien modelos descriptivos
por un lado modelos predictivos o mixtos
entonces la intención en esta en esta
breve presentación es comentar a modo de
casos concretos de problemas muy
puntuales algunas de las técnicas que
más se emplean en uno de los casos
típicos son los carritos de la compra
entonces
uno de los problemas fundamentales y
aquí tenéis la referencia para que todo
el mundo de la que todo el mundo hacemos
uso amazon
y la típica cuestión que nos plantean
cuando navegamos por ahí en los usuarios
que estuvieron interesados en este
producto también estuvieron interesados
en tales otros hay realmente el objetivo
que tienen desde el punto de vista
analítico siempre es encontrar los
patrones de los productos que han sido
más demandados simultáneamente en una
misma sesión de navegación
estamos ante un tipo de análisis
puramente descriptivo en lo que se llama
en la franja izquierda antes del
instante actual y como modelos de
análisis se están empleando de manera
clásica lo que se llaman las reglas de
asociación
ahí hay distintos tipos de algoritmos un
background que son el a priori a priori
tease y otros que se encargan de
encontrar esos patrones esas esas
combinaciones de navegación o de
selección de productos más recurrentes
en ese portal
este es un problema clásico
el segundo que es realmente más más
impacto tiene en el mundo del ecommerce
es la segmentación de usuarios
segmentación de usuarios de clientes de
lo que queráis cuál es el objetivo en
este en este problema en lo que se
pretende es crear grupos de usuarios
según hayan sido o estén siendo en
tiempo real sus perfiles de navegación
perfiles de compra además entonces
recurrimos a la típica representación
bidimensional o tridimensional de nubes
de puntos valen de manera según tenéis
aquí en la gráfica pues son los puntos
de color rojo se corresponden a lo mejor
a usuarios que han invertido o que han
acabado gastando un elevado número de
euros en pocos minutos de navegación
mientras los que tenéis en un color así
más verde son los que han gastado mucho
dinero de acuerdo pero sí que es cierto
que han estado mucho tiempo navegando si
en un momento dado interesara online
offline
segmentar a los usuarios según unas
determinadas pautas de navegación en
este caso numéricas siempre numéricas
para la segmentación entonces estaríamos
hablando de un problema clásico basado
como os pongo ahí abajo en modelos de
análisis de tipo agrupamiento o clúster
y bien para quien quiera buscar más
sobre el tema los algoritmos típicos que
están subyacen a estos modelos son el
algoritmo cummings claro caminos y
variantes de estos bueno esto es
realmente es una de las técnicas que más
se ha empleado porque en un momento dado
a través de todas las visitas a un
portal de e-commerce la segmentación es
absolutamente natural guiada única y
exclusivamente por los datos en sí y lo
que hay es lo que segmenta de acuerdo a
sí que es cierto que se van eligiendo
distintas
dimensiones que pueden ser gas todo
tiempo edad o cualquier otro perfil
sociodemográfico de los usuarios si se
disponen a partir de accesos
identificados
en el tercero de los problemas más
demandados en el ámbito del ecommerce es
intentar de disparar
alertas tempranas
previas al abandono de la página sin
compra es decir el cliente tiene un
determinado perfil de navegación y
podemos inferir a partir de cuál está
siendo su patrón de navegación por el
portal podemos predecir cuándo va a
abandonar la página sin compra
a partir de que datos de los que estemos
registrando en cada momento si ha sido
un acceso identificado y disponemos del
género de la persona si es hombre o si
es mujer puede tener un conducir hacia
unas pautas de navegación por el portal
u otra la temporada en la que está
accediendo ya no digo el mes a lo mejor
sencillamente por prestaciones en
primavera-verano tal la duración la
duración de la visita al portal pues a
lo mejor transcurridos una serie de
segundos o de minutos es más probable el
abandono de alguna manera lo que
pretendemos con estas técnicas es sacar
las reglas que predicen cuando el
usuario va a abandonar el portal en este
caso en concreto sin haber hecho compra
bien este es un análisis que ya cae
dentro del ámbito predictivo no como los
anteriores que eran meramente
descriptivos y los modelos analíticos
que se emplean en este tipo de
situaciones son los los algoritmos que
se conocen como reglas de clasificación
y bueno ya para los más morbosos que
quieran adentrarse más en en faena pues
estamos hablando de algoritmos
como el c4 5 el rbs o similares que
todos lo que pretenden es generar esas
reglas de clasificación como se muestra
en la ruleta que tenéis también en la
diapositiva
y bueno hay otro problema clásico que
nos preocupa en el mundo del ecommerce
que es la predicción de ese famoso
embudo de conversión que tantos
quebraderos de cabeza nos nos provocan
también dentro del ámbito predictivo en
este caso lo que queremos es de alguna
manera medir o intentar inferir a partir
de los clics y de la navegación
el total de gasto de la persona en
dentro de nuestro portal de commerce
entonces pero en este caso lo que
pretendemos no es compras y compra no
sino de alguna manera lo que queremos es
cuantificar al poder modelar el total
del gasto final de la persona a partir
de los perfiles de navegación este es un
problema distinto de la anterior
estábamos trabajando con variables
meramente cualitativas discretas ahora
pasamos una página y estamos
enfrentándonos a un modelo nuevo de
análisis que trabaja con variables
numéricas o alfanuméricas y también
dentro del ámbito predictivo que es lo
que se tiene que emplear en este caso
bueno los modelos analíticos son
distintos sustancialmente de los
anteriores y estamos moviéndonos en el
ámbito de la regresión con árboles o con
sistemas de regresión de la familia del
m5 o similares bien la amalgama de
problemas es muy grande no como estos
son unos breves ejemplos en el que os he
querido contar identificar las técnicas
que son más familiares los problemas que
no son más más
en los portales y converse con las
técnicas analíticas de minería de datos
que realmente se esconden detrás de
estos procesos las tendencias actuales
en la analítica big data en ecommerce
realmente se
han dado un vuelco inicialmente
estábamos hablando de problemas portales
en general de millones de registros
valerón de donde cada entrada iban
produciendo que la base de datos
creciera a lo largo es decir estamos
produciendo un histórico mayor mayor
mayor y teníamos una serie de datos
acotado de los que íbamos guardando más
registros y más registros pero el
problema hoy en día es otro el problema
hoy en día es que no estamos recoger la
información de todo tipo de distintas
fuentes entonces nos encontramos como
este señor pobre de la imagen que el
hombre pues tiene su base de datos
propia no de la empresa pero es que a lo
mejor también quiere recoger información
de twitter las cuentas de su empresa en
twitter entonces
el instituto nacional de estadística de
la propia agencia estatal de
metereología estamos bombardeados por
información que podemos usar en nuestro
favor esto hace que los problemas no
solo crezcan como antes a lo largo que
vayan añadiendo s filas vamos a decir es
que aquí el problema ahora está en una
fuente de datos mucho más heterogénea
mucho más rica de acuerdo y mucho más
ancho el problema es decir vamos
añadiendo más dimensiones al problema no
solo más longitud y eso nos situamos en
un pozo como este pobre hombre que está
intentando salir y alguien tiene que
venir a nuestro rescate la técnica
analítica siempre desde ese punto de
vista de esta exposición la técnica
analítica que tiene que venir en nuestra
ayuda es la que se conoce como la
selección de las variables más
importantes el automatic situ selecciòn
y eso es eso es fundamental porque
porque ya no disponemos de un conjunto
acotado de información del que ir
añadiendo histórico no no
ahora lo que tenemos es cada vez más
información a nuestro alrededor que si
está bien explotada tiene que redundar
en mejorar la competividad de nuestro
portal como conclusión
realmente es esta técnica que acabo de
decir el automatic selection es la que
realmente se está posicionando en el
campo de investigación
que nos estamos moviendo en mi grupo se
está plasmando como algo crítico valen
algo la piedra angular para intentar
producir análisis mucho más eficientes
que den respuesta en tiempo real que es
lo que realmente se pretende no lo que
intenta esta técnica es reducir la
dimensión de los problemas esos y
reducirlas sin pérdida de la información
y también sin perder la precisión que le
estamos requiriendo a todos los modelos
predictivos que estábamos hablando y
bueno y por cerrar un poco el círculo y
en comparativa con los problemas que
hemos visto antes cuáles son los modelos
analíticos que están detrás de este
automatic set o selección pues el
support vector machine es una técnica
que se está demostrando como muy muy con
muy muy buenos resultados en según qué
contextos el análisis discriminante
clásico de toda la vida con algunos
ajustes también va bastante bien el
análisis clúster y un campo abierto
desde hace unos años a esta parte los
algoritmos genéticos también
bueno pues con esta exposición solamente
era dar una batida muy rápida para
intentar ver que detrás de todos estos
problemas reales nos encontramos
predictivos y descriptivos del mundo en
el e-commerce
existen los mecanismos adecuados los
modelos analíticos adecuados en cada
caso bueno ahora cuando lo
corresponderían las preguntas pero
lamentablemente fue el responder así que
tenéis ahí mi correo electrónico y
estaré encantado de hacerlo en cuanto
considerase oportuno muchas gracias y
disfrutar del congreso
Weitere ähnliche Videos ansehen
TÉCNICAS DE GESTIÓN Y ANÁLISIS ESTADÍSTICO PARA LA APLICACIÓN DE MODELOS PREDICTIVOS EN EL BIG DATA
Modelos Predictivos: Análisis Predictivo para Optimizar Estrategias Comerciales en las Empresas
What is Big Data? - Computerphile
Data Anlytics - Tipos de análisis de datos | Comunicación Numérica
El impacto del Bigdata y el Smartdata en Gestión de Riesgos
Modelización de datos en Big Data
5.0 / 5 (0 votes)