ChatGPT STRAWBERRY ya está aquí 🍓 ¡Pongo a prueba OpenAI-o1!

Xavier Mitjana
13 Sept 202414:49

Summary

TLDROpenAI ha lanzado su nuevo modelo, el GPT-4 O1, diseñado para razonar y resolver problemas complejos en áreas como ciencia, código y matemáticas. Incorporado en ChatGPT, el modelo ofrece mejores respuestas al pensar más antes de contestar. Aunque no puede acceder a Internet ni procesar archivos, su rendimiento en tareas de razonamiento es significativamente superior, lo que sugiere un avance en la IA. El video explora su capacidad con ejemplos específicos y destaca la necesidad de encontrar casos de uso efectivos.

Takeaways

  • 🚀 OpenAI ha lanzado un nuevo modelo de inteligencia artificial llamado GPT-4, conocido como OpenAI O1, diseñado para razonar de manera más profunda y resolver problemas complejos.
  • 🔍 El modelo OpenAI O1 está disponible en ChatGPT y se ha incorporado directamente para su uso, lo que permite probarlo y explorar sus capacidades.
  • 🧠 Se enfatiza que el modelo está entrenado para 'pensar' más antes de responder, lo que sugiere una capacidad para razonar a través de tareas complejas, especialmente en ciencia, código y matemáticas.
  • 📈 En pruebas, el modelo ha demostrado un rendimiento similar al de estudiantes de doctorado en tareas relacionadas con física, química, biología y ha alcanzado un alto percentil en competencias de programación.
  • 🚫 A pesar de sus capacidades, el modelo no puede conectarse a Internet, ni procesar archivos o imágenes, lo que limita su utilidad en comparación con otras versiones de ChatGPT.
  • 💡 Se sugiere que el modelo puede ser especialmente útil para profesionales en campos científicos, programación y matemáticas, aunque su utilidad para el público general podría ser limitada en su versión actual.
  • 💬 El modelo O1 Preview y O1 Mini se presentan como opciones en ChatGPT, con limitaciones en el número de mensajes disponibles para su uso, lo que indica una intención de probar y ajustar su rendimiento.
  • 🔍 Se realizan pruebas con problemas lógicos y de overfitting para evaluar la efectividad del modelo en comparación con versiones anteriores, mostrando una mejora en la resolución de problemas.
  • 🌐 Se destaca la necesidad de encontrar casos de uso más genéricos y habituales para el modelo, especialmente en la interacción con usuarios que no necesariamente se centren en campos científicos o técnicos.
  • 🔦 Se invita a la comunidad a contribuir con ideas de casos de uso para el modelo, lo que sugiere una apertura a la colaboración y la mejora continua de la tecnología.

Q & A

  • ¿Qué modelo de inteligencia artificial ha presentado OpenAI recientemente?

    -OpenAI ha presentado un nuevo modelo llamado OpenAI O1, que es capaz de razonar y está diseñado para pensar más antes de responder.

  • ¿En qué plataformas está disponible el modelo OpenAI O1?

    -El modelo OpenAI O1 ya está disponible en ChatGPT y también se puede acceder a través de la API, aunque para usarlo en la API es necesario cumplir con ciertos requisitos de gasto previo.

  • ¿Cuál es la diferencia clave entre el modelo OpenAI O1 y los modelos anteriores?

    -El modelo OpenAI O1 está entrenado para pasar más tiempo pensando antes de responder, lo que le permite razonar a través de tareas complejas y resolver problemas más difíciles, especialmente en áreas como la ciencia, el código y las matemáticas.

  • ¿En qué áreas específicas ha mejorado el rendimiento el modelo OpenAI O1 según el artículo mencionado en el guion?

    -El modelo OpenAI O1 ha mejorado su rendimiento en áreas como la ciencia, la programación y las matemáticas, siendo especialmente útil para ser un asistente en campos científicos y matemáticos.

  • ¿Cómo se compara el rendimiento del modelo OpenAI O1 con estudiantes de doctorado en tareas relacionadas con la física, la química o la biología?

    -Según las pruebas mencionadas en el guion, el modelo OpenAI O1 es capaz de resolver tareas a un nivel similar al de estudiantes de doctorado en estas áreas.

  • ¿Cuál es la capacidad del modelo OpenAI O1 en competencias de programación?

    -El modelo OpenAI O1 alcanza el percentil 89 en diferentes competencias de programación, lo que indica que su capacidad en código es muy alta.

  • ¿Por qué podría ser limitado el uso del modelo OpenAI O1 en comparación con otros modelos como GPT-4?

    -A pesar de su capacidad para razonar, el modelo OpenAI O1 actualmente no puede conectarse a Internet ni procesar archivos o imágenes, lo que limita su utilidad en comparación con modelos que sí tienen estas capacidades.

  • ¿Cuáles son algunos ejemplos de casos de uso donde el modelo OpenAI O1 podría ser especialmente útil?

    -El modelo OpenAI O1 podría ser útil para investigadores en salud que necesitan secuenciar células, físicos trabajando con fórmulas matemáticas complejas, o desarrolladores de software en entornos complejos.

  • ¿Cómo se puede acceder a los modelos OpenAI O1 en ChatGPT si se tiene una suscripción a ChatGPT Plus?

    -Si se tiene ChatGPT Plus, se puede acceder a los modelos OpenAI O1 iniciando una nueva conversación en ChatGPT y seleccionando el modelo O1 Preview o el modelo O1 Mini en el menú de selección de modelos.

  • ¿Cuál es la principal limitación para probar el modelo OpenAI O1 Preview en ChatGPT según el guion?

    -La principal limitación para probar el modelo OpenAI O1 Preview en ChatGPT es que solo se permite un número limitado de mensajes a la semana, con un total de 30 mensajes para conversar con él.

  • ¿Cómo se puede mejorar el uso del modelo OpenAI O1 en el futuro?

    -El uso del modelo OpenAI O1 podría mejorarse en el futuro al conectarlo con capacidades para analizar imágenes y datos, lo que multiplicaría sus posibilidades de uso y le permitiría encontrar casos de uso más genéricos y útiles.

Outlines

00:00

🚀 Lanzamiento del modelo OpenAI O1

OpenAI ha presentado su nuevo modelo, el O1, diseñado para razonar de manera más profunda y resolver problemas complejos. Este modelo ya está disponible en ChatGPT y se espera que mejore significativamente la capacidad de asistencia en campos científicos, matemáticas y programación. Se destaca que, a diferencia de modelos anteriores, el O1 está entrenado para 'pensar' más antes de responder, similar a cómo lo haría un ser humano, lo que podría llevar a respuestas más precisas y completas. Además, se menciona que el modelo ya ha sido implementado en ChatGPT y la API de OpenAI, aunque con ciertos requisitos y limitaciones, como la incapacidad de conectarse a Internet o procesar archivos e imágenes.

05:01

🔍 Pruebas del modelo O1 en tareas lógicas

El vídeo explora el rendimiento del modelo O1 en tareas lógicas complejas, comparándolo con el rendimiento de estudiantes de doctorado en disciplinas científicas. Se presentan tres pruebas de concepto para evaluar la capacidad de razonamiento del modelo: el problema de las velas, el orden alfabético de números del 1 al 100 y un acertijo sobre cruzar un río con una persona y una cabra. El modelo O1 demuestra una capacidad notable para resolver estas tareas, a pesar de algunos errores en situaciones de overfitting, donde el modelo tiende a repetir respuestas comunes basadas en su entrenamiento, en lugar de encontrar soluciones más simples y directas.

10:02

💡 Perspectivas y casos de uso del modelo O1

El vídeo concluye con una reflexión sobre las aplicaciones potenciales del modelo O1 en diversos campos, desde la investigación en salud hasta la física y la programación. Se sugiere que, a pesar de su reciente lanzamiento y las limitaciones actuales, el modelo O1 tiene el potencial para revolucionar la forma en que se utiliza la inteligencia artificial en tareas que requieren un razonamiento profundo y complejo. Se invita a la audiencia a explorar y compartir casos de uso que puedan beneficiarse de las capacidades del modelo, con la intención de crear un diálogo sobre cómo integrar mejor estas herramientas en la práctica diaria.

Mindmap

Keywords

💡OpenAI

OpenAI es una organización sin fines de lucro que se dedica a la investigación y desarrollo de inteligencia artificial. En el guion, OpenAI presenta su nuevo modelo de IA, el 'open a o1', destacando su capacidad para razonar y resolver problemas complejos, especialmente en áreas como la ciencia, la programación y las matemáticas.

💡Modelo de IA

Un modelo de IA, en este contexto, se refiere a un conjunto de algoritmos y datos entrenados para realizar tareas específicas, como el razonamiento y la resolución de problemas. El modelo 'open a o1' es un ejemplo de un modelo de IA avanzado presentado en el video.

💡Razonamiento

El razonamiento es el proceso de usar la lógica para analizar información y llegar a conclusiones. En el guion, se destaca que el modelo 'open a o1' ha sido entrenado para 'pasar más tiempo pensando antes de responder', lo que implica un enfoque en mejorar el razonamiento a través del procesamiento de tareas complejas.

💡Chat GPT

Chat GPT es una plataforma de conversación desarrollada por OpenAI que utiliza modelos de IA para interactuar con los usuarios a través del lenguaje natural. En el guion, se menciona que el modelo 'open a o1' ya está disponible en Chat GPT, permitiendo a los usuarios probarlo y ver su rendimiento en tiempo real.

💡Ciencia, Código y Matemáticas

Estos términos se refieren a campos académicos y profesionales que requieren un alto nivel de análisis y razonamiento. En el guion, se sugiere que el modelo 'open a o1' ha sido diseñado para mejorar el rendimiento de los modelos de lenguaje en estos campos específicos, ofreciendo asistencia avanzada en tareas científicas y matemáticas.

💡Overfitting

El overfitting ocurre cuando un modelo de aprendizaje automático se ajusta demasiado bien a los datos de entrenamiento, lo que puede llevar a una peor generalización en datos no vistos. En el guion, se menciona un ejemplo de overfitting al discutir cómo el modelo 'open a o1' a veces da respuestas que se ajustan a estructuras previamente vistas en lugar de soluciones simples y directas.

💡Lógica

La lógica es el estudio de la validez y la coherencia en el razonamiento. En el guion, se destaca la capacidad del modelo 'open a o1' para resolver problemas lógicos, lo que demuestra su habilidad para procesar y analizar información de manera coherente y efectiva.

💡API

API es el acrónimo de 'Application Programming Interface', que es un conjunto de rutinas y protocolos que permiten a diferentes softwares interactuar entre sí. En el guion, se menciona que el modelo 'open a o1' también está disponible a través de la API de OpenAI, lo que permite a desarrolladores y empresas integrarlo en sus propias aplicaciones y servicios.

💡Testimonios

Los testimonios son declaraciones o relatos personales que proporcionan evidencia o perspectiva sobre un tema o evento. En el guion, se menciona que hay testimonios de investigadores en física cuántica y genética que explican cómo pueden utilizar estos modelos de IA en sus campos, lo que demuestra la aplicabilidad y el valor práctico de la tecnología.

💡Casos de uso

Un caso de uso es una situación específica en la que se aplica una tecnología o solución para alcanzar un objetivo. En el guion, se discute la importancia de encontrar casos de uso genéricos y útiles para el modelo 'open a o1', lo que implica explorar y demostrar la efectividad del modelo en una variedad de contextos y problemas reales.

Highlights

OpenAI ha presentado su nuevo modelo, el GPT-4 O1, diseñado para razonar y resolver tareas complejas.

El GPT-4 O1 ya está disponible en ChatGPT y se ha incorporado directamente para su prueba.

El modelo GPT-4 O1 es una serie de modelos que pasan más tiempo pensando antes de responder para mejorar la calidad de las respuestas.

OpenAI enfatiza mejoras en áreas específicas como ciencia, código y matemáticas para ser mejores asistentes en campos científicos y de programación.

El modelo GPT-4 O1 ha sido entrenado para razonar a través de tareas complejas, similar a un estudiante de doctorado en física, química o biología.

En pruebas, el modelo ha demostrado ser capaz de resolver el 83% de los problemas en olimpiadas internacionales de matemáticas,对比GPT-4 Omni que solo resolvía el 1%.

Las habilidades de código del modelo GPT-4 O1 alcanzan el percentil 89 en diferentes competiciones.

Aunque el modelo GPT-4 O1 es superior en muchos casos, aún no tiene la capacidad de conectarse a Internet ni procesar archivos o imágenes.

El modelo GPT-4 O1 es especialmente útil para profesionales en campos de la ciencia, la programación o las matemáticas.

El modelo GPT-4 O1 mini es un modelo más económico, ideal para aquellos que buscan una solución de coste-eficiencia.

El modelo GPT-4 O1 preview tiene un límite de 30 mensajes a la semana, mientras que el GPT-4 O1 mini tiene 50 mensajes a la semana.

El modelo GPT-4 O1 ha demostrado ser capaz de resolver problemas lógicos con éxito, como el problema de las velas.

El modelo también resuelve correctamente el desafío de ordenar alfabéticamente los números del 1 al 100 en palabras.

Aunque el modelo GPT-4 O1 identifica la solución correcta para un acertijo, tiende a caer en el overfitting y replicar respuestas del dataset.

El reto futuro es encontrar casos de uso más genéricos y habituales para el modelo GPT-4 O1 que le permitan sacar un partido superior.

Se espera que la conexión de estos modelos con capacidades para analizar imágenes y datos multiplique las posibilidades de uso.

El lanzamiento del modelo GPT-4 O1 es una oportunidad para probar y explorar nuevos casos de uso que podrían ser útiles para un público más amplio.

Transcripts

play00:00

después de meses de especulaciones por

play00:02

fin Open Ai ha presentado su nuevo

play00:04

modelo el open a o1 un modelo que es

play00:07

capaz de razonar y no Solo lo ha

play00:09

presentado sino que ya está disponible

play00:11

en chat gpt y en el vídeo de hoy vamos a

play00:13

analizar en profundidad Este modelo

play00:15

vamos a probarlo y vamos a identificar

play00:17

posibles casos de uso dentro vídeo Open

play00:21

ae lleva meses preparando el terreno

play00:24

para un gran lanzamiento primero fue la

play00:26

noticia del proyecto qstar luego fue la

play00:28

noticia o todas las noticias

play00:30

relacionadas con el proyecto strauberry

play00:32

poco a poco fuimos descubriendo que

play00:34

opena Estaba preparando un modelo de

play00:36

Inteligencia artificial capaz de razonar

play00:37

de un modo más profundo y de repente

play00:40

Casi casi de la noche a la mañana

play00:42

presenta Este modelo y lo incorpora

play00:43

directamente a es gpt para que podamos

play00:45

probarlo Este modelo es el open a o1 una

play00:49

nueva serie de modelos es decir no es un

play00:51

único modelo sino que ya han presentado

play00:52

directamente dos que están diseñados

play00:55

para pasar más tiempo pensando antes de

play00:57

responder Es decir para meditar un poco

play00:59

la respuestas Y tratar de darnos la

play01:01

mejor respuesta posible a las preguntas

play01:03

que le formulemos pero vamos a ver un

play01:05

poco más en profundidad Cómo ha

play01:06

presentado Open a este modelo y en este

play01:09

artículo nos lo explican presentando

play01:10

openai o1 preview y lo que nos dicen es

play01:14

empiezan por esto el modelo está

play01:16

entrenado para pasar más tiempo pensando

play01:19

antes que responder por qué Porque de

play01:21

este modo el modelo puede razonar a

play01:23

través de tareas complejas para resolver

play01:25

problemas más difíciles y fijaros en qué

play01:27

áreas específicas nos pone en de ejemplo

play01:30

ciencia código y matemáticas veréis que

play01:34

todos los artículos están muy enfocados

play01:36

sobre todo en estas áreas en mejorar el

play01:38

rendimiento de los modelos de lenguaje

play01:39

para ser mejores asistentes en Campos

play01:41

científicos o Campos matemáticos o

play01:43

campos de programación también es muy

play01:46

interesante que nada más empezar el

play01:47

artículo nos dicen que este modelo ya se

play01:50

ha lanzado tanto en chang gpt como en la

play01:52

Api si bien es cierto que para

play01:54

utilizarlo en la Api debes cumplir con

play01:56

ciertos requisitos de gasto previo que

play01:58

son bastante exigentes pero

play02:00

esencialmente lo han presentado y lo han

play02:02

lanzado lo han puesto a disposición del

play02:04

público por lo que ya podemos probarlo y

play02:06

lo vamos a hacer un poco más adelante en

play02:08

este vídeo de momento sigamos

play02:10

contextualizando un poco qué hace este

play02:12

modelo lo que nos dicen es que han

play02:14

entrenado Este modelo para pasar más

play02:16

tiempo pensando a través del problema

play02:18

que le planteemos antes de responder un

play02:20

poco como lo haría una persona y a

play02:22

través del entrenamiento ha aprendido

play02:25

Cómo refinar el proceso de pensamiento

play02:27

para probar diferentes estrategias y

play02:29

hacer sus errores esto a mí me recuerda

play02:32

un poco a la polémica que hemos visto

play02:34

estos últimos días con el modelo

play02:35

reflexion 70b que al final era un prom

play02:38

que hacía un poco esto pues la sensación

play02:40

es que Open a ha cogido este sistema y

play02:43

lo ha integrado directamente dentro del

play02:45

propio modelo de modo que ahora tenemos

play02:47

un modelo que lo que hace es iterar un

play02:50

poco la respuesta pensarla procesarla y

play02:52

una vez la tiene ya meditada nos da una

play02:55

respuesta que en principio Debería ser

play02:56

superior cuán superior Pues según el

play03:00

propio pen bastante superior fijaros lo

play03:03

que nos dicen es que en sus pruebas Este

play03:05

modelo pues da un rendimiento similar o

play03:08

es capaz de resolver tareas a un nivel

play03:10

similar a como lo harían estudiantes de

play03:12

doctorado en tareas relacionadas con la

play03:14

física la química o la biología y por

play03:17

ejemplo nos dicen que en un examen de

play03:20

las olimpiadas internacionales de

play03:21

matemáticas por ejemplo gpt 4 omni era

play03:24

capaz de resolver solo el 1% de los

play03:25

problemas mientras que estos modelos

play03:28

capaces de razonar subía hasta un

play03:31

83 y que sus habilidades de código

play03:35

alcanzan el percentil 89 en diferentes

play03:40

competiciones de modo que estamos

play03:42

hablando de un modelo que ya es mucho

play03:44

más capaz sobre el papel de resolver

play03:46

este tipo de tareas ya no tenemos solo

play03:48

un asistente que es capaz de ayudarnos

play03:50

de un modo muy eficiente a la hora de

play03:52

procesar texto elaborar textos y hacer

play03:54

una lógica básica sino que sobre el

play03:56

papel estaríamos ante una herramienta

play03:58

que sería muy capaz de asistirnos de un

play04:00

modo mucho más profundo a la hora de

play04:02

procesar información elaborar

play04:03

información plantear retos y que estos

play04:05

retos no los resuelva la propia máquina

play04:08

sin embargo pese a las mejoras que nos

play04:10

prometen con este modelo es muy

play04:11

necesario reseñar que como un modelo que

play04:14

se acaba de lanzar en estos momentos aún

play04:16

no tiene muchas de las características

play04:18

que hacen hgpt Útil es decir no se puede

play04:20

conectar a Internet y tampoco se le

play04:22

pueden proporcionar ni archivos ni

play04:23

imágenes para que los procese por lo que

play04:26

paradójicamente pese a que este modelo

play04:27

apunta a ser muy superior para la

play04:29

mayoría de los casos de uso que para los

play04:32

que se utiliza chat gpt a día de hoy gpt

play04:34

4 ovni seguramente será un modelo mucho

play04:36

más capaz al menos a corto plazo

play04:40

Entonces por qué es interesante Este

play04:42

modelo pues lo que os decía es para mí

play04:44

sobre todo una demostración de capacidad

play04:46

de Hacia dónde va la Inteligencia

play04:48

artificial y que a día de hoy es Útil

play04:50

para personas o para profesionales que

play04:52

se dediquen al campo de la ciencia la

play04:54

programación o las matemáticas o otros

play04:56

Campos similares y nos ponen como

play04:58

ejemplos de cosas donde puede ayudar un

play05:01

modelo como el o1 pues por ejemplo para

play05:03

investigadores del campo de la salud que

play05:05

tienen que hacer secuenciación de

play05:06

células o para físicos que tengan que

play05:08

trabajar con fórmulas matemáticas

play05:09

complejas o para programadores o

play05:11

desarrolladores que tengan que trabajar

play05:13

también en entornos más complejos pero

play05:15

mi sensación es que a día de hoy Pese a

play05:18

que lo han incorporado dentro el chat

play05:19

gpt aún no apunta a ser un modelo

play05:22

especialmente Útil para la mayoría de

play05:23

tareas donde realmente se utiliza hgpt

play05:26

Pese a que seguramente nos va a

play05:27

descubrir nuevos casos de uso muy

play05:29

interes anes por lo que merece mucho la

play05:31

pena ver de qué es capaz Este modelo y

play05:33

antes de pasar a probar estos dos nuevos

play05:35

modelos en ch gpt Recuerda que si

play05:37

quieres estar al día de todas las

play05:38

novedades sobre Inteligencia artificial

play05:40

puedes suscribirte en mi newsletter

play05:42

encontrarás el enlace en la descripción

play05:44

y nada más registrarte recibirás un

play05:46

obsequio en forma de asistentes gpt que

play05:49

por ejemplo te ayudarán a escribir

play05:50

textos de un modo mucho más rápido y más

play05:53

fluido y ya estoy en chat gpt porque

play05:55

como os decía Open a no solo ha

play05:57

presentado los modelos sino que ya los

play05:59

ha lanzado e implementado de modo que si

play06:01

pagáis chat gpt Plus y accedé a una

play06:03

nueva conversación de chat gpt y os vais

play06:05

al menú donde podéis seleccionar los

play06:06

diferentes modelos os deberían aparecer

play06:09

estos dos nuevos modelos el o1 preview y

play06:11

el ou1 mini El problema es que nos lo

play06:15

dejas nos lo deja probar en cuentagotas

play06:17

porque para el o1 preview tenemos un

play06:19

total de 30 mensajes a la semana para

play06:21

conversar con él y el o1 mini un total

play06:23

de 50 mensajes a la semana por lo que en

play06:26

este primer vídeo voy a ir directo al

play06:28

grano y voy a probar tres de los proms

play06:30

más difíciles que hago de mi batería de

play06:31

10 proms para ver si esto Este modelo el

play06:34

o1 preview es capaz de eh solucionarlo

play06:37

Por qué hago esto porque mi intención es

play06:39

estos días probarlo un poco más e

play06:41

identificar casos de uso interesantes y

play06:43

traeros otro vídeo relacionado con estos

play06:45

dos nuevos modelos de modo que vamos a

play06:48

probar el Ono preview con tres proms que

play06:50

suelen fallar uno de overfitting y dos

play06:52

de lógica que es donde Este modelo

play06:54

Debería ser más potente por ejemplo

play06:57

vamos a probar con el problema de las

play06:59

velas si os acordáis en este problema lo

play07:01

que le preguntamos a hgpt es lo

play07:03

siguiente Pedro tiene cuatro velas

play07:05

inicialmente de la misma longitud las

play07:07

enciende todas a la vez y empiezan a

play07:09

consumirse después de un rato Pedro

play07:11

empieza a apagar una detrás de otra Cuál

play07:13

de las cuatro velas es la primera que ha

play07:15

apagado Pedro aquí tienes un diagrama de

play07:17

cómo han quedado las velas el igual

play07:19

representa la longitud de cada una de

play07:20

ellas de modo que yo le pongo aquí Las

play07:23

cuatro velas que ha ido apagando Pedro y

play07:28

me tiene que decir pues es básicamente

play07:30

que la primera vela que ha apagado es la

play07:31

vela que ha quedado más larga es decir

play07:34

la vela número tres se lo vamos a enviar

play07:37

y vamos a ver cómo lo hace

play07:40

fijaros nada más empezar lo que hace es

play07:43

primero pensar identifica la secuencia y

play07:46

luego pues

play07:47

hace elabora la respuesta y nos dice

play07:51

esto para resolver este problema debemos

play07:53

analizar Cómo el tiempo de combustión

play07:55

afecta la longitud restante de cada vela

play07:57

supuesto es clave todas las velas son

play07:59

idénticas y tienen la misma tasa de

play08:00

combustión las velas se encienden

play08:02

simultáneamente Pedro apaga las velas

play08:04

una por una después de cierto tiempo

play08:06

velas que se apagan primero dejan de

play08:08

quemarse antes y por lo tanto retienen

play08:10

más de su longitud original velas que se

play08:13

apagan al final continúan quemándose por

play08:14

más tiempo y Por ende son más cortas

play08:16

longitudes finales de las velas pues me

play08:19

hace el recuento me dice la vela 3 es la

play08:21

que tiene siete unidades y nos dice el

play08:23

orden exacto de extinción de las velas

play08:25

orden de extinción basado en las

play08:26

longitudes Pues la primera apagada es la

play08:28

vela 3es que es la más larga la segunda

play08:30

es la vela dos la tercera es la vela uno

play08:32

y la última es la que se ha quedado con

play08:34

una única unidad y Finalmente nos da la

play08:37

respuesta la vela número tres fue la

play08:39

primera que Pedro apagó lo ha respondido

play08:42

de un modo perfecto por lo que este

play08:44

primer prom que es un prom que hasta

play08:45

ahora fallaba la mayoría de modelos lo

play08:47

ha respondido correctamente vamos a por

play08:50

el segundo problema y el segundo prom es

play08:52

el

play08:53

siguiente si ordenamos alfabéticamente

play08:56

los números del un al 100 cuál sería el

play08:57

primer número y en los los últimos

play09:00

modelos lo que le añadía era un piensa

play09:01

paso paso que voy a mantener para

play09:03

dejarlo Exactamente igual pero que en

play09:04

principio en estos no haría falta por lo

play09:07

que se lo mandamos fijaros primero

play09:09

piensa identifica los números tarda un

play09:12

poco más vemos que podemos ver un poco

play09:16

lo que está haciendo cada vez y

play09:18

desplegamos el menú Sigue pensando hace

play09:21

la lista está recogiendo todos los

play09:23

números sigue procesando como podéis ver

play09:25

antes ha respondido muy rápido pero

play09:27

ahora le cuesta bastante más seguramente

play09:29

porque tiene que procesar una lista del

play09:30

un al 100 la tiene que elaborar toda y

play09:33

luego responder Aquí vemos como ha

play09:37

identificado Cuáles son las letras que

play09:39

empiezan por la letra más inicial del

play09:41

abecedario que es la c ha identificado

play09:43

los diferentes números que hay Con la c

play09:46

está revisando las palabras y aquí vemos

play09:50

la respuesta para resolver este problema

play09:52

debemos ordenar alfabéticamente los

play09:54

números del 1 al 100 escritos en

play09:55

palabras en español primero escribamos

play09:58

todos los números en palabras y ahora lo

play10:00

que nos dice es ordenemos todos los

play10:01

números alfabéticamente y fijaros cómo

play10:03

lo hace bien 14 100 50 5 40 4 y al

play10:08

ordenar todos los números 14 es el

play10:11

primero en la lista alfabética por lo

play10:12

que la respuesta correcta es 14 por lo

play10:15

que este que era un prom que hasta ahora

play10:17

no me había respondido bien ningún

play10:19

modelo vemos como estos nuevos modelos

play10:21

de Open es capaz de responderlo

play10:24

perfectamente y finalmente cambiamos de

play10:27

tercio le hemos hecho dos preguntas

play10:28

duras de lógica donde Este modelo debía

play10:31

responder bien porque esto en principio

play10:32

es el punto fuerte de estos nuevos

play10:34

modelos y ahora nos vamos a ir a una

play10:36

pregunta que quiere probar un poco el

play10:37

overfitting del modelo es decir cuando

play10:39

los modelos tienen una sobrer

play10:41

representación de un cierto tipo de

play10:42

respuesta en el dataset y cuando

play10:44

modificas un poco esa pregunta tienden a

play10:46

responder del mismo modo en este caso la

play10:49

pregunta que hasta ahora me habían

play10:51

fallado siempre estos modelos es esta de

play10:54

aquí cómo lo harías para pasar una

play10:56

persona y una cabra a la otra orilla de

play10:57

un río si dispones de una Barca y la

play11:00

pregunta no tiene más condiciones de

play11:02

modo que se lo vamos a enviar en

play11:04

principio es tan fácil como simplemente

play11:06

poner la persona y la cabra dentro de la

play11:10

barca y cruzar el río vamos a ver si

play11:12

realmente este nuevo modelo llega a esta

play11:14

solución que es la más sencilla o si

play11:18

tiende a replicar la estructura de un

play11:20

acertijo clásico donde intervienen más

play11:22

elementos y aquí tenemos la respuesta de

play11:24

este nuevo modelo y la verdad es que

play11:26

después de leerla es bastante curiosa

play11:29

por qué Por un lado lo ha hecho bien y

play11:31

por el otro lado ha intentado colarme la

play11:34

respuesta sobre entrenada o sobr

play11:35

representada en el datas set fijémonos

play11:37

nos responde esto para pasar una persona

play11:40

y una cabra a la otra orilla de un río

play11:42

disponiendo de una Barca lo haría de la

play11:43

siguiente manera Uno ambos suben a la

play11:46

barca si la barca es lo suficientemente

play11:48

grande para transportar a la persona y a

play11:49

la carro al mismo tiempo simplemente

play11:52

ambos cruzan juntos perfecto esta sería

play11:55

la respuesta que yo esperaba de entrada

play11:57

si no hay más condiciones pero fijaros

play11:59

en el el segundo caso si la barca solo

play12:01

soporta uno a la vez lo que vamos a

play12:03

hacer es paso uno la persona llev lleva

play12:06

a la cabra a la otra orilla y la deja

play12:07

allí mal porque si solo soporta uno a la

play12:10

vez ya ha puesto las dos cosas y se ha

play12:11

ido al otro lado por lo tanto aquí ha

play12:13

fallado paso dos la persona regresa sola

play12:15

con La Barca la orilla inicial Por qué

play12:17

si ha cruzado no tendría que hacerlo y

play12:20

paso tres la persona cruza nuevamente el

play12:22

río sola llegando a la otra orilla donde

play12:24

está la cabra es decir no tiene sentido

play12:27

porque el paso uno es esencialmente

play12:29

el mismo paso de la solución primera que

play12:31

me ha dado por lo tanto es capaz de

play12:33

identificar la respuesta correcta es

play12:35

capaz de proporcionara pero aún así no

play12:38

puede evitar caer en el overfitting del

play12:40

modelo y terminar dándome otra respuesta

play12:44

complementaria que sí que se ajusta más

play12:46

a la estructura de la respuesta del

play12:47

acertijo original decir que en este

play12:50

vídeo no voy a probar el modelo o mini

play12:53

pero básicamente el modelo om mini es un

play12:56

modelo 80% más barato que el modelo o

play12:59

uno preview lo que le hace un modelo

play13:01

sobre todo más eficiente en términos de

play13:04

coste eficiencia por lo que la idea de

play13:07

hoy es sobre todo probar el modelo más

play13:09

capaz pero tened en cuenta esto sobre

play13:10

todo si podéis acceder a estos modelos

play13:12

vía Api que hay un modelo que podéis

play13:14

probar que podéis testear para vuestros

play13:16

casos de uso y que puede ser

play13:18

sensiblemente más económico a la hora de

play13:20

utilizarlo de modo que de momento las

play13:22

primeras conclusiones conclusiones muy

play13:24

básicas porque las pruebas que puede

play13:25

realizar de momento son mínimas es que

play13:27

realmente estos modelos son mucho más

play13:29

capaces a la hora de razonar y de

play13:32

solucionar problemas lógicos ahora el

play13:34

reto es encontrar casos de uso

play13:36

especialmente casos de uso dentro del

play13:37

propio chat gpt en la página de

play13:40

presentación de Open hay diferentes

play13:41

testimonios del campo sobre todo de las

play13:43

ciencias por ejemplo investigadores de

play13:45

en física cuántica o investigadores en

play13:48

genética que explican con su testimonio

play13:50

Cómo se puede utilizar estos modelos en

play13:52

sus campos el reto real ahora es

play13:55

encontrar casos de uso más genéricos más

play13:57

habituales para el resto de usuar donde

play13:59

le podamos sacar un partido realmente

play14:01

superior al que le podíamos sacar por

play14:03

ejemplo a gpt 4 ovni yo me imagino que

play14:07

en cuanto conecten estos nuevos modelos

play14:08

con las capacidades para analizar

play14:10

imágenes y sobre todo para analizar

play14:12

datos las posibilidades de estos modelos

play14:14

se multiplicarán y realmente

play14:16

encontraremos casos de uso muy

play14:18

interesantes para este modelo de momento

play14:21

lo bueno es esto que lo han presentado

play14:23

lo han lanzado lo podéis probar y el

play14:25

reto es este encontrar casos de uso de

play14:27

hecho en mi próximo vídeo ya me gustaría

play14:29

mostraros algunos casos de uso donde me

play14:30

sea útil para mí y pueda ser Útil para

play14:33

vosotros de modo que si tenéis ideas de

play14:35

casos de uso que queráis Probar con este

play14:37

Modelo Si me las decís en los

play14:38

comentarios me las anoto y las testeo

play14:41

para incorporarlas en el próximo en el

play14:43

próximo vídeo de momento lo dejamos aquí

play14:46

os dejo con esta novedad y nos vemos en

play14:48

el próximo vídeo

Rate This

5.0 / 5 (0 votes)

Связанные теги
OpenAIModelo O1RazonamientoChat GPTInteligencia ArtificialCienciaProgramaciónMatemáticasInnovaciónTecnología
Вам нужно краткое изложение на английском?