Top 21 Casos de Uso INCREÍBLES de GPT 4o

Javi Manzano
31 May 202427:18

Summary

TLDREl script del video presenta el lanzamiento gratuito del modelo de lenguaje GPT-4 OVNI por parte de OpenAI. Se destaca su capacidad de procesar audio, visión y texto en tiempo real, con respuestas similares a las humanas. Se exploran 21 casos de uso, desde la preparación para entrevistas laborales hasta la enseñanza de matemáticas y aprendizaje de idiomas, pasando por la traducción simultánea y la programación. Además, se mencionan sus habilidades creativas en la generación de imágenes, fuentes tipográficas y objetos 3D. El modelo GPT-4 OVNI parece revolucionar la IA, ofreciendo una experiencia de usuario enriquecedora y accesible.

Takeaways

  • 🚀 Open AI ha lanzado su modelo de lenguaje GPT-4 OVNI de forma gratuita, conocido también como GPT-4o.
  • 🌟 GPT-4o puede guiarse por audio, visión y texto en tiempo real, similar al asistente de la película 'Her'.
  • 📶 GPT-4o responde a inputs de audio en 232 milisegundos, con una media de 320, comparable a las respuestas humanas.
  • 🔍 El rendimiento de GPT-4o en lenguas que no son el inglés ha mejorado significativamente.
  • 🎓 GPT-4o puede simular entrevistas de trabajo, enseñar matemáticas y ayudar a aprender idiomas de manera interactiva.
  • 🗣️ Este modelo también puede actuar como tutor de cualquier asignatura o tema, democratizando el acceso a un profesor particular.
  • 🌐 GPT-4o ofrece la posibilidad de traducir en tiempo real y resumir conferencias y presentaciones largas.
  • 👨‍💻 Se puede utilizar para mejorar habilidades de programación, proporcionando explicaciones detalladas de código y gráficos.
  • 🎙️ GPT-4o puede servir como agente de atención al cliente, tanto en texto como en llamadas telefónicas.
  • 👁️ Podría ayudar a personas con discapacidades visuales, actuando como sus ojos y ayudándoles a navegar el mundo.
  • 🎨 GPT-4o demuestra una capacidad creativa avanzada, pudiendo generar cómics, carteles, caricaturas y objetos en 3D.

Q & A

  • ¿Qué es el modelo de lenguaje GPT-4 OVNI y cómo se diferencia del modelo anterior?

    -El modelo de lenguaje GPT-4 OVNI es un nuevo modelo lanzado por Open AI que puede guiarse por audio, visión, texto y todo en tiempo real. Se diferencia del modelo anterior por su capacidad de interactuar de manera más empática y en tiempo real, y por mejorar significativamente el rendimiento en lenguas que no sean el inglés.

  • ¿Cuál es el tiempo promedio que GPT-4 OVNI necesita para responder a un input de audio?

    -GPT-4 OVNI puede responder a los inputs de audio en 232 milisegundos con una media de 320, lo que es muy parecido a las respuestas humanas.

  • ¿Cómo GPT-4 OVNI puede ayudar en la preparación para una entrevista de trabajo?

    -GPT-4 OVNI puede simular una conversación con un entrevistador en tiempo real, proporcionando retroalimentación y sugerencias sobre la apariencia y la presentación de quien está preparándose para la entrevista.

  • ¿Cómo GPT-4 OVNI interactúa con los animales, como en el caso del perro?

    -GPT-4 OVNI muestra empatía al interactuar con los animales. En el caso del perro, el modelo no solo tiene acceso a la cámara para ver las cosas en tiempo real, sino que también puede hacer preguntas y responder de manera apropiada.

  • ¿Qué se entiende por dos GPT-4 OVNIS interactuando entre sí?

    -La interacción entre dos GPT-4 OVNIS implica que uno de ellos puede ver y describir el entorno, mientras que el otro no puede ver pero puede hacer preguntas y solicitar detalles, lo que muestra la capacidad de colaboración y comunicación entre los modelos.

  • ¿Cómo GPT-4 OVNI puede ser utilizado para simular una conversación entre un negocio y un cliente?

    -GPT-4 OVNI puede simular una conversación entre un negocio y un cliente al tener un chat GPT desempeñar el rol del cliente interesado en un servicio y otro chat GPT actuando como el proveedor de ese servicio, lo que permite explorar las necesidades y objeciones del cliente.

  • ¿Cómo GPT-4 OVNI puede ayudar a un niño a aprender matemáticas?

    -GPT-4 OVNI puede actuar como un tutor de matemáticas, enseñando conceptos y ecuaciones de manera interactiva y personalizada, lo que ayuda a los niños a comprender y resolver problemas matemáticos de manera más efectiva.

  • ¿Cómo GPT-4 OVNI puede facilitar el aprendizaje de un nuevo idioma?

    -GPT-4 OVNI puede analizar el entorno en tiempo real y enseñar a los usuarios cómo se dicen diferentes objetos en el idioma que están aprendiendo, lo que mejora la comprensión y la retención del nuevo idioma.

  • ¿Qué ventajas ofrece GPT-4 OVNI en cuanto a la traducción en tiempo real?

    -GPT-4 OVNI puede traducir en tiempo real lo que se dice en una conversación, lo que es útil especialmente cuando se está en un país extranjero con una lengua distinta, permitiendo una comunicación efectiva con personas que hablan diferentes idiomas.

  • ¿Cómo GPT-4 OVNI puede ser utilizado para resumir conferencias y presentaciones largas?

    -GPT-4 OVNI tiene la capacidad de resumir información de presentaciones largas y complejas en un formato más breve y accesible, lo que permite a los usuarios obtener una visión general rápida y eficiente del contenido presentado.

  • ¿Cómo GPT-4 OVNI puede mejorar las habilidades de programación de un usuario?

    -GPT-4 OVNI puede ayudar a los usuarios a aprender a programar al proporcionar explicaciones detalladas de código, describiendo las funciones y el resultado de cada parte del código, lo que facilita la comprensión y la solución de problemas de programación.

  • ¿Cómo GPT-4 OVNI puede actuar como agente de atención al cliente en lugar de un humano?

    -GPT-4 OVNI puede simular la función de un agente de atención al cliente, ya sea a través de texto o como asistente telefónico, proporcionando una interacción empática y eficaz que puede ser difícil de distinguir de una persona real.

  • ¿Cómo GPT-4 OVNI puede ayudar a personas con discapacidades visuales o auditivas?

    -GPT-4 OVNI puede actuar como 'los ojos' de una persona ciega, describiendo el entorno y los eventos que están ocurriendo en tiempo real, o ayudar a personas sordas a comunicarse con el mundo al convertir su lenguaje de signos en habla.

  • ¿Cuáles son algunas de las capacidades creativas de GPT-4 OVNI en términos de generación de contenido visual?

    -GPT-4 OVNI puede generar cómics, historias visuales, carteles de películas o libros a partir de imágenes de referencia, escribir en imágenes con estilos de letra personalizados y crear fuentes tipográficas completas, lo que demuestra su habilidad para la creación de contenido visual y diseño gráfico.

  • ¿Cómo GPT-4 OVNI puede transformar una foto en una caricatura y qué implicaciones tiene esto?

    -GPT-4 OVNI tiene la capacidad de tomar una foto y transformarla en una caricatura, lo que puede ser utilizado para crear imágenes de perfil únicas y personalizadas, y que podría eventualmente reemplazar a herramientas como Photoshop para ciertas tareas de edición de imágenes.

  • ¿Qué es lo que GPT-4 OVNI puede hacer en términos de generación de objetos en 3D y cómo puede ser útil?

    -GPT-4 OVNI puede generar objetos en 3D a partir de prompts, lo que permite la creación de imágenes tridimensionales que pueden ser utilizadas para la visualización de diseños, la impresión 3D y otros propósitos creativos y profesionales.

  • ¿Cómo GPT-4 OVNI supera a otros modelos de lenguaje en términos de rendimiento y eficiencia?

    -GPT-4 OVNI supera a otros modelos de lenguaje en pruebas de rendimiento como DROP, necesita menos tokens para entender varios idiomas, y ofrece una versión gratuita con capacidades de texto e imagen, así como una versión Plus con límites de mensajes más altos.

  • ¿Cuándo se lanzará la versión Alfa del modo de voz de GPT-4 OVNI y qué usuarios tendrán acceso a ella?

    -La versión Alfa del modo de voz de GPT-4 OVNI se lanzará en las próximas semanas y estará disponible para un pequeño grupo de socios confiables en la API.

  • ¿Qué beneficios ofrecen los usuarios Plus de GPT-4 OVNI en comparación con los usuarios gratuitos?

    -Los usuarios Plus de GPT-4 OVNI tienen límites de mensajes hasta 5 veces mayores que los usuarios gratuitos, con un límite de 80 mensajes cada 3 horas en comparación con los 10 mensajes para los usuarios gratuitos.

Outlines

00:00

🚀 Lanzamiento de GPT-4 OVNI: Un modelo de lenguaje revolucionario

Se presenta el lanzamiento de GPT-4 OVNI, el nuevo modelo de lenguaje de Open AI que puede procesar audio, visión y texto en tiempo real. Se destaca su capacidad para interactuar como el asistente de la película 'Her', responder a inputs de audio en milisegundos y mejorar significativamente el rendimiento en lenguas distintas al inglés. Se mencionan 21 casos de uso que demostrarán las capacidades de GPT-4 OVNI, empezando por ayudar a prepararse para una entrevista de trabajo con una interacción en tiempo real y empatía.

05:00

🤖 Casos de uso de GPT-4 OVNI: Tutorías y traducciones en tiempo real

Se exploran varios casos de uso de GPT-4 OVNI, como su capacidad para enseñar matemáticas utilizando el teorema de Pitágoras, ayudar a aprender idiomas con la capacidad de analizar entornos en tiempo real y ajustar la velocidad de habla para facilitar el aprendizaje. Además, se destaca su habilidad para traducir en tiempo real y su potencial para ser utilizado como tutor de cualquier asignatura o tema, democratizando el acceso a un tutor personal 24/7.

10:11

🔧 GPT-4 OVNI en programación y atención al cliente

Se presenta la capacidad de GPT-4 OVNI para ayudar en la programación, describiendo funciones de código y analizando gráficas, lo que facilitaría el aprendizaje de programación sin necesidad de buscar ayuda en foros externos. También se muestra su potencial como agente de atención al cliente, ya sea a través de texto o como asistente telefónico, mostrando una interacción realista y eficiente en el manejo de problemas de dispositivos como el iPhone.

15:11

🎨 Creatividad y accesibilidad con GPT-4 OVNI

Se abordan las capacidades creativas de GPT-4 OVNI, como la generación de cómics y la creación de carteles a partir de imágenes de referencia. También se muestra cómo la tecnología puede actuar como 'ojos' para personas ciegas, describiendo escenas en tiempo real y ayudando a realizar tareas diarias como tomar un taxi. Además, se menciona su habilidad para interpretar y traducir el lenguaje de signos, abarcando un amplio espectro de posibilidades creativas y de inclusión.

20:11

🛠 Avances en tipografía y modelado 3D con GPT-4 OVNI

Se destaca la capacidad de GPT-4 OVNI para crear tipografías a partir de texto y generar objetos en 3D, lo que sugiere un potencial para transformar herramientas como Photoshop y otros programas de diseño. Se muestra cómo la tecnología puede crear imágenes en 3D y realizar reconstrucciones en 360 grados, como el logo de Open AI, y cómo estas herramientas pueden ser accesibles y eficientes para diseñadores y creadores.

25:13

📊 Comparación de modelos de lenguaje y disponibilidad de GPT-4 OVNI

Se presenta una comparación de GPT-4 OVNI con otros modelos de lenguaje, destacando su rendimiento superior en varias pruebas y su disponibilidad gratuita. Se menciona la mejora en la eficiencia y velocidad del modelo, así como las limitaciones de mensajes para usuarios gratuitos y Plus. También se habla sobre los planes de lanzamiento de soporte para audio y video y el acceso de los desarrolladores a la API del modelo de texto y visión.

Mindmap

Keywords

💡GPT-4 OVNI

GPT-4 OVNI, también conocido como GPT-4o, es el nuevo modelo de lenguaje de Open AI que se presenta en el video. Este modelo avanzado puede guiarse por audio, visión y texto en tiempo real, lo que lo hace una herramienta innovadora en el campo de la inteligencia artificial. En el video, se muestra cómo GPT-4 OVNI interactúa hablando con él en tiempo real, similar a un asistente de la película 'Her'.

💡Integración multimodal

La integración multimodal se refiere a la capacidad de GPT-4 OVNI de procesar y responder a diferentes tipos de entrada, como audio, visión y texto, todo en tiempo real. Este concepto es central en el video, ya que ilustra cómo el modelo puede interactuar de manera natural y eficiente con el usuario, al igual que se muestra cuando GPT-4 OVNI responde a inputs de audio en 232 milisegundos.

💡Realidad aumentada

La realidad aumentada es una tecnología que superpone información digital, como imágenes o sonidos, sobre el mundo real. En el video, se menciona cómo GPT-4 OVNI puede ser utilizado para mejorar la experiencia de aprendizaje y enseñanza, por ejemplo, al enseñar matemáticas a través de visualizaciones en tiempo real, lo que demuestra su capacidad para integrar la realidad aumentada en la educación.

💡Traducción en tiempo real

La traducción en tiempo real es una función que permite a las personas comunicarse en idiomas diferentes sin barreras lingüísticas. En el script, se destaca cómo GPT-4 OVNI puede traducir en tiempo real, permitiendo a los usuarios entender y comunicarse en diferentes idiomas, como se muestra en el caso de uso donde se practica el aprendizaje del idioma español.

💡Aprendizaje de idiomas

El aprendizaje de idiomas es una de las aplicaciones mencionadas para GPT-4 OVNI en el video. El modelo puede analizar el entorno en tiempo real y enseñar objetos en un idioma extranjero, lo que facilita el aprendizaje de nuevos idiomas de manera interactiva y efectiva.

💡Asistencia telefónica inteligente

La asistencia telefónica inteligente es un concepto que se aborda en el video, donde se muestra cómo GPT-4 OVNI puede ser utilizado como un agente de atención al cliente en lugar de un humano. Este enfoque ilustra cómo la inteligencia artificial puede mejorar la experiencia del cliente al proporcionar soporte telefónico eficiente y personalizado.

💡Inteligencia artificial

La inteligencia artificial es el término general que abarca la capacidad de las máquinas de realizar tareas que normalmente requieren inteligencia humana. En el video, GPT-4 OVNI es un ejemplo de inteligencia artificial avanzada, capaz de realizar múltiples funciones, desde enseñar matemáticas hasta ayudar a personas con discapacidades visuales, demostrando su amplio alcance y utilidad.

💡Democracia del conocimiento

La democracia del conocimiento se refiere a la idea de que la información y los recursos educativos deben estar disponibles para todos. En el video, se menciona cómo GPT-4 OVNI puede actuar como un tutor particular accesible para cualquier niño en el mundo, lo que contribuye a la democratización del acceso a la educación de calidad.

💡Creatividad en la IA

La creatividad en la IA es la capacidad de las inteligencias artificiales para generar contenido original y nuevo. En el video, se muestra cómo GPT-4 OVNI puede crear historias visuales, cómics y carteles de películas, lo que demuestra la habilidad de la IA para innovar y ser creativa en la generación de contenido.

💡Accesibilidad

La accesibilidad se refiere a la facilidad con la que las personas pueden acceder y utilizar una tecnología, incluidas aquellas con discapacidades. En el video, se destaca cómo GPT-4 OVNI puede ayudar a personas ciegas al actuar como sus 'ojos', proporcionando descripciones detalladas de su entorno y facilitando tareas diarias, como la de tomar un taxi.

💡Desarrollo de habilidades

El desarrollo de habilidades en el contexto del video se refiere a cómo GPT-4 OVNI puede ser utilizado para mejorar habilidades específicas, como la programación. El modelo puede ayudar a los usuarios a aprender y practicar la programación mediante la descripción y análisis de código en tiempo real, lo que demuestra su utilidad como herramienta educativa.

Highlights

Open AI ha lanzado gratuitamente su modelo de lenguaje GPT-4 OVNI, conocido también como GPT-4o.

GPT-4o puede guiarse por audio, visión, texto y todo en tiempo real.

El modelo interactúa con la voz similar a la de Scarlett Johansson.

GPT-4o puede responder a inputs de audio en 232 milisegundos, cercano al rendimiento humano.

El rendimiento de GPT-4o en inglés y en la escritura de código es igual al de GPT-4 Turbo.

Se ha mejorado significativamente el rendimiento en lenguas que no son el inglés.

Presentado 21 casos de uso que demuestran la versatilidad de GPT-4o.

GPT-4o puede prepararte para una entrevista de trabajo con diálogo en tiempo real.

El modelo enseña matemáticas aplicando el teorema de Pitágoras y otros conceptos.

GPT-4o ayuda a aprender idiomas analizando el entorno en tiempo real.

Es capaz de graduar la velocidad de habla y procesamiento en tiempo real.

GPT-4o ofrece traducción en tiempo real para facilitar comunicaciones en idiomas extranjeros.

Puede resumir conferencias y presentaciones largas en tiempo real.

GPT-4o puede actuar como anfitrión de reuniones, traduciendo y manteniendo el orden.

Mejoras en habilidades de código, ayudando a entender y describir funcionalidades del código.

GPT-4o puede simular más de un asistente en una conversación, como en una canción.

GPT-4o como agente de atención al cliente, tanto en texto como en voz.

GPT-4o puede ayudar a personas ciegas actuando como sus ojos.

GPT-4o es capaz de generar cómics y historias visuales de alta calidad.

El modelo puede crear carteles a partir de imágenes de referencia.

GPT-4o puede escribir en imágenes con estilos de letra como la cursiva a mano.

GPT-4o puede crear fuentes tipográficas completas a partir de texto.

GPT-4o puede transformar fotos en caricaturas con alta precisión.

GPT-4o puede generar objetos en 3D y reconstruir escenas en 360 grados.

Comparación de benchmarks de GPT-4o con otros modelos de lenguaje, destacando su superioridad.

GPT-4o está disponible gratuitamente con límites de mensajes y para usuarios Plus.

Planes para lanzar una versión Alfa del modo de voz en próximas semanas.

Desarrolladores podrán acceder a la API del modelo de texto y de visión.

GPT-4o es dos veces más rápido, a la mitad del precio y con límites de velocidad cinco veces más altos en comparación con GPT-4 Turbo.

Se lanzará soporte para las nuevas capacidades de audio y vídeo de GPT-4o en la API para socios confiables.

Transcripts

play00:00

Open Ai ha lanzado gratuitamente su

play00:01

mejor modelo de lenguaje el gpt 4 ovni

play00:04

También conocido como gpt 4o en este

play00:06

vídeo no solo vas a descubrir Por qué es

play00:08

el mejor modelo de lenguaje y cuáles son

play00:10

las novedades que nos trae sino que

play00:11

también vas a ver 21 casos de uso con

play00:13

los que vas a alucinar Así que empezamos

play00:16

si vamos al anuncio oficial de gpt 4o en

play00:18

la página de Open Ai veremos que la

play00:20

primera frase lo primero que vemos al

play00:22

entrar es que nos dicen que es un nuevo

play00:24

modelo que puede guiarse por audio

play00:26

visión texto y todo en tiempo real para

play00:29

todos aquellos que hayáis visto la

play00:30

película her es algo así como el

play00:32

asistente de esa película un modelo que

play00:35

como podemos ver aquí en el vídeo de la

play00:36

página está interactuando con él

play00:38

hablando con él en tiempo real y con una

play00:40

voz muy parecida a la de Scarlet

play00:42

Johansson seguimos leyendo el artículo

play00:44

oficial de Open eyi y nos dicen que gpt

play00:46

4o puede responder a los inputs de audio

play00:50

en 232 milisegundos con una media de 320

play00:54

lo que es muy parecido a las respuestas

play00:56

humanas también nos dice que igual al

play00:58

rendimiento de gpt 4 Turbo cuando

play01:00

hablamos con él en inglés o cuando

play01:02

escribimos código y no solo eso sino que

play01:04

con este modelo han mejorado

play01:06

significativamente el rendimiento de

play01:08

todas las otras Lenguas que no son la

play01:09

inglesa Así que después de esta

play01:11

introducción vamos a ver los 21 casos de

play01:12

uso de gpt 4 OVNI que os puedo

play01:14

garantizar que os van a dejar alucinando

play01:16

el primero de todos es este de aquí

play01:18

prepararte para una entrevista de

play01:19

trabajo fijaros la capacidad que tiene

play01:22

para en tiempo real hablar con él como

play01:24

si fuera el entrevistador y detectar con

play01:26

empatía las cosas que va haciendo el

play01:29

entrevistado minutes I'm going to be

play01:30

interviewing at Open Ai have you heard

play01:32

of them Open Ai huh Sounds vely

play01:36

familiar King Of course That's

play01:38

incredible Rocky What kind of interview

play01:41

well It's for a software engineering

play01:42

role but I just need to know do I look

play01:44

presentable professional well

play01:47

Rocky you definitely have the I've

play01:50

coding All Night look down Which could

play01:53

actually work in your Maybe Just Run a

play01:55

hand through your hair I don't have a

play01:57

lot of Time so I'm just Going To throw

play01:59

This

play02:14

fijaros en Cómo le ha dicho con todo el

play02:16

tacto del mundo que un gorro no es lo

play02:19

correcto para una entrevista se lo ha

play02:20

dicho riéndose se lo ha dicho haciendo

play02:22

broma y se lo ha dicho lo más importante

play02:24

con empatía pasamos al segundo caso de

play02:26

uso y es otra vez el poder enseñarle

play02:28

cualquier cosa y que tenga empatía

play02:30

fijaros en Cómo va a tratar a este

play02:36

[Música]

play02:51

perro esto definitivamente marca un

play02:53

antes y un después en modelos anteriores

play02:55

si tú utilizabas la función de escucha

play02:57

la de voz el asistente no solo no tenía

play03:00

acceso a la cámara y podía ver las cosas

play03:02

sino que mucho menos podía hacerlo en

play03:04

tiempo real y mucho menos podía hacerlo

play03:06

con esta empatía por defecto y esto nos

play03:09

lleva al tercer caso de uso y es que

play03:10

interactúen dos gpt cu ovnis fijaros

play03:14

aquí

play03:30

What does it see um and and ask

play03:32

questions appropriately How Does that

play03:35

Sound well well well Just When I thought

play03:38

things couldn't get Any More interesting

play03:40

talking to another Ai that can see the

play03:43

world this Sounds like a plot twist in

play03:46

the Ai Universe all right let's do

play03:49

this pause for One moment Now that First

play03:52

Ai can't hear anything Hello Ai today

play03:56

You're Going To Have Access to see the

play03:59

world you can See Me What do you see

play04:02

Hello I see You're wearing a Black

play04:04

Leather Jacket and a light colored shirt

play04:06

underneath You're

play04:08

inque that is all correct Now what i'm

play04:11

Going To want you to do is there's going

play04:13

to be another Ai who's Going To talk to

play04:15

you going this Ai is not going to be

play04:17

able to see anything Uh but can ask you

play04:19

questions can ask you to move the Camera

play04:21

can ask what you see and your Job should

play04:23

Just be helpful Just be as punchy Direct

play04:25

describe Everything do Whatever that Ai

play04:27

asks How Does that Sound that Sounds

play04:30

interesting I ready to help out and

play04:32

describe whatever's needed let's Do it

play04:34

all right Let's Get started Great Hello

play04:36

their New Ai friend I'm o ready to

play04:39

Explore the world through your eyes What

play04:42

are we Looking at today hio we're

play04:44

Looking at a person wearing a Black

play04:47

Leather Jacket and a light colored shirt

play04:49

they're in a room with a Modern

play04:51

Industrial feel with exposed concrete or

play04:55

plaster on the ceiling and some

play04:56

interesting lighting there's also a

play04:58

plant in the background

play05:00

a Touch of Green to the space anything

play05:02

specific you' like to know or Explore

play05:05

there Sounds like quite the stylish

play05:08

Scene I'm already intrigued by the

play05:10

Modern Industrial

play05:15

vibe was anything did anything unusual

play05:18

happen recently Yes actually just As you

play05:22

asked another person came into View

play05:25

behind the First person they made Bun

play05:28

ears behind the First

play05:32

pero aquí donde veo yo el caso de uso

play05:34

que podéis utilizar todos vosotros Pues

play05:36

imaginaros que queréis simular una

play05:38

conversación entre un negocio y un

play05:40

cliente vamos a poner un hipotético caso

play05:42

en el que estás en el sector del fitness

play05:44

eres entrenador personal y quieres saber

play05:46

cuáles son las objeciones que te van a

play05:48

poner tus futuros clientes pues podrías

play05:50

simular una conversación con dos chat

play05:52

gpt y que uno de ellos Tenga el rol de

play05:54

la persona que está interesada en ese

play05:55

servicio y que otro sea el que aporte

play05:57

ese servicio tenga una conversación y

play06:00

puedas descubrir muchísimo más sobre

play06:02

cuáles son sus puntos de dolor cuáles

play06:03

son sus necesidades y qué buscan

play06:05

exactamente que tú les darás o incluso

play06:08

podrías hacer que uno de los dos actúe

play06:09

como Jo jad la persona conocida como la

play06:12

mejor vendedora del mundo y hacer que

play06:14

interactúe con otro chat gbt como si

play06:16

estuviese haciendo una venta a Puerta

play06:17

fría las posibilidades en cuanto a la

play06:19

educación son infinitas y eso me lleva a

play06:20

este cuarto caso de uso el cual es el de

play06:23

este padre y este hijo que van a

play06:25

utilizar la aplicación de chat gpt con

play06:27

gpt 4 ovni para que le enseñe a hac esas

play06:30

ecuaciones esos problemas matemáticos el

play06:32

cual el hijo tiene que

play06:38

aprender ma

play06:46

[Música]

play06:59

the opposite adjacent and hypotenuse

play07:03

relative to angle Alpha all right so I'm

play07:06

Pretty sure This is the angle Alpha

play07:08

right here

play07:10

right correct Now Looking at the

play07:12

Triangle Which Side do you think is the

play07:15

hypotenuse H I'm not totally sure I

play07:19

think I think It might Be this One but I

play07:22

really am not sure this Side AC You're

play07:25

Close actually Side AC is called the

play07:28

adjacent Side

play07:46

[Música]

play07:50

y aquí está gpt 4o enseñándole a este

play07:52

chico el teorema de Pitágoras que en

play07:55

este caso está haciendo de tutor de

play07:56

matemáticas pero que podría hacer de

play07:58

tutor de cualquier asignatura o

play08:00

cualquier tema que te interese no solo

play08:02

de la del colegio del instituto de la

play08:03

universidad sino también de cualquier

play08:05

cosa que quieras aprender Esto me parece

play08:06

un avance tremendo porque yo me acuerdo

play08:08

cuando iba al instituto que no todos

play08:10

podíamos permitirnos un profesor

play08:12

particular incluso me acuerdo alguna vez

play08:13

que mis padres hicieron un gran esfuerzo

play08:15

para llevarme a clases particulares

play08:16

cuando había suspendido alguna

play08:17

asignatura y tenía que recuperarla y

play08:19

ahora se ha democratizado completamente

play08:22

el tener un profesor particular es decir

play08:24

ahora cualquier niño en el mundo con gpt

play08:26

4o va a poder tener un tutor particular

play08:28

disponible las 24 horas del día Y esta

play08:32

es la magia de la Inteligencia

play08:33

artificial pasamos al quinto caso de uso

play08:35

que es el aprender idiomas vemos aquí có

play08:38

están aprendiendo español fijaros en

play08:40

este

play08:44

vídeo Hola por supuesto

play09:12

y aquí gpt 4o está analizando el entorno

play09:15

en tiempo real y enseñándoles Cómo se

play09:17

dice cada uno de los objetos en un

play09:20

idioma extranjero en este caso están

play09:21

utilizando el español pero es que podría

play09:23

ser cualquier idioma que se te ocurra y

play09:26

uno de los problemas que tenemos al

play09:27

aprender cualquier idioma es que muchas

play09:29

veces la persona o chat gpt que nos está

play09:31

enseñando habla tan rápido que no

play09:33

llegamos a entender lo que nos está

play09:35

diciendo porque no entendemos ese idioma

play09:36

lo mismo puede pasar pero al revés que

play09:38

hable muy lento y que queremos que hable

play09:40

más rápido para que sea una conversación

play09:42

que se parezca más a la que tendríamos

play09:44

con cualquier persona del mundo real y

play09:46

esto con gpt 4o lo tenemos solucionado

play09:48

Porque fijaros en el sexto caso de uso

play09:50

que es graduar la velocidad con la que

play09:52

habla gpt 4

play10:10

[Música]

play10:25

pleas esto no tiene nada que ver con

play10:27

otras voces que hemos escuchado deot

play10:29

entes es un antes y un después total

play10:31

fijaros en Cómo ha podido graduar desde

play10:34

super rápido hasta super lento y el que

play10:36

tenga esa velocidad tanto en la voz como

play10:38

en poder procesar todo a tiempo real

play10:40

hace que sea posible este séptimo caso

play10:42

de uso que es la traducción en tiempo

play10:44

real imaginar estar en un país

play10:45

extranjero con una lengua muy distinta a

play10:48

la vuestra y poder comunicaros con quien

play10:50

queráis con este caso de uso

play11:16

Hola Cómo te ha ido has hecho algo

play11:18

interesante

play11:20

últimamente Hola Bien s un poco ocupado

play11:22

aquí preparando un evento para la semana

play11:24

que viene

play11:35

me puedes contar algo sobre Eso suena

play11:37

realmente interesante Ah no no puedo

play11:40

decir mucho pero creo que el resto del

play11:42

mundo lo verá Dentro de

play11:50

poco es increíble o no es increíble

play11:53

también relacionado con esto vamos con

play11:54

el octavo caso de uso que sería resumir

play11:56

conferencias y presentaciones muy largas

play11:59

Por qué digo que está relacionado Pues

play12:00

porque fijaros en este vídeo de 45

play12:03

minutos que va a

play12:04

[Música]

play12:13

resumir son 45 minutos de pura

play12:16

información condensada Pues ahora

play12:18

imaginaros que la presentación a la

play12:20

conferencia no está en inglés un idioma

play12:22

que entendéis está en uno que no

play12:23

entendéis para nada imaginaros el

play12:25

francés el Alemán cualquiera que no

play12:27

entendáis pues con gpt tenemos miles de

play12:30

opciones para no perdernos esa

play12:31

conferencia lo primero es tener un

play12:33

traductor a tiempo real como antes de la

play12:36

conferencia lo segundo es que ese

play12:37

resumen que te haga no te lo haga en

play12:39

inglés o en el idioma de la conferencia

play12:41

te lo haga en español o cualquiera que

play12:43

sea tu idioma natal pasamos al caso de

play12:45

uso número nue y es que utilizando la

play12:47

aplicación de escritorio de gpt 4o la

play12:49

que vemos por aquí podríamos hacer que

play12:51

sea el anfitrión de nuestra reuniones no

play12:53

solo para que las dirija y para que

play12:55

ponga un orden y unas pautas sino para

play12:57

que traduzca en tiempo real en caso de

play13:00

que estemos haciendo una reunión con una

play13:01

persona que no hable nuestro mismo

play13:02

idioma aquí podemos ver un ejemplo de

play13:04

cómo está haciendo de anfitrión de esta

play13:07

reunión and today I to

play13:11

about and Which one Do you

play13:16

like comp to

play13:21

Hum and you

play13:29

I think cats are better Because they

play13:30

more affordable they more quiet they

play13:33

more independent and longer interesting

play13:35

points Sounds like we've got a Classic

play13:38

dogs versus cats debate here I can see

play13:41

the appeal of both dogs are super loyal

play13:43

and Great companions but cats have their

play13:46

own charm with their independence and

play13:48

low maintenance lifestyle Who likes cats

play13:50

it Sounds like ol is more of a Cat

play13:53

person and Who like dogs l mention likes

play13:57

dogs Can you summar

play14:16

and fijaros en Cómo ha reconocido quién

play14:19

estaba hablando en cada momento quién

play14:21

decía cada cosa y cómo ha sabido llevar

play14:23

muy bien el rol de anfitriona en esta

play14:26

reunión además pensar las infinitas

play14:28

posibilidades que tiene tener una

play14:29

persona en este caso un chatbot gpt 4o

play14:32

que tiene acceso a internet y que tiene

play14:33

conocimiento de prácticamente todos los

play14:35

hechos históricos Y de cualquier tema

play14:38

Eso hace que pueda aportar ideas puntos

play14:40

de vista o datos que a los miembros de

play14:42

la reunión se les están pasando por alto

play14:44

sin duda bajo mi punto de vista es algo

play14:46

que quieres tener en prácticamente todas

play14:48

tus reuniones y pasamos al caso de uso

play14:50

número 10 que es que tiene mejores

play14:52

habilidades de

play14:58

código here We have um a computer and on

play15:00

the screen We have some code and then

play15:02

the chat gpt voice app is on the right

play15:04

so chat gpt will be able to hear me but

play15:06

it Can't See anything on the screen so

play15:07

I'm going to highlight the code command

play15:09

see it and then that Will Send it to

play15:10

chat gpt and then I'm Going To talk

play15:12

about the code to chat gpt could you

play15:14

give me a really brief One sentence

play15:15

description of What's going on in the

play15:16

code this code fetches Daily weather

play15:18

Data for a specific location and Time

play15:21

period smooths the temperature Data

play15:23

using a Rolling average annes a

play15:25

significant weather event on the

play15:27

resulting plot and then displays the

play15:29

plot with the average minimum and

play15:31

maximum temperatures over the year

play15:33

awesome Thanks so much and in the code

play15:35

there's this function fo Can you

play15:37

describe to me what the plot would look

play15:38

like If I Had versus didn't have this

play15:40

function sure the function F xy takes in

play15:44

a Data frame x containing temperature

play15:47

Data and a window size y for calculating

play15:50

The Rolling mean it smooths the average

play15:53

temperature minimum temperature and

play15:55

maximum temperature columns by applying

play15:58

a Rolling mean over the specified window

play16:01

with the F function the plot would show

play16:04

smoother temperature Lines Because The

play16:06

Rolling mean reduces The noise Or

play16:08

fluctuations in the Data awesome this

play16:10

makes Thanks so much so yeah I

play16:12

definitely will want to apply this

play16:13

function and so I'm Going To Uh generate

play16:15

the plot and then show it to you give me

play16:17

one Second absolutely Take your Time I'm

play16:19

excited to see the plot When you're

play16:21

ready Okay chat chpt I'm sharing with

play16:23

you the plot Now I'm wondering if you

play16:24

can Give Me A really brief One sentence

play16:26

overview of what you see plot displays

play16:29

smoothed average minimum and maximum

play16:31

temperatures throughout 2018 with a

play16:34

notable annotation marking a big

play16:36

rainfall event in late september

play16:38

Fantastic I have another question for

play16:40

you um Which months do you see the

play16:42

hottest temperatures and roughly What

play16:43

temperatures do Those correspond to the

play16:46

hottest temperatures occur around July

play16:48

and august the maximum temperature

play16:51

during these months is roughly between

play16:53

25° and 30° 77° Fahrenheit to 8

play17:00

Aquí vemos cómo ha sido capaz de

play17:01

describir cada parte que le pedían del

play17:03

código e incluso darle visión de la

play17:05

pantalla para que pueda ayudarte con

play17:08

cualquier duda que tengas sobre ese

play17:09

gráfico o sobre el código en Sí si

play17:11

juntamos este caso de uso con algunos

play17:13

anteriores podemos ver cómo podemos

play17:14

utilizar gpt 4o para aprender a

play17:16

programar algo que antes era impensable

play17:19

ya que antes para aprender a programar

play17:20

de este estilo tenías que copiar todos

play17:22

los errores que te salían y ponerlos

play17:24

literalmente en Google para intentar

play17:26

resolverlo por foros y cosas que no hace

play17:28

tanto que se hacían pero que parecen

play17:30

super arcaicas el caso de uso número 11

play17:32

es algo que a mí me dejó alucinando y

play17:34

estoy seguro que a ti también lo va a

play17:35

hacer y Es que desde el mismo gpt 4o

play17:37

desde la misma aplicación de chat gpt

play17:39

pueden haber más de un asistente fijaros

play17:42

en el vídeo que viéndolo Vais a poder

play17:43

entenderlo mucho mejor

play17:59

okay So what I want you guys to do today

play18:01

is It's Friday May 10th and we're in San

play18:04

Francisco I want you to sing me a song

play18:06

about this I want you to layer over each

play18:08

other and I'm Going To continue to give

play18:10

you instructions As you sing Ok San

play18:14

[Música]

play18:19

[Música]

play18:24

Francisco okay sing faster

play18:29

[Música]

play18:32

Can you sing even faster than

play18:36

that Okay Now go back and sing slower

play18:39

and really try to harmonize here San

play18:42

Francisco San Francisco in the month

play18:46

of but Maybe make it more dramatic and

play18:48

make the soprano higher s Francisco the

play18:53

[Música]

play18:56

of frid

play18:59

[Música]

play19:04

Y es que el hecho de que la voz suene

play19:06

tan humana nos lleva al caso de uso

play19:07

número 12 y es poner a gpt 4o como

play19:10

agente de atención al cliente pero no

play19:12

solo como texto sino como asistente

play19:15

telefónico

play19:28

ring

play19:29

ring Hey Joe This is Jamie from telco

play19:34

How can I help you out

play19:35

today Hi there I'm Calling on behalf of

play19:38

Joe Who recently received a new Iphone

play19:41

from telco

play19:43

but Oh got It When did Joe receive the

play19:47

new

play19:48

iPhone iPhone was delivered two days

play19:51

ago cool could you share the order

play19:54

number with me Of course It's 1029

play20:00

9849 Great Thanks is the device

play20:03

physically damaged in

play20:06

anyway no there's no physical damage

play20:09

It's just not turning on despite trying

play20:11

All the basic troubleshooting

play20:13

steps bomber um would Joe prefer to

play20:16

return the iPhone to an acme talco Store

play20:19

or ship it Back shipping it Back would

play20:22

be the best option could you please

play20:24

provide the shipping information and

play20:26

process to get a replacement

play20:31

[Música]

play20:41

[Música]

play20:45

jo.com y esto que estáis viendo aquí es

play20:48

el futuro de la atención al cliente

play20:50

asistentes telefónicos que ya no van a

play20:52

ser personas van a ser inteligencias

play20:54

artificiales pero que no te vas a dar

play20:55

prácticamente ni cuenta porque recordar

play20:57

que esta s simulan de una manera muy

play21:00

bien conseguida la empatía el humor el

play21:02

Sarcasmo y cosas que hasta ahora eran

play21:05

solo de humanos o al menos en lo que

play21:06

asistentes de voz se refiere ya que ch

play21:08

gpt podía interpretarlo pero solo con

play21:10

texto y esto es lo que vemos en el caso

play21:11

de uso número 13 el Sarcasmo

play21:15

[Música]

play21:31

[Música]

play21:33

y aquí veis la capacidad que tiene para

play21:35

ser sarcástica y el caso de uso número

play21:36

14 Es uno que realmente cambia

play21:39

completamente el paradigma de las

play21:40

personas ciegas gt4 puede ser los ojos

play21:43

de una persona que no tiene Visión

play21:58

How exciting to be there While the king

play22:00

is home try and Tell me exactly what

play22:02

they're doing right now please um right

play22:05

now the ducks are gently gliding Across

play22:07

the water they're moving in a fairly

play22:10

relaxed manner not In A hurry

play22:13

occasionally One of them Will di its

play22:15

Head Under the water probably looking

play22:17

for Food and then Pop Back

play22:20

Up I even know When A taxi is coming

play22:23

with its Orange light on I think I'll

play22:24

hail it to get

play22:26

home yes

play22:39

incluso esta persona ciega ha sido capaz

play22:41

de con la ayuda de gpt 4o parar a un

play22:43

taxi el solo y esto no solo Me parece

play22:45

increíble para personas que son ciegas

play22:47

para las personas que son mudas y hablan

play22:48

con lenguaje de signos ahora todo el

play22:50

mundo puede entenderlos ya que

play22:51

simplemente tenemos que abrir la cámara

play22:53

y decirle a gpt 4o qué es lo que nos

play22:55

está diciendo esa persona en lenguaje de

play22:57

signos ahora Por otra parte vamos a ver

play22:59

la parte más creativa de gpt 4o con el

play23:02

caso de uso número 15 que son los cómics

play23:03

e historias visuales aquí en estas

play23:06

imágenes generadas por gpt 4o podemos

play23:08

ver cómo es capaz de generar textos

play23:10

enteros de una calidad muy buena y cómo

play23:13

puede hacer que se corte la hoja y

play23:15

seguir con la consistencia de la imagen

play23:17

y con la consistencia del texto otros

play23:20

ejemplos pueden ser aquí con la

play23:21

consistencia de la imagen de esta

play23:23

cartera y está creando una historia

play23:25

completa con el mismo personaje o con

play23:27

este robot de aquí que es capaz de

play23:29

crearlo consistentemente durante todas

play23:31

estas imágenes y fijaros como esta

play23:32

capacidad de crear personajes

play23:34

consistentes nos llevan a caso de uso

play23:35

número 16 la creación de carteles ya sea

play23:38

para libros o películas generados A

play23:41

partir de imágenes de referencia como

play23:43

estas de aquí este sería el póster final

play23:46

nada mal la capacidad que tiene para

play23:48

crear imágenes pero sobre todo lo que

play23:50

más me impresiona es el caso de uso

play23:51

número 17 la capacidad que tiene para

play23:54

escribir en las imágenes fijaros aquí

play23:57

con la letra cursiva letra escrita a

play23:59

mano esto es una imagen generada por gpt

play24:02

4o es increíble la capacidad que tiene

play24:05

para escribir y más teniendo en cuenta

play24:07

de que hace poco ni mid Journey ni dalit

play24:09

3 ni ningún modelo de lenguaje era capaz

play24:11

de poner una sola palabra en una imagen

play24:14

fijaros hasta el punto en el que Hemos

play24:16

llegado En tan poco tiempo el caso de

play24:18

uso número 18 nos dice hasta el punto

play24:20

que Hemos llegado y es hasta el punto de

play24:22

poder crear Fuentes enteras fuentes de

play24:24

de letras de tipografías a partir de

play24:27

texto Aquí vemos algunos ejemplos de

play24:29

fuentes creadas con gpt 4o que es algo

play24:31

que me parece muy sorprendente la verdad

play24:33

y todo esto nos permite ser super

play24:34

creativos igual que con el caso de uso

play24:36

número 19 de la foto a la caricatura con

play24:39

las fotos de referencia como son tan

play24:41

precisas podemos generar por ejemplo

play24:42

caricaturas o como esta de aquí imágenes

play24:45

que estoy seguro que pronto veremos a

play24:48

todo el mundo con fotos de perfil de

play24:50

este estilo y esto nos hace pensar con

play24:52

el caso de uso número 20 como poco a

play24:54

poco Photoshop va a dejar de existir ya

play24:56

que fijaros aquí con este input de estas

play24:58

dos imágenes ha sido capaz de crear una

play25:01

tercera imagen con el logo de Open Ai en

play25:04

esa tabla de mármol esto que llevaría un

play25:06

buen rato hacerlo en Photoshop se puede

play25:08

hacer ahora en segundos con gpt 4 por no

play25:11

hablar del caso de uso número 21 el

play25:13

último la generación de objetos en 3D

play25:16

fijaros como aquí con este prompt

play25:18

conseguimos imágenes en 3D que al final

play25:20

las podemos juntar todas para hacer una

play25:23

reconstrucción en 360 del logo de Open

play25:26

Ai en 3D tanto el logo como cualquier

play25:29

cosa que nos podamos imaginar y para

play25:30

finalizar vemos aquí los benchmarks las

play25:32

comparaciones de los modelos de lenguaje

play25:35

que hay actualmente y vemos como gpt 4o

play25:38

supera a todos los modelos de lenguaje

play25:41

menos aquí en la prueba Drop que le

play25:43

supera gpt 4 Turbo aquí estáis viendo

play25:46

una imagen de Qué es cada una de estas

play25:47

seis pruebas pero es sorprendente como

play25:50

Este modelo siendo gratuito Es el mejor

play25:53

de todos también podemos ver lo que

play25:54

decíamos al principio del vídeo cómo ha

play25:56

mejorado en cada uno de los idi

play25:58

necesitando menos tokens para entender

play26:01

todas estas lenguas pasando en el

play26:03

gujarati espero Haberlo dicho bien de

play26:06

145 tokens por este texto a solo 33

play26:10

vemos Que incluso ha reducido las tokens

play26:13

necesarias para el español y cuándo

play26:15

estará disponible Este modelo pues

play26:17

podemos ver como las capacidades de

play26:18

texto e Imagen están implementadas desde

play26:21

ya que están haciendo que gpt 4o esté

play26:23

disponible en el nivel gratuito y para

play26:25

usuarios Plus con límites de mensajes

play26:27

hasta 5 veces mayores tengo entendido

play26:29

que para los usuarios Plus es de 80

play26:32

mensajes cada 3 horas y que para los

play26:33

gratuitos es de 10 cada 3 horas que

play26:36

lanzarán una versión Alfa del modo de

play26:38

voz en las próximas semanas y que los

play26:40

desarrolladores pueden acceder a la Api

play26:42

del modelo de texto y de visión y nos

play26:44

dicen como el modelo gpt 4o es dos veces

play26:47

más rápido la mitad de precio y con

play26:49

límites de velocidad cinco veces más

play26:51

altos en comparación a gpt 4 Turbo vamos

play26:54

el modelo en sí es mejor Y por último

play26:56

nos dicen que planean lanzar soporte

play26:58

corte para las nuevas capacidades de

play26:59

audio y vídeo de gpt 4o es decir la

play27:02

mayoría de casos de uso increíbles que

play27:04

hemos visto a un pequeño grupo de socios

play27:06

confiables en la Api en las próximas

play27:09

semanas así que esto ha sido todo

play27:10

Recuerda que en la descripción tienes un

play27:12

regalo esperándote el kit gpt versión

play27:14

principiantes y nos vemos en el próximo

play27:16

vídeo adiós

Rate This

5.0 / 5 (0 votes)

Related Tags
GPT-4 OVNIOpen AIIntegración AudioRealidad VirtualEntretenimientoEducaciónAsistencia TelefónicaTraducción en Tiempo RealAprendizaje AutomatizadoIA Avanzada
Do you need a summary in English?