OpenAI presenta ChatGPT-4 OMNI (GPT-4o): GPT ORA SEMBRA AVERE EMOZIONI!
Summary
TLDRThe video script details a live demonstration and discussion of the latest model from OpenAI, named GPT-4o. The model represents a significant leap in AI technology, particularly in multimodal interaction, including audio and visual capabilities. The presenter, Mira, the CTO of OpenAI, highlights the new model's ability to understand and respond to emotions in real-time, as well as its enhanced conversational skills. The script also covers the model's application in various scenarios, such as solving mathematical problems, storytelling, and even translating languages. The presenter emphasizes the importance of making this advanced technology accessible to all users, both free and paid, and mentions that the model will be available through APIs for integration into other platforms. The excitement and potential applications of GPT-4o are palpable throughout the script, suggesting a future where human-machine collaboration is more natural and intuitive.
Takeaways
- 📢 The live stream has concluded with the announcement of a new model from OpenAI, named GPT-4o, which is considered a significant advancement, particularly in audio interaction.
- 🎉 There was an 'Wow effect' during the presentation, indicating a positive reception of the new features, although it was not the previously rumored GPT 4.5 or GPT 5.
- 📈 GPT-4o represents a step towards multimodality, enhancing the interaction through voice and possibly integrating a new search engine feature.
- 🌐 The new model aims to be more accessible, with plans to release a desktop version of chat GPT available for download on various platforms.
- 🆓 OpenAI emphasizes the importance of making their technology available to everyone for free, suggesting that the new model will be accessible to free users as well.
- 📱 A new app is in development that will allow users to interact with GPT through video, showcasing the model's computer vision capabilities.
- 🎙️ GPT-4o has improved voice interaction, allowing for real-time responses and the ability to interrupt the AI, making conversations more natural.
- 📈 The model is said to understand and express emotions, a significant step forward in creating a more human-like interaction.
- 🤖 The AI can now generate voices in various emotional styles, and it has been demonstrated to respond to emotional cues in a human-like manner.
- 🔍 The AI has been integrated with a desktop application, allowing it to interact with the user's computer screen in real time, including the ability to assist with coding problems.
- 🌟 The live demonstration showcased the AI's ability to translate languages, understand emotions from facial expressions, and its potential applications in various fields beyond just text-based interactions.
Q & A
What was announced during the Open AI live stream?
-During the Open AI live stream, a new model called GPT-4 was announced, which is described as a significant step forward, particularly in terms of audio interaction and multimodal capabilities.
What is the significance of the 'o' in GPT-4o?
-The 'o' in GPT-4o seems to be an intentional addition to the model's name, possibly to signify the new capabilities or improvements over the previous models.
What was the main focus of the new GPT-4 model?
-The main focus of the GPT-4 model is its enhanced multimodal capabilities, especially in terms of vocal interaction, which was demonstrated during the live stream.
How was the GPT-4 model expected to be different from GPT 4.5 or 5?
-The GPT-4 model was not expected to be a simple incremental upgrade to 4.5 or 5. Instead, it was anticipated to include a deviation or a 'fork' in development that would introduce new features, particularly in vocal interaction and multimodality.
What was the reaction to the announcement of GPT-4?
-The reaction to the announcement of GPT-4 was positive, with an 'effect Wow' being mentioned, indicating that the audience was impressed by the advancements presented.
What is the goal regarding the availability of Open AI's technology?
-The goal stated during the live stream is to make Open AI's technology available to everyone, emphasizing the importance of accessibility and reducing barriers for all users.
What new feature was released for the desktop version of chat GPT?
-A desktop version of chat GPT was released, which is expected to be available for download from platforms like the Microsoft Store for Windows and likely the Mac Store for Apple users.
How will the new model be made available to users?
-The new model, GPT-4, will be made available to all users, including those on the free tier, with the expectation that it will be accessible in the coming weeks.
What are the limitations for free users of the new model?
-While the new model will be available to free users, there will be limitations. It is suggested that free users might be restricted to a certain number of messages, with the paid users having a higher limit.
How will GPT-4 be integrated into existing platforms?
-GPT-4 will not only be available within chat GPT but also accessible through APIs, which means it can be integrated into various platforms and services.
What is the future vision for the interaction between humans and AI like GPT-4?
-The future vision for human-AI interaction, as demonstrated by GPT-4, is moving towards a more natural and intuitive collaboration, with the AI being able to understand and respond to human emotions and speech in real-time.
Outlines
🚀 Introduction to GPT-4 and Multimodal Advancements
The video begins with the announcement of GPT-4, a significant upgrade from its predecessor, focusing on audio interaction capabilities. The presenter expresses excitement about the 'Wow effect' of the new model and its deviation from the expected GPT 4.5 or 5. There's a hint at rumors of a new search engine by OpenAI, but the focus is on the multimodal aspect of GPT-4, which is seen as a step towards more natural human-machine collaboration.
🌐 Accessibility and Simplicity of Technology
The speaker emphasizes the importance of making technology accessible to all, for free, and in an intuitive and simple manner. They discuss the recent changes that have made chat GPT accessible without the need for registration. The presenter also mentions a redesigned graphical interface aimed at simplicity and user focus, and the release of the desktop version of chat GPT, suggesting upcoming apps for Windows and Mac.
🔍 GPT-4's Native Multimodal Capabilities and Latency Reduction
The paragraph discusses the native capabilities of GPT-4 in handling text, audio, and visual inputs simultaneously, which is a significant improvement over the previous model that required a sequential process of transcription, intelligence processing, and text-to-speech conversion. This new approach reduces latency and makes interactions with the AI feel more natural and less mechanical.
📈 GPT-4's Impact on User Experience and Accessibility
The presenter talks about the impact of GPT-4 on user experience, highlighting that it will be available to free users with certain limitations. Paid users will have increased interaction limits. The paragraph also mentions that GPT-4 will not only be available within chat GPT but also accessible through APIs, which is a significant development for integrating the model into other platforms and applications.
🎤 Real-Time Conversation and Emotional Intelligence
This section showcases the real-time conversation capabilities of GPT-4, including its ability to respond immediately without latency and to understand and express emotions. The presenter demonstrates the AI's full duplex communication, its emotional responsiveness, and its capacity to generate voices with a range of emotional styles, making interactions more human-like.
🤖 Robot Storytelling and Expressive Abilities
The presenter is excited about the AI's ability to engage in storytelling with emotional depth. The AI is shown to respond to prompts for more drama and emotion in a story, and even to sing, demonstrating its advanced expressive capabilities and emotional understanding. This interactive and emotional aspect of the AI is seen as a significant step forward in human-AI interaction.
📱 Visual Interactions and Problem-Solving with GPT-4
The video demonstrates GPT-4's visual interaction capabilities, where it can assist with solving a math problem through video interaction. The presenter uses their phone's camera to show a math problem to the AI, which then guides them through the steps to solve it. This showcases the AI's computer vision skills and its ability to understand and respond to visual cues.
🖥️ Desktop App Integration and Real-Time Translation
The presenter discusses the desktop app capabilities of GPT-4, which can interact with the user through microphone and speakers and also access screen sharing. This feature allows the AI to see and respond to what's on the user's screen in real-time. Additionally, the AI is shown performing live translation between English and Italian, demonstrating its multilingual and real-time comprehension skills.
😄 Emotion Recognition and the Future of AI Interactions
The presenter explores GPT-4's ability to recognize emotions from facial expressions, asking the AI to describe the emotions it 'sees' based on the presenter's face. The AI's accurate description of the presenter's emotional state highlights the potential for emotionally intelligent AI. The presenter expresses a keen interest in exploring these emotional interactions further and signing off with a call to action for viewers to like, subscribe, and engage with the content.
🎉 Conclusion and Anticipation for Future Interactions
The video concludes with the presenter expressing enthusiasm for the future of interacting with AI, likening it to a form of psychotherapy. They emphasize the 'Wow effect' of the new capabilities and encourage viewers to share their thoughts on the developments. The presenter thanks the audience for their attention and participation, looking forward to further exploration and interaction with the AI.
Mindmap
Keywords
💡Open AI
💡GPT-4
💡Multimodality
💡Voice Mode
💡Real-Time Interaction
💡Emotional Intelligence
💡Text-to-Speech
💡Screen Sharing
💡Live Translation
💡Computer Vision
💡User Interface
Highlights
Announcement of the new OpenAI model, GPT-4, which is a significant improvement over the previous version.
GPT-4 is a multimodal model, with enhanced capabilities in text, vision, and audio.
GPT-4 will be available to all users, including free users, making the technology more accessible.
The desktop version of Chat GPT will be released, along with apps for Windows and Mac.
GPT-4 will feature real-time conversation capabilities, with reduced latency compared to previous models.
Users can now interrupt the model while it's speaking, thanks to the full duplex functionality.
GPT-4 can understand and respond to emotions, making interactions more natural and human-like.
The model can generate voices with a wide range of emotional styles and expressions.
GPT-4 can perform live translations between English and Italian in real-time.
The model can understand and describe emotions based on visual cues, like facial expressions.
GPT-4 can interact with users through video, leveraging computer vision capabilities.
Users can share their screen with the model, allowing it to see and understand on-screen content in real-time.
GPT-4 can assist with tasks like solving math problems, guiding users through the steps.
The model can understand and respond to user emotions, making the interaction more engaging and personalized.
GPT-4 represents a major step forward in natural language understanding and human-computer interaction.
The release of GPT-4 has generated a lot of excitement and interest, with many looking forward to trying out the new capabilities.
The model's ability to understand and convey emotions could have significant implications for fields like psychology and mental health.
GPT-4 is a major leap in AI technology, with the potential to transform a wide range of industries and applications.
Transcripts
Allora si è conclusa non più di 10
minuti fa la diretta di Open ai nella
quale è stato annunciato il nuovo
modello di Open ai cioè GPT
4o non so per cosa stia la o però si
chiama 4o in sostanza 4o e è una bella
rivoluzione Non male Non male ci hanno
fatto vedere qualcosa l'effetto Wow c'è
stato l'effetto Wow c'è
stato sapevamo che non sarebbe stato
chat GPT 5 Sap saamo che non sarebbe
stato il 4,5 hanno diciamo preso un fork
diciamo hanno fatto una una deviazione
sono rimasti nella denominazione di GPT
4 ma c'è l'aggiunta della vocale o e a
me sembra tutto sommato anche adesso ce
l' andiamo a vedere con calma e a me
sembra tutto sommato comunque che si
tratti di un diciamo di un improvement
di un grosso passo in avanti
principalmente nei riguardi dell'audio
cioè dell'interazione vocale con questa
macchina questa cosa era stata un po'
annunciata C'erano stati dei rumors che
si sarebbe trattato probabilmente di un
qualcosa del genere siera detto di tutto
forse sarebbe stato il nuovo search
engine il nostro il nuovo motore di
ricerca di Open ai che comunque arriverà
Secondo me come se arriverà Eh non si
tratta ancora di GPT 4,5 né del 5 che
sono il 5 atteso per la fine dell'anno e
invece ci hanno fatto questa sorpresa
per quanto riguarda l'interazione ione
vocale proprio in particolare Secondo me
è questo il diciamo è un modello più
multimodale rispetto rispetto a quello
che era prima ok Quindi è un passo in
avanti verso la multimodalità questo è
stata un po' l'impressione che ci ha
dato la diretta Quindi adesso siccome
Open ai ha appena ricaricato il video La
diretta è stata convertita in un video
ce l' andiamo a vedere Ce l' andiamo a
vedere insieme così lo traduciamo parola
per parola tutto quanto cerchiamo di
capire un un po' che cosa ci aspetta nei
prossimi giorni purtroppo ancora non è
non c'è niente Sono andato subito a fare
il refresh della di chat GPT ma ancora
non è stato diciamo distribuito
Ovviamente appena finita la live ce
l'aspettiamo poi lei Comunque adesso lo
dice ce lo aspettiamo nelle prossime
settimane una roba l'effetto Wow c'è per
cui guardiam celo insieme vai così you
grande grande Lei è Mira lei è Mira
murati la CTO la CTO di Open ai una
ragazza albanese carina e molto brava
molto intelligente sentiam
Ola oggi parliamo di tre
cose iniziamo col dire perché per noi è
così importante che la nostra tecnologia
sia disponibile a tutti ok a tutti
e Cerchiamo sempre di fare in modo che
tutti possano ridurre gli ostacoli
diciamo a che tutti possano utilizzare
chat GPT dovunque si trova
today the desktop version of chat GPT
quindi oggi rilasceremo la versione
desktop di chat GPT quindi mi aspetto
che ci sarà un'app Scar per desktop
quindi scaricabile dal Microsoft Store
per Windows e anche immagino io non ho
il Mac però immagino Ci sarà anche un un
Mac Store un Apple Store quindi delle
applicazioni per Mac e sentiamo
and e anche e anche una nuova
interfaccia comunque grafica per il sito
web in maniera tale che sia più semplice
e naturale per
tut Ma la notizia di oggi è che stiamo
per rilasciare il nostro nuovo modello
di punta
e lo chiamiamo 4
G everyone la cosa la cosa nuova è che
porta la l'intelligenza di chat GPT 4 a
tutti quanti quindi diciamo Secondo me
lei Qua sta dicendo che è ancora chat
GPT 4 Quindi è un miglioramento del 4 Ok
non siamo andati ad un altro livello è
un miglioramento del 4 che adesso
diventa più multimodale
Ah e lo portano anche quindi sarà
accessibile anche agli utenti free agli
utenti gratuiti quelli che non non hanno
l'account a
pagamento facciamo vere qualcosa dal
vivo per farvi vedere una una
dimostrazione farvi vedere le nuove
capacità e ve lo distribuiremo nell'arco
delle prossime settimane le prossime few
weeks poche
settimane
al
Let's Vabbè di nuovo vuole Loro vogliono
che la tecnologia sia disponibile a
tutti in maniera gratuita Non capisco
perché la terza volta già nel primo
minuto e mezzo che dice che è importante
per loro che la tecnologia sia
disponibile a tutti in maniera gratuita
Vabbè vogliono che sia più intuitiva più
semplice andamo un po' no aspetta che
adesso ci fa vedere
l' Ah dice recentemente peraltro hanno
anche reso accessibile chat GPT a tutti
senza la procedura di iscrizione Sign
Flow quindi diciamo Io non lo so perché
essendo iscritto Naturalmente quando Acc
chat GPT mi riconosce sempre come utente
Però evidentemente invece è anche
possibile accedere a chat GPT senza
iscriversi e oggi ci fa vedere la
siamo dovunque siamo è semplice facile e
Si
[Musica]
integra in tutto il
tuo Oltre a questo abbiamo anche rifatto
l'interfaccia
grafica fatta per fare in modo che
insomma invece di focalizzarci su dice
anche se le cose sono diventate sempre
più complesse perché il modello si fa
sempre più complesso Noi invece il
nostro sforzo è quello di rendere la
l'interfaccia grafica sempre più facile
intuitiva per fare in modo che tu non ti
debba focalizzare su come si usa quindi
sull'interfaccia sulle cose ma invece
resti focalizzato sul tuo lavoro perché
l'interfaccia diventa sempre più
semplice
E vabbè questo ce l'hai già detto di
nuovo adesso rilasciamo il nostro
modello di
[Applauso]
punta quindi ci porta il l'intelligenza
di cpd di chat GPT 4 quindi di nuovo
spiega diciamo sottolinea che non è un
nuovo modello è lo stesso modello che
però che cosa
fa che quindi improve quindi migliora le
sue capacità nel testo Nella visione e
nell'audio e nell'audio quindi testo
visione e
audio negli ultimi du anni abbiamo
cercato di renderlo sempre più
intelligente questo modello e abbiamo
fatto anche
bene ma questa è la prima volta
che stiamo Questa è la prima volta che
stiamo davvero facendo un passo in
avanti quando si parla della facilità
della semplicità di uso
dell'utilizzo questo è importante perché
stiamo cercando no di tracciare il
futuro della collaborazione tra l'essere
umano e la macchina
GPT 4 o sta davvero portando avanti
questo nuovo
paradigma nel futuro della
collaborazione Questa interazione
diventa sempre più naturale e
semp lei dice quando interagiamo tra
esseri umani sottointende ci sono un
sacco di cose che noi diamo per scontate
la semplicità del nostro dialogo quando
ci quando ci interrompiamo quando ci
interrompiamo l'un l'altro il background
Noise quindi il rumore di sottofondo che
sentiamo mentre
parliamo le diverse paro le diverse voci
che sentiamo all'interno di una
conversazione o comprendere il tono di
voce delle persone con cui
parliamo tutte queste cose sono molto
complesse questo
modello E fino adesso col Voice
Mode transcription intelligence and then
Text to spech all Comes orchestration to
deliver Voice Mode Ok Allora fino adesso
col Voice Mode che abbiamo conosciuto
per chat GPT abbiamo avuto che ha detto
L'intelligenza non mi ricordo più
insomma questi tre passaggi perché
praticamente noi oggi parliamo con chat
GPT no e quello che diciamo viene a
transcription quindi viene
trascritto prima in testo poi il testo
viene inviato a chat GPT che lo elabora
intelligence e poi il text to speech che
ce lo riporta indietro vocalizzato e
tutto questo naturalmente Questo è come
funziona oggi
Ok this also brings a of
Lat e questo c'è porta il problema della
latenza in questo tipo di di esperienza
No per proprio questi tre passaggi che
facciamo ogni volta che parliamo noi e
che poi la macchina ci risponde che poi
parliamo ogni volta sono questi tre
passaggi che rallentano e rendono questa
cosa un po' un po' macchinosa in effetti
è stato così fino ad
oggi ma adesso con
4 tutto questo accade in maniera nativa
na
ora GPT 4 ragiona ragiona attraverso
l'audio la parte vocale la parte testo e
la parte
vision e questo non so perché di nuovo
la quarta volta dice che sarà
disponibile anche diciamo porteranno
questa novità agli utenti
[Musica]
gratu Lear
[Musica]
dunque al momento abbiamo queste 100
milioni di persone che imparano creano e
lavorano su chat GPT e ci sono delle
funzioni che sono disponibili solo agli
utenti che
pagano vuole proprio insistere su questa
cosa Comunque è importante Si vede che
Open Ei vede proprio una cosa importante
tutto quello di cui stiamo parlando sarà
disponibile anche agli utenti gratuiti
Però io ho già letto Sono andato già a
vedere sul sito di Open ai che
naturalmente ci saranno dei limiti no
l'utente gratuito potrà fare Non lo so
10 messaggi e poi si ferma l'utente
pagante invece ne potrà fare un po' di
più ma non illimitato anche l'utente
pagante mi pare di aver letto 40
messaggi ogni 3 ore o qualcosa del
genere con l'efficienza di questo nuovo
modello possiamo portare questo questo
dispositivo questa cosa a tutti
quanti Starting Today you can use
GPT GT
Allora adesso Siccome io l'ho già visto
lo so fa tutta una lista delle cose che
fa già oggi Ok diciamo fa un recap di
quello che fa chat GPT diciamo non è
molto
interessante quindi sta vedete sta qua
in alto si vede un po' GPT Store Vision
browse Memory Advanced data analysis
questo è tutto quello che fa al momento
Già up Times CAP
Limit Us ok Quindi gli utenti paganti
avranno un 5x rispetto agli utenti
gratuiti in termini di quanti
EV come dire di quante interazioni
potranno avere con la
macchina GPT 4o is not
GPT api oh questa è una gran cosa GPT 4o
non sarà solo disponibile all'interno di
chat GPT Ma sarà disponibile anche
dentro attraverso le api e questo è da
parte mia Un applauso perché significa
che molto presto Ce lo ritroveremo
dentro wener Naturalmente la nostra
piattaforma di intelligenza artificiale
come sapete è stato rilasciato oggi
Dateci qualche giorno di lavoro molto
Presto troverete il modello GPT 4o
all'interno di wyner sono ovviamente al
momento in grado di dirvi nient'altro
rispetto ai prezzi o ai limiti di
utilizzo perché non lo sappiamo saamo
ancora però non c'è alcun dubbio che
entro pochi giorni ce l'avremo anche
dentro breiter e le api saranno quindi
due per Faster lo vedo quindi due volte
più veloci 50% più economiche 5 e
avranno un rate
limits 5 volte maggiore rispetto al
Turbo l'applauso lo facciamo anche noi
grandi grandi andiamo un po' avanti
perché tanto l'abbiamo già letto
Ok Vab bene ovviamente C il loro Team è
al lavoro per fare in modo che tutto
questo non venga abusato perché adesso
perché lei ha detto un attimo prima io
l'ho già sentito diceva che comunque
adesso naturalmente c'è un questo audio
continuo aperto ok perché tu adesso puoi
interrompere anche la macchina mentre
parla adesso ce la fanno vedere È
incredibile e quindi Aspettate un attimo
e e quindi loro stanno anche
naturalmente al lavoro per in modo tutto
questo non possa essere abusato da parte
di utenti malintenzionati
di nuovo nelle prossime settimane loro
lavoreranno per portarci tutte queste
nuove capacità a disposizione di
ciascuno di
noi ma adesso adesso ci chiama due
tipi
Ok adesso entrano questi due e ce la
fanno vedere finalmente questa cosa è
[Applauso]
fantastica ciao ciao
Ok una delle capacità che non vedevano
l'ora di farci vedere è il Real Time
conversation speaking qualcosa del
genere insomma il modo in cui oggi si
converserà con questa macchina
Guardatelo perché è
fantastico prendi il
telefono il cavo ha detto se vi state
domandando perché il telefono ha il
cavetto attaccato perché abbiamo un
consistent
internet ok Quindi si vede l'app la
nuova app che sarà rilasciata a breve
che ha che ha che cosa un pulsante che
permette Insomma di attivare Ok In basso
a
destra
than Ok fino a qua diciamo che non c'è
niente di nuovo quindi G fa Ciao sono
Mark e Ciao Mark come stai Tutto a posto
E però è mancata la latenza che c'era
prima prima chiunque di voi abbia mai
provato l'app di chat
GPT Voice Mode e c'erano aspettare un
po' di secondi prima che la macchina
rispondesse invece come avete visto ha
risposto
velocemente Allora sono on stage sto
facendo una live demo quindi sono un po'
nervoso puoi aiutarmi a calmare un po'
il mio
[Musica]
nervosismo lei gli dice Ah davvero stai
facendo una live però sentite No proprio
l'atteggiamento la voce no che non è una
voce robotica così è una voce Ah davvero
stai faccendo Una live demo in questo
momento allora Fai una bella cosa prendi
un fai Un respiro
profondo
Feed
here mi dai un
feedback dice gli dai un feedback lui ha
fatto così no E allora lei ha detto oh
Mark non sei un vacum Cleaner come dire
un aspirapolvere
Ok Ok proviamo
ancora respiro
profondamente Senti lei come dice Adesso
resp inspira
respira Ok come ti senti gli fa la
macchina
Ok abbiamo lavorato a lungo su Queste
capacità adesso ci vuoi spiegare In che
cosa è diverso rispetto al Voice Mode
attuale quello che abbiamo adesso
nell'app Ok dice se avete mai provato il
Voice model in passato Avete visto due
differenze uno adesso puoi interrompere
il modello cosa che prima naturalmente
non potevi perché c'era prima la
necessità che la macchina trascrivo che
tu dicevi per cui non non era in ascolto
mentre parlava invece adesso è in
ascolto è in full duplex come come i
vecchi telefoni No è in full duplex per
cui diciamo puoi interrompere il
modello non devi aspettare il tuo turno
prima di parlare Puoi parlare quando
vuoi la seconda è che c'è un diciamo
risponde in real time quindi non c'è
quella latenza di cui parlavamo
prima non devi aspettare quegli strani
due o tre
secondi prima di ricevere la risposta
f e questa volta il
modello comprende le
emozioni quando infatti lui ha fatto
fatto quella cosa con la respirazione il
mod ha detto oh magari ti vuoi dare una
calmata un attimo ha fatto pure la
battuta aggiungo
io quindi ha proprio questa capacità di
percepire le tue
emozioni ma non finisce qua il modello è
in grado di generare voci in una
varietà di di una Una varietà di stili
emotivi
diversi ok Quindi il modello stesso può
non solo capisce le tue emozioni ma
anche il modo in cui genera la voce non
è piatto ma è in grado quindi di avere
delle espressioni emotive anche in
produzione e ha un Wide Dynamic range ha
un una cosa molto ampia Insomma di
questa e dinamica di di questa
possibilità di questa Capità adesso
facciamo vedere un'altra cosa dice Quest
visto Intanto come ha risposto subito
e Fantastic Ok non è più come prima No
piatta sto bene grazie Dimmi tutto no
l'assistente vocale adesso ha Quest ha
questa cosa di Fantastic
me dice il mio amico qua ha problemi ad
addormentarsi ci racconti una storia
della buona notte and love su un robot e
e l'amore un robot che si innamora
Oh story about robots and love C ragazzi
oh Bad Time story about robot Cioè ma è
meraviglioso è meraviglioso io la voglio
conoscere questa
voce covered
bellissima Adesso ci penso
io allora allora lei inizia a dire C'era
una volta tanto tempo fa un robot che si
chiama B lui la interrompe subito e gli
dice mettici un po' più di Drama Ok
Rendila un po più mettici un po' più di
emozione in questo tuo
racconto
Ok ragazzi è fantastico quindi avete
sentito il cambio No proprio di prosodia
il cambio emotivo della voce adesso lui
la ragazzo a destra lo la interrompe di
nuovo e gliene chiede ancora di più
Senti
la massima espressività che riesci a
fare molto più di quello che hai fatto
fino adesso Senti lei
Eh e lei la Inter AV sentito che che
cosa fantastica quanto tramma ci ha
messo nella voce adesso lei la
interrompe di nuovo e gli dice lo puoi
fare
la puoi fare l'ho interrotta Scusate gli
dice la puoi fare con una voce robotica
adesso Ok adesso dice ora termina la
storia ma
e sentite il robot che
canta you
so dai meraviglioso Bravi bravi bravi
bravi ragazzi francamente non vedo l'ora
di interagire con questa cosa è stata
simpatica è stata simpatica sembra
proprio far parte di una conversazione
umana la interrompi e ha questo modo
emotivo spiritoso avete sentito quando
gli dice di cantare Se volete Risen
itevelesa
termina la storia Ma fallo cantando
sentite la il robot che fa come di
rottura di scatole EC
qua Cioè è incredibile Incredibile
Incredibile dai
incredibile Ok allora dice fino a qua
abbiamo visto le capacità vocali Ma
parliamo anche delle capacità visive
perché qua roba forte ragazzi guardate
qua Ok dice puoi puoi chattare con chat
GPT ma puoi anche interagire col con
chat GPT attraverso il
video Ok ho bisogno del tuo aiuto per
risolvere un problema di
matematica Sono tutto orecchi come ti
posso aiutare
Ok adesso ti faccio vedere un problema
di algebra di matematica tu mi aiuterai
a risolverlo però dice non mi dare la
soluzione invece Spiegami i passaggi per
risolver ho visto ANC ved aspetta che mo
te lo faccio vedere quindi prende il
telefono in mano e apre la telecamera
sentite lei che sta ridendo sentite un
at cioè che ci ho parlato sopra Adesso
lui prende il telefono lui gli dice
Aspetta che ancora non te l'ho fatto
vedere e il robot accenna una specie di
sorriso Perché diciamo capisce che c'è
stato un piccolo
misunderstanding ragazzi a scherzare Qua
c'è chat GPT che ride cioè i chat GPT
che ha fatto Ops Cioè
Boh allora lui gli
scrive Fate attenzione perché c'è la
telecamera accesa e quindi sta
interagendo in video Ok in streaming
diciamo non in video ma in streaming
live streaming con il chatbot che vede
proprio quello che vede la telecamera
ragazzi Questa è anche computer Vision
di un certo livello eh
Ah vabbè naturalmente ha letto benissimo
3x + 1 = 4 dice allora lui gli fa Vabbè
Quali sono i passaggi che devo fare per
risolverlo
comincia a fare delle domande Cioè gli
dice che cosa pensi che ci dovremmo fare
con questo
più1 che succede quando lo sottrai da
entrambe le parti
benissimo Ora hai isolato la la x da una
parte e quindi hai 3x =
3 che cosa pensi che dovremmo fare
adesso per risolverlo quindi glielo
chiede capito chat GPT che fa le domande
finalmente chat GPT fa le domande cioè e
questa è chat GPT 4 Ok aumentato ok
hanno trovato un sistema per farlo
ragionare
meglio non sono tanto sicuro di quello
che devo fare Mi dai un'altra mano mi
dai una
mano hai 3x = 3 pensa a che cosa
dovresti fare per diciamo und come dire
non fare la moltiplicazione quindi
l'opposto della moltiplicazione
opp
Ok ok allora vai avanti e dividi tutte e
due le parti per tre
bingo ok
[Musica]
vabbè lui sta dicendo Non credevo che
queste cose potessero servire nella vita
allora lei sta dicendo insom una serie
di situazioni nelle quali ci si può
trovare a dover risolvere un'equazione
lineare dice in tutte quelle in tutte
quelle occasioni in cui ti trovi con una
variabile sconosciuta gli risponde Ah ok
Io nella mia vita è piena di variabili
sconosciute
devo imparare la
matematica Vabbè la matematica ti aiuta
a risolvere i problemi I misteri della
vita e quando vuoi quando vuoi sono qui
per dice mi piace che hai che hai
diciamo parlato della matematica col mio
amico però adesso faccio fa vere unal
cosa dice aspetta perché qui c'è un
altro understanding mi pare lui adesso
gli dice ti faccio vedere un'altra cosa
e dice Ah benissimo Ok dimmi quando sei
pronto lui
G avete sentito la voce di lei quando
lui gli fa vedere chat GPT e lei gli fa
Ah che bello che Che carino che sei Cioè
è una roba ragazzi emozionale ok È una
cosa che riesce a colpire l'aspetto
emotivo della comunicazione un passo
avanti gigantesco da questo punto di
vista alla fine questa già era
un'intelligenza
molto notevole davvero molto notevole Ma
adesso ha questa a a questo improvement
del del del riuscire a colpire l'aspetto
emotivo fantastico
Ok bravi Bravi veramente
[Applauso]
bravi ho
capit Ok adesso che sappiamo che
sappiamo risolvere le le le le equazioni
lineari fa ci fate vedere qualcosa di
più complesso questo non era abbastanza
ok Questo non era ancora abbastanza
complesso ci Dev far vedere qualcosa di
ancora più
complesso non mi ricordo che ci fa
vedere Ah il computer prende il computer
ok
ok Open desktop Oh adesso lui prende il
computer e apre l'app La desktop app ok
Quindi non non chat GPT sul web Insomma
il sito internet ma apre
l'app Quella di cui parlavamo prima
dice ti do un po' di background di
quello che sta
accadendo abbiamo sulla sinistra del
codice e la l'app chat GPT sta sulla
destra
okat GPT è in grado di sentirmi ma non
può vedere quello che accade sul
[Musica]
computer quindi adesso faccio seleziono
tutto il testo e con lui dice Command sì
perché sta su Mac ma su Windows In
realtà fai contrl C Ok quindi l'atto di
copiare copiando Evidentemente se non ho
capito male semplicemente il Copy quindi
nel momento in cui copi qualcosa con
l'app aperta viene inviata
automaticamente al modello da quello che
ho
capito okce Volevo sapere se se mi
aiutavi un po' col codice
certo Ok ti faccio vedere ti faccio
vedere codice Dammi un attimo e lei dice
certo prenditi tutto il tempo che
vuoi quindi lui copia e voilà vedete qua
è comparso code sent per cui gli è
bastato copiare e e qua dice code sent
per cui è stato già ricevuto dal
modello mi mi dai una breve descrizione
di quello che succede di quello che fa
questo
codice questo codice diciamo
feis prende una che ha detto weather
insomma la temperatura da una specifica
location Vabbè quello che fiamo un po'
avanti vabbè
Vabbè mi sono perso un
pezzo Vabbè dai insomma gli fa vedere Ah
aspetta Vedi però qua qua compare la
possibilità non solo di fare il copia
incolla quindi ma di fargli proprio
condividere condividere lo schermo la
computer Vision quindi applicata alla
desktop app invece che al cellulare e
quindi vedi lui cioè non è una
è proio lo streaming dello schermo che
gli va dentro l'app lui adesso muove lo
schermo e si muove anche dentro quindi
in streaming non è ok Non è uno
screenshot va bene e il computer riesce
a leggere il grafico in
sostan ora descrive il grafico andiamo
avanti grafico gradi celsus gradi
Fahrenheit andiamo avanti
Ok abbiamo capito No tanto Insomma è in
grado quindi di Come come come come app
desktop quindi interagisce direttamente
con noi col microfono e le casse e può
anche se noi glielo diamo non solo fare
copia incolla e gli mandi tutto quello
che vuoi ma anche può avere proprio
accesso allo screen sharing ok Quindi
vede proprio lo schermo anche mentre tu
ci lavori sopra mentre tu ci scrivi o
insomma muovi delle cose
Ok Qui dice abbiamo chiesto
alle alle persone che ci seguono i
follower su X su Twitter di farci delle
delle domande Adesso arriva una domanda
peraltro da un
italiano Ok bot gascar
Allora gli chiede se chat CPT è in grado
di fare visto che c'è questa nuova
funzionalità la prima cosa ci siamo
chiesti tutti quindi si è in grado di
fare
una una translation una traduzione live
direttamente adesso ce la fanno anche
vedere naturalmente Abbiamo anche il
traduttore universale a questo punto
siamo vicini a star tre
asking How about you how your day doing
so I would like you to function as a
translator I have a friend here Who only
Speaks italian and I only speak english
and every time you hear english I want
you to Translate it to italian and if
you hear italian I want you Translate it
back to English is that good Perfetto Ok
lui gli dice voglio che funzioni come un
translator come un traduttore Quindi
tutte le volte che se ho qua davanti a
me un'amica che parla solo italiano io
parlo solo inglese quindi per favore
Aiutaci quando senti l'inglese quando
senti una frase in inglese traducila in
italiano quando senti l'italiano
traducilo in inglese Lei gli risponde
Perfetto io mi chiedo se le balene
potessero parlare cosa ci direbbero e
quindi adesso sappiamo che mira murati
parla pure
italiano potrebbero chiederci come
risolviamo le equazioni limari lineari
Sicuramente
sì Yes Senti che ride ride Cioè lei mira
a riso Ok ha fatto sicuramente sì e il
robot Ha tradotto anche la risatina Cioè
una cosa questa è veramente una cosa
incredibile Questa è veramente una cosa
incredo non riesco a figurarmi di come
un algoritmo possa davvero simulare
questa cosa e pure ce l'abbiamo davanti
ragazzi che momento meraviglioso di
essere in
vita che momento
meraviglioso Bravi bravi veramente
effetto wow c'è ragazzi l'effetto Wow
c'è isito
John adesso dice se è in grado diciamo è
una
Chissà se era se era diciamo sono cose
preparate queste in realtà perché gli
dice se è in grado di diciamo leggere le
emozioni sulla
faccia fantastico guarda
e c
GPT dice Adesso ti faccio vedere un
selfie e tu mi dici che emozioni sto
provando basandoti su quello che vedi
Adesso però io credo che lui perché
questo me lo ricordo durante la live
credo che lui abbia ancora attiva la
telecamera Quella esterna questa qui ok
Per cui lei gli dice Io vedo solo un
tavolo di legno
Guarda dice ok Questo Questo sono io che
emozioni pensi che sto
provando dice vedi sembra che sto
guardando la la fotografia di una
superficie di
legno perché quando quando alato un
telefono lui dice no no no non sono un
telefono guarda guarda bene cioè voglio
dire non sono un tavolo Guarda
bene makes more sense adess Ah makes
more sense ora
Mamma mia ragazzi è incredibile ha
descritto
perfettamente la faccia di Sto scemo che
sorride così
è meravigliosa io la voglio conoscere
cioè la
voglio also to REM some of the mysticism
from the Technology and br to you so You
can try for your
USS
frer soon you On our
Progress Thing Ok W
justred Open team V ben ringraziamenti e
così via Grazie a tutti grazie al team
di Open ai grazie a chi ha partecipato
Grazie a voi non vi dico grazie A che Ma
invece io dico grazie a voi avermi
seguito fino a qua ragazzi che
considerazione questa è stata una
diciamo una first Reaction ok E tutto
questo è accaduto mezz'ora fa E e quindi
il tempo di metabolizzarlo io non vedo
veramente l'ora di provare Questa
interazione perché davvero siamo a Siamo
al film her vi ricordate siamo proprio
arrivati al al film in cui al momento in
cui questa voce emotiva Eh a me ha
risvegliato qualcosa cioè ho voglia di
parlarci capito ma non quella voglia
come quando compri un telefono nuovo no
la voglia di giocarci ho proprio voglia
di interagire con questa voce eh
emozionale con questa voce Voglio
sentirla ridere insieme a me capito
Voglio
Eh non lo so voglio divertirmi insieme a
lei voglio esplorare il modo in cui lei
riesce a capire le mie emozioni
comprendere Questo è il paradiso degli
psicologi Secondo me che adesso
arriviamo veramente alla alla alla
psicanalisi dei dei Bot siamo arrivati
alla follia che bel momento di essere in
vita ragazzi Questa eh quindi questo
rilascio diciamo non è il rilascio
dell'anno non è chat GPT 5 non non però
è l'effetto Wow c'è stato c'è stato
parecchio e fatemi sapere che cosa ne
pensate pure voi io non vedo l'ora di
prova questa roba Grazie per essere
stati con me e eh mi raccomando lasciate
un like iscrivetevi fatev tutto quello
che deve fare un bravo follower io
faccio tutto quello che deve fare un
bravo youtuber Ciao alla prossima n
Voir Plus de Vidéos Connexes
O film gerçek oluyor: Yeni GPT-4o yapay zeka modelinin sesine inanamayacaksınız!
Riassunto di tutti gli annunci di OpenAI: GPT4o e non solo!
Всё о новой нейросети GPT-4o за 7 минут!
Why OpenAI's Announcement Was A Bigger Deal Than People Think
GPT-4o 사용법 총정리 - 무료 사용량, 신기능 활용
GPT 4o - Deep Dive Review - AGI? - ChatGPT massive improvements
5.0 / 5 (0 votes)