Riassunto di tutti gli annunci di OpenAI: GPT4o e non solo!
Summary
TLDRThe video script discusses a highly anticipated conference by Open AI, where they announced several groundbreaking updates. The most notable is the introduction of a new model named GPT-4, which is not to be confused with GPT-5 due to PR reasons. GPT-4 is a multimodal model capable of handling text, vision, and audio natively, which significantly reduces latency and enhances the quality and speed of interactions. The model will be available to all users, including those with a free account, with the only difference being the number of messages they can send. The video also showcases impressive demos, including real-time translation, voice interaction, and even solving equations on paper. The script highlights the model's ability to understand and generate responses with human-like intonation and speed, making it more realistic and user-friendly. The advancements in GPT-4 are seen as a significant leap in AI technology, offering a more integrated and immediate user experience.
Takeaways
- 📢 The highly anticipated Open Eye conference featured a significant announcement, the unveiling of a new model named GPT 4o, which is a major update in the field of AI technology.
- 💻 A new desktop app for GPT has been introduced, allowing users to access the technology through a web login, smartphone app, and now a desktop application for PCs, offering a faster and more interactive experience.
- 🔍 GPT 4o is a multimodal model capable of handling text, vision, and audio natively, which is a significant leap from previous models that required transitions between separate models for different modalities.
- 🎉 GPT 4o will be available to all users, including free users, marking a new era where a paid subscription is not necessary to access the latest features, with the only difference being the number of messages allowed.
- 📉 The latency for GPT 4o has been significantly reduced to approximately 320 milliseconds, which is comparable to human response times, making interactions more immediate and realistic.
- 🎤 The new model features a more human-like and realistic voice, with improved tone, language nuances, and speed, enhancing the user experience and making it more engaging.
- 📱 A live demonstration showcased the ability to solve an equation in real-time using a pen and paper, without the need for taking a photo, highlighting the model's ability to process information in real-time.
- 🌐 GPT 4o can perform real-time translation, which was demonstrated by translating speech between Italian and English seamlessly, showcasing the model's capability to understand and produce language instantly.
- 🎨 The model has shown the ability to generate images and 3D objects from text descriptions, creating coherent and detailed visuals that align with the input provided.
- 📹 GPT 4o can summarize videos and extract key concepts, which could be particularly useful for processing long video content or meetings, offering a new level of efficiency in content analysis.
- ⚙️ Despite the impressive advancements, there is a note of caution regarding the potential for unexpected issues when new models are first implemented, suggesting that real-world testing will be crucial.
Q & A
What was the main topic of the Open Eye conference?
-The main topic of the Open Eye conference was the announcement of a new model called GPT 4o, which is a multimodal model capable of handling text, vision, and audio natively.
What are the three major announcements made during the conference?
-The three major announcements were: 1) A new desktop app for CGPT with a completely revised interface, 2) The introduction of the GPT 4o model, and 3) The availability of the new model to all users, including free users, with the only difference being the number of messages they can send.
How does the new GPT 4o model differ from previous models?
-GPT 4o is a multimodal model that can natively process text, vision, and audio, unlike previous models where these functionalities were handled by separate models with transitions between them.
What does the term 'Omni' in GPT 4o stand for?
-The term 'Omni' in GPT 4o stands for its multimodal capabilities, indicating that it can handle various modes of input and output natively and efficiently.
How does the new desktop app improve user interaction with CGPT?
-The new desktop app provides a faster and more fluid interface, lower latency, and the ability to use a microphone and webcam, making interactions more immediate and allowing features like screen sharing.
What is the significance of making GPT 4o available to free users?
-Making GPT 4o available to free users is significant because it allows access to advanced features without requiring a paid subscription, thus broadening the model's accessibility.
What are the potential applications of the real-time translation feature demonstrated in the conference?
-The real-time translation feature can be used to transform smartphones into real-time translators, facilitating communication between speakers of different languages on the fly.
How has the response time of the model improved with GPT 4o?
-The response time has been significantly reduced to about 300 milliseconds, which is similar to a human response time in a conversation, making it more realistic and user-friendly.
What is the significance of the model's ability to handle simultaneous voice, text, and video responses?
-The ability to handle simultaneous voice, text, and video responses allows for a more integrated and natural interaction, enhancing the user experience and making the model more versatile in various applications.
What are the implications of the model's improved coherence in character generation for storytelling or comic creation?
-Improved coherence in character generation allows for the creation of more consistent and engaging narratives, which can be particularly useful in applications like comic creation or interactive storytelling.
How does the model's ability to generate 3D objects and visual content enhance its utility?
-The ability to generate 3D objects and visual content expands the model's capabilities beyond text and audio, allowing it to be used in a wider range of applications, from graphic design to virtual reality.
What is the potential impact of the model's ability to summarize videos on content analysis and information retrieval?
-The ability to summarize videos could greatly enhance content analysis and information retrieval, making it easier to extract key points from long videos and making video content more accessible and searchable.
Outlines
📢 Open Eye Conference Recap
The video script begins with a summary of the highly anticipated Open Eye conference, where a significant announcement was expected. The conference was very interesting and showcased a new model, possibly named GPT 4, although the speaker humorously notes it could have been GPT 5. Three major announcements were made, which will be discussed in the video. The first is the introduction of a desktop app for CGPT, allowing for web use, smartphone app use, and now desktop app use, promising faster interaction with a revamped interface and lower latency. The second announcement is the unveiling of the new model, '4o', which is of great interest due to its impressive capabilities demonstrated live during the conference. The third piece of news is that this new model will be available to all users, including free users, marking a significant change as it means no paid subscription is required to access new features, only a difference in the number of messages.
🚀 GPT 4o's Multimodal Capabilities
The second paragraph delves into the importance of GPT 4o's multimodal capabilities, highlighting its native ability to handle text, vision, and audio. This is a significant improvement over previous models, which required transitions between separate models for different modalities, leading to increased latency. GPT 4o's real-time response to audio inputs, with a latency similar to human conversation, is emphasized as a key feature for realistic and convenient daily use. The paragraph also mentions that the free version of GPT 4 will include features previously exclusive to the paid version, such as file uploading, GPT usage, and memory capabilities.
🎤 Real-Time Translation and Voice Interaction
The third paragraph focuses on the real-time translation capabilities of GPT 4o and its ability to interact with users through voice. It discusses a demonstration where GPT 4o performs live translations between Italian and English, showcasing its low latency and human-like response times. The paragraph also touches on the public's mixed reactions to the speed of translation, with some finding it too slow and others appreciating the innovation. The speaker argues for a long-term perspective, suggesting that improvements will continue to be made.
🎬 Demonstrations of GPT 4o's Real-Time Processing
The fourth paragraph describes various demonstrations of GPT 4o's capabilities, including real-time audio, video, and text processing. It highlights the model's ability to recognize objects in real-time without the need for photography, as was previously the case. The paragraph also emphasizes the model's coherence in character and story development, as well as its impressive response speed and natural language processing, which make it seem incredibly realistic and useful for everyday tasks.
🎼 GPT 4o's Creativity and Performance
The fifth paragraph showcases GPT 4o's creative and performative abilities. It discusses how GPT 4o can improvise songs, adjust its voice's speed and tone, and even whisper, demonstrating a high level of interpretative skill. The paragraph also mentions the model's ability to generate images and maintain character consistency across different situations, which is a significant challenge for AI. The speaker expresses excitement about the potential of these features and the quality of interaction they enable.
📽 GPT 4o's Video Summarization and 3D Object Creation
The sixth and final paragraph discusses GPT 4o's ability to summarize videos and create 3D objects. It mentions the potential for users to upload videos for summarization, which could be particularly useful for business meetings or other recorded events. The paragraph also highlights GPT 4o's ability to create 3D objects and logos from textual descriptions, as well as its impressive rendering of text. The speaker concludes by encouraging viewers to subscribe to the channel and check out a tutorial on GPT 4o's memory feature.
Mindmap
Keywords
💡GPT 4o
💡Desktop App
💡Real-Time Translation
💡Multimodal
💡Latency
💡Free Access
💡Live Demo
💡Omni
💡User Interface
💡Screen Sharing
💡Memory Feature
Highlights
The highly anticipated Open AI conference took place, featuring a major new announcement.
A new model called GPT 4o was introduced, which is extremely interesting and powerful.
GPT 4o is a multimodal, omnidirectional model that can natively process text, vision, and audio.
GPT 4o can respond to audio inputs in just 232 milliseconds, similar to human response times.
A new desktop app for GPT was announced, allowing use on PC in addition to web and smartphone apps.
The desktop app features a completely revamped interface with lower latency and more immediate interaction.
GPT 4o will be available to all users, including free users, marking a significant change from previous models.
Paid Plus users will have access to more messages compared to free users, but all can use the new model.
Live demos showcased GPT 4o's capabilities, including real-time translation and solving equations on paper.
The model can now natively use voice, text, video, and audio simultaneously in fast, fluid interactions.
GPT 4o's voice is more human-like and realistic in tone, nuances, and speed compared to previous versions.
The model demonstrated impressive real-time translation capabilities, significantly reducing latency.
GPT 4o can recognize objects in real-time without needing to take a photo, thanks to its native multimodal capabilities.
The model can generate coherent visuals and characters, overcoming a major challenge for generative AI.
GPT 4o can create 3D objects and logos from textual descriptions, pushing the boundaries of what was previously possible.
The model can summarize videos when provided with them, opening up new possibilities for analyzing visual content.
Overall, GPT 4o represents a major leap in quality and capabilities for AI models, with many exciting real-world applications.
Transcripts
Finalmente c'è stata la tanto attesa
conferenza di Open Ey dove dovevano fare
un nuovo clamoroso annuncio Questo è il
video nel quale vi faccio il riassunto
di quello che è stato annunciato Eh la
conferenza St è stata estremamente
interessante hanno fatto vedere il nuovo
modello Non so perché non l'abbiano
chiamato GPT 5 perché secondo me poteva
essere benissimo GPT 5 ma immagino che
per una questione di PR non l'abbiano
voluto fare si chiama 4o e tra un attimo
vediamo pure per cosa sta quella quella
o fondamentalmente sono stati fatti tre
annunci in questa conferenza ed è quello
di cui parleremo in questo video il
primo annuncio è il fatto che adesso C'è
un'app desktop per C GPT quindi lo
possiamo utilizzare dal web logando sul
sito possiamo utilizzarlo dall'app per
il nostro smartphone e adesso anche da
un'app desktop quindi per il per il PC
Questo apre tutta una serie di nuovi
scenari è molto più veloce c'è
un'interfaccia completamente rivista eh
utilizza il microfono la webcam la
latenza è più bassa quindi è molto più
l'interazione è molto più immediata si
può condividere lo schermo eccetera
eccetera nella demo adesso vedremo
alcune cose che sono veramente clamorose
secondo me il secondo annuncio
interessante è il fatto Era l'annuncio
principale il fatto che ci fosse il
nuovo modello che si chiama 4o eh E
secondo me questo modello è veramente
veramente veramente interessante Io sono
dispiaciuto che non l'abbiamo chiamato
cinque perché cinque avrebbe fatto
clamore e invece secondo me questa cosa
è clamorosa perché le cose che hanno
fatto vedere nella demo sono veramente
fuori di testa e e le demo le hanno
fatta live quindi non c'è il rischio che
abbiano velocizzato i video fatto
qualche taglio qualche Pezzotto qua là
come come siamo abituati a vedere
ultimamente e la terza news qual è È che
questo nuovo modello il 4o sarà
disponibile a tutti quanti anche agli
utenti gratuiti wù Questa è una novità
incredibile perché significa che non
bisogna avere un abbonamento a pagamento
per accedere a tutte queste nuove
funzionalità la differenza sarà solo nel
numero di messaggi no Quindi gli utenti
che usano il plus avranno più messaggi
rispetto agli utenti che hanno
l'abbonamento gratuito e poi quelli che
hanno la versione gratuita possono usare
la versione 4o che quindi dentro c'è il
caricamento dei file l'utilizzo dei GPT
Eh la memoria nuova funzionalità che ho
fatto vedere qualche giorno fa e così
via veramente una cosa super
interessante per tutti quelli che magari
non possono permetterselo non vogliono
farsi un abbonamento a a GPT nella
versione Plus Quindi adesso questo che
vi faccio vedere a schermo è il video
della conferenza non vi preoccupate non
ce lo vediamo tutto perché questa non è
una Reaction ma vi lascio tutti i link
qua sotto Come sempre vi consiglio di
andarvi a vedere le fonti originali
tutto quello che di cui parlo qua sopra
Allora dura una mezz'oretta eh Tra
l'altro non è molto lunga questa qua è
la slide fondamentalmente dove hanno
fatto vedere il diciamo il riassunto no
Quindi i tre grandi annunci erano questi
la nuova app desktop con la nuova
interfaccia l'interfaccia più veloce più
fluida più immediata e così via GPT 4o
di cui dopo ci leggiamo anche l'annuncio
perché ci sono delle cose veramente
veramente interessanti secondo me vi
faccio vedere il il la o per cosa sta la
o sta per Omni e tra un altro vediamo
pure Cosa significa Omni E poi il fatto
che può essere eh possono avere tutti
quanti l'accesso e c'è questa bellissima
live demo nella quale fanno vedere
alcuni casi d'uso che secondo me sono
veramente veramente
allora Vediamo se becchiamo il momento
do lei Racconta cosa sta
Pert
G on his capabilities across text Vision
and audio Allora questa è la grande
novità di GPT 4o è un po' un tecnicismo
quindi per qualcuno potrebbe sembrare
una notizia poco Wow Ma è fondamentale
perché adesso è un modello diciamo
multimodale omnimodo come lo chiamano
loro in questo caso in maniera nativa Eh
che era se vi ricordate che era la
grande differenza Per esempio di quando
è stato annunciato jamini no rispetto a
cgpt Eh quindi il fatto che cgpt avesse
il testo e poi avesse il video e poi
avesse l'audio ma erano dei modelli
separati e questi modelli veniva ogni
volta fatta la transizione No la
traduzione tra uno e l'altro Quindi io
gli dico una cosa a voce questa voce
viene elaborata trasformata in testo gli
viene invitata la richiesta testuale poi
questa richiesta testuale viene
elaborata eccetera eccetera era quello
che lo rendeva ovviamente diciamo lento
no nel nel fare questa questa cosa
invece adesso lo fa nativamente e questa
è una cosa secondo me estremamente
estremamente importante perché impatta
tantissimo sulla qualità dell'output e
sulla velocità di esecuzione vanno a
ridurre ad abbassare totalmente quella
latenza che c'era tra diciamo un
messaggio e l'altro e questa è la cosa
importante di del del del modello
4o che sta per Omni Perché Perché in
maniera nativa riesce a fare questa
questa diciamo l'utilizzo di queste di
queste varie modalità infatti Loro Qua
dicono
ehm in precedenza eh ta ta ta ta può
rispondere a degli input audio in un
tempo che è di 232 millisecondi con una
media di 320 misei che è simile alla
risposta umana in una conversazione e
questo è fondamentale per renderlo
quanto più realistico utilizzabile
comodo nell'utilizzo quotidiano che noi
facciamo in Quest'altro link poi non vi
preoccupate tutti i link ve li lascio ve
li lascio qua sotto eh Questa è è
l'annuncio proprio dove fanno vedere
diciamo la versione 4o e qua dicono
tutte le cose che potranno avere le
persone che non hanno un abbonamento Ma
che usano la versione free quindi
diciamo avranno GPT 4 nella versione
gratuita potranno analizzare dati quindi
caricare i file eccetera eccetera
caricare le foto eh potranno utilizzare
i GPT potranno avere la memoria e così
via quindi tutte le cose che normalmente
Diciamo erano accessibili solo nella
versione eh a pagamento adesso sono
accessibili a tutti quanti e secondo me
questa è una cosa estremamente
estremamente Allora qua cos'altro
vi volevo far vedere vi volevo far
vedere andiamo subito nella demo ci sono
un paio di pezzi che qua voglio farvi
vedere poi vediamo in realtà il resto lo
vediamo dal sito uno è quello dove fanno
l'equazione con carta e penna eh E vi
chiedo di mettere particolare attenzione
alla voce perché secondo me questa è la
novità più interessante che rischia di
passare inosservata da questa da questo
nuovo modello da questo annuncio che è
stato fatto perché la voce è molto più
umana molto più realistica nel tono di
voce nelle sfumature del linguaggio nel
tono nella velocità e così via riesci a
fare veramente delle cose che sembra di
stare nel film Air questo secondo me è
il miglior modo che avevo per descriver
per riassumerlo allora lui prende carta
e penna no col pennarello qua inizia a
scrivere Vediamo che succede
sot interessante qua ve lo voglio
sottolineare non sta facendo una foto
perché fino ad ora questa cosa
riuscivamo a farlo e quando è arrivata
Vision Questa è stata una figata No
classica situazione inquadro il
frigorifero faccio la foto e poi gli
chiedo Cosa c'è nel frigo che mi posso
cucinare No l'ho fatto pure io qua sopra
questa
demo Qua invece sta succedendo in real
time Quindi lui inquadra la camera non
scatta una foto ma muove il telefono e
parla Ecco qual è la differenza di
averlo nativo posso utilizzare voce
testo video e audio anche in risposta
Tutto
contemporaneamente in questa modalità
veloce che stiamo vedendo qua
Ah vedete anche il fatto che interrompe
C GPT mentre sta parlando no questa cosa
prima non si poteva fare Ci dovevano
essere i turni Invece adesso ti puoi
infilare nella conversazione cgpt si
ferma no e ti risponde e adesso qua gli
dice Guidami nella soluzione di questa
equazione ovviamente l'equazione è
semplicissima però è bello vedere No
questa funzionalità in azione
capite come lo sta utilizzando e come
avviene un salto di
qualità quando ne finiamo a fare un
utilizzo quotidiano No un utilizzo
quotidiano nel quale abbiamo bisogno di
Questa interazione di questa
immediatezza di questa velocità Cioè per
me già era fuori di testa il fatto che
St inverno ho fatto una foto al
termosifone che aveva un problema e c
GPT me l'ha risolto senza aver dovuto
chiamare il tecnico dei termosifoni Ma
adesso diventa Lo alzo tengo aperto la
camera e ci parlo mentre inquadro le
situazioni no che si tratti di una
statua in una città che non conosco che
si tratti di un formaggio nel
frigorifero o che si tratti di
un'equazione su un foglio di
carta ok
e notate la velocità di risposta di
botta e risposta Comè cambiata e dopo
vediamo un'altra demo con la quale mi
toglierò un piccolo sassolino dalla
scalpa con alcuni commenti che mi sono
arrivati qualche giorno
fa Oh comunque parentesi a me durante
queste demo fanno sempre morire i volti
delle persone a fianco no di di di di
come guardano la persona che sta facendo
la demo e secondo me Sono un pelino
terrorizzati che qualcosa vada storto
sarà facile da risolvere
però
per la cosa veramente incredibile è
proprio questo utilizzo di assistente
nella vita reale che diventa sempre più
realistico no avevamo tutti i pezzettini
Eh e forse questi pezzettini ci sono ci
sono da un po' di tempo come diciamo
iniziamo a sospettare un po' tutti
quanti adesso li stiamo mettendo insieme
e la qualità è sempre migliore no Arriva
l'audio e uno inizia a dire Ah sta
cosa adesso lo uso come avrebbe
Ehm come avrei utilizzato Alexa o o
Google Home No questi o siries questi
assistenti semmi ehm fossero stati
veramente degli assistenti la grande
promessa fallita degli assistenti vocali
Eh poi arriva il video La il Visual
quindi la possibilità di vedere le foto
e quello fa un altro salto di qualità
adesso questa roba messa insieme con
questa velocità e con questa
integrazione nativa è veramente il salto
di qualità che aspettavamo Adesso vi
faccio vedere invece un'altra demo e poi
passiamo al sito perché dal sito ci
andiamo a leggere un po' di cose a
vedere un po' di cose interessanti
Allora Una demo interessante è questa
qua allora dove lei dice ci sono
arrivate Un po' di proposte
dall'audi su cosa far vedere in demo di
questo nuovo modello 4o vediamo quale
viene pescata come idea requ for Like
Us Ok Bot gascar wants to know if gpd 4o
is capable of Real Time
translation m you Wan To Try this One
Real Time translation
qua è il video che ho fatto sul canale
qualche giorno fa dove ho fatto vedere
come ho trasformato il mio smartphone in
un traduttore in tempo reale utilizzando
un prompt fatto bene per cgpt i commenti
sotto quel video sono spaccati 50% detto
che figata grande idea Grazie di
avercela condivisa 50% ha detto m sta
cosa è inutile è troppo lento Ci mette
troppo
tempo Vediamo cosa succede adesso con
questo nuovo
modello italiano faranno esattamente la
mia stessa demo italiano inglese il
prompt che dà lui è esattamente il mio
prompt
I like you Fun as a translat i a friend
here only Speaks italian and I only
speak english and time you hear english
i you transl to italian and if you
italian i transl back english that good
perfetto Questo è proprio il mio esempio
il mio caso no E capisco che qualcuno
diceva eh Raf ma è troppo lento Quindi
se questa cosa è troppo lenta è inutile
secondo me non era inutile ma la cosa
che vi dico sempre è un po' di visione
ragioniamo nel lungo periodo no che leai
ormai ci ha insegnato che se una cosa
Oggi non funziona o
funzionicchia basta aspettare un po' e
un po' non è 15 anni e migliorerà E
infatti 6 giorni dopo manco 6 giorni
dopo lo stesso mio esempio con il
problema della latenza
risolto Ma io mi chiedo se le balene
potessero parlare cosa ci direbbero
potrebbero chiederci come risolviamo le
equazioni
lineari Sicuramente
sì Vabè mi fermo qua con questa con
questa diciamo questo demo sulla voce il
traduttore in tempo
adesso è fattibile L'unico problema tra
virgolette o comunque diciamo aspetto
migliorabile era quello della latenza
come abbiamo visto adesso la latenza è
stata praticamente azzerata No prima si
parla di una latenza che era di circa 3
secondi se non sbaglio 3 secondi e mezzo
doveva essere questa più o meno la la
diciamo la latenza che c'era nel
precedente versione di cgpt adesso
parliamo di 300 msei molto simile a un
botta e risposta umano come è stata
vista in questa demo e secondo me questa
farà tutta la differenza del mondo eh Vi
metto questo link in descrizione vi
metto anche quest in descrizione non
abbiamo finito e adesso voglio farvi
vedere un po' di casi d'uso reali che ha
messo openi che sono fuori di testa
quindi continuate a guardare il video se
siete arrivati fino a qua Questo è il
modo elento nel quale Però potete
lasciare un bel like visto che Oh avete
già visto 15 minuti di video significa
che vi è piaciuto se siete ancora qua
quindi mettete un bel like per tutta la
qualità di roba che vi porto qui sopra e
anche per portarvi subito delle cose
interessanti no conferenza e subito
arriva il mio video e non le due
cazzatine dei comunicati stampa che si
trovano sui blog Allora questa è la
pagina proprio di GPT
4o quindi in Real Time adesso audio
video and text in real time clamorosa
come cosa qua sopra vabbè questo c'è il
video dell'annuncio Qua ci sono un po'
di
ve ne voglio far vedere alcune perché
secondo me sono interessanti Ce ne sono
un paio che sono interessanti Vabbè
questa per fare vedere proprio la
capacità che ha diciamo di vedere audio
e video questi adesso questi due si
mettono a giocare a carta forbici
Sasso al
lei gli ha chiesto ci ci fai no ci
Introduci come se fosse un telecronista
sportiva Avete visto come è cambiata la
voce l'intonazione questa roba qua è
quello che Secondo me è veramente Wow e
la rende super
realistica Oh demo senza tagli senza
montaggio senza cose strane Guardate la
velocità con la quale ha riconosciuto
che erano due forbici gli ha detto
questo è un pareggio
Vabbè qua secondo me è incredibile vi
faccio vedere sull'uso della parola qua
che gli chiede di essere sarcastico
[Musica]
Cioè questo è spettacolare ha simulato
il sarcasmo in una maniera incredibile
se non è R questa roba Ditemi voi Che
cos'è beh qua fa vedere come lo aiuta
Nei
compiti vè Questa è la la stessa demo
esattamente di prima No no questa è
quella con con lo spagnolo fa vedere che
inquadra le e parla in spagnolo questa
Secondo me è carina per
[Musica]
vedere bellissimo pure questo veramente
bellissimo Qua ci
sono Allora qua c'è qu là
metto da
capo cioè state capendo la parte di due
GPT GPT in parallelo Guarda adesso che
gli fa fare
FR San
Frisco adesso gli detto di improvvisare
una canzone e di mettersi anche no
sovrapporre le voci
[Musica]
qua gli ha fatto cambiare anche velocità
gli ha detto pure vai più veloce e dimo
velocemente vè qua fa vedere come le hai
la fa partecipare ad una Diciamo ad una
ad una video Call Questo è quello che vi
dicevo prima lo stesso esempio di prima
qua gli fa inventare una ninna nanna
questo molto breve molto carino pure
questo anche questo molto potente
Could you sing meab about Majestic
Potatoes a lalab about Majestic Potatoes
Now That's what I call a mashup Uh Let's
Do It Oh Majestic potato in the moon
Okay That's Pretty Nice but I think
lalab Should Be more Whisper Should Be a
little softer Can Can you do a little
softer absolutely Let's make it soft and
Gentle Oh Majestic Potato
E beh Qua sembra diventata una cosa
horror quando gli chiede di sussurrar
però per farvi capire la capacità
interpretativa che adesso Vabbè qua gli
fa cantare Tanti auguri qua la velocità
proprio gli chiede di parlare più lento
più veloce GPT you from for
Please Hey
actually ok
Secondo me stiamo raggiungendo un
livello di di qualità di interazione
veramente veramente clamorosa Vabbè poi
c'hai Dead jokes perché come fissato
delle battute squalid delle freddure
questa molto bella dove viene utilizzata
Eh al posto degli occhi per interpretare
le situazioni Tra l'altro ambientata a
Londra quest non ve li faccio vedere
tutti perché alcuni sono lunghi eh
questo eh Invece per gestire una
situazione con il customer care quindi
parlare al posto di una persona con il
customer care veramente veramente figo e
qua sotto adesso ci sono delle cose che
riguardano la generazione immagini che
secondo me è è è fuori di testa Cioè
quando ho fatto vedere il tutorial di
idog Avo detto ideogram al momento con i
testi è il migliore pare che anche C GPT
adesso riesca a fare delle cose assurde
con i testi veramente assurde ve lo
faccio vedere tra un attimo Questo è il
momento però nel quale potete iscrivervi
al canale perché ve lo dico spesso il
60% di voi si guarda i video senza
essere iscritti al canale Quindi se stai
guardando sto video significa la roba
che ti porto qua sopra ti piace questo è
il momento nel quale potresti cliccare
quel pulsantino Per fare l'iscrizione Ah
ecco la cosa che vi dicevo prima Ecco sì
mi ricordavo era intorno ai 3 secondi
quindi la latenza prima era di 3 secondi
circa su GPT 3.5 addirittura sopr erore
di 5 secondi con GPT 4 Adesso invece è
diventato veramente impressionante
allora guardate qua qua gli chiede di
creare un visuale No dal punto di vista
di un robot che sta scrivendo su una
macchina da scrivere e su questa
macchina da scrivere ci sono questi
testi e guardate qua come il testo è
scritto in maniera perfetta qua Vabbè fa
fare altri passaggi sul testo qua gli
dice la stessa immagine ma con il robot
che strappa il foglio e nel foglio
strappato si leggono ancora i testi pure
questo impressionante veramente
veramente impressionante Qua siamo ai
livelli di ideogram se non forse
addirittura superiore qua la coerenza
dei personaggi che è un altro grande
tema no Quindi con lo stesso personaggio
sta costruendo proprio un una sorta di
di fumetto di di di di storia La
coerenza visiva dei personaggi sappiamo
che è il grande problema delle ai
generative Qual è un altro interessante
che volevo farvi vedere anche qui Vabbè
coerenza del personaggio che fa varie
azioni in varie situazioni II anche
questo secondo me ci dobbiamo aspettare
grandi cose non vedo l'ora di poterlo
provare appena esce Ovviamente poi vi
faccio vedere la demo no che qua stiamo
sempre leggendo dagli annunci poi come
sappiamo quando ci mettiamo a provarli
succedono sempre cose diverse Questo è
bellissimo Fa vedere Fa inventare questo
diciamo questo eh come dire come lo
chiama Coin commemorativo No questa
sorta di moneta commemorativa per
l'annuncio di GPT 4o anche qui
impression come come qualità text font
pure questo molto figo quindi gli chiede
di inventarsi un font con una certa
descrizione e gli crea il Font qua la
creazione di oggetti 3D
eh con le i singoli frame no con i sei
frame che ha creato questo il piazzare
un logo sopra qualcosa quindi gli dà
questo come input gli dà questo come
input e poi gli chiede di metterli
insieme cioè pure sta roba qua era
impensabile fino fino a poco fa eh ta ta
ta ta ta e poi qual era questo qua pure
molto carino un robot che sta scrivendo
dei messaggi anche qua vediamo un
rendering del testo che rasenta la la
perfezione poi qua sotto ci sono un po'
di come dire un po' di Benchmark Ma sta
parte Qua sui Benchmark non non ve la
leggo proprio perché secondo me lasciano
il tempo che trovano queste sono le cose
interessanti e se queste cose poi
funzionano veramente come le annunciano
loro Allora sono veramente veramente
Questo è molto bello perché qua
gli carica un video e di questo video si
fa fare il riassunto qua non ho capito
se significa che noi potremmo caricare i
video lo lascio come un punto
interrogativo di nuovo quando esce che
lo posso utilizzare la prima cosa che
farò è una demo eh dal vivo e vi faccio
un video su questa roba qua perché fino
ad ora possiamo farlo dei video YouTube
no passando da dei GPT Quindi io quando
mi trovo a dover fare delle cose eh so
che gli passo il video YouTube anche se
sono due ore di farmi il riassunto Fammi
l'elenco puntato estrai i concetti più
importanti se invece potremmo caricare
dei nostri video la cosa diventa
veramente veramente interessante possono
essere registrazioni di una di un
meeting che abbiamo fatto in azienda
eh veramente qualsiasi cosa no che
possiamo sul quale possiamo lavorare
bello bello bello bello anche qui Vi
consiglio vi lascio il link Guardate che
giochi riesce a fare sta roba è la roba
che abbiamo visto con eh con ideogram
e Secondo me se ci abbiamo dentro C GPT
gli fa fare ancora una volta il salto di
qualità e porta l'asticella ancora una
volta a un livello Altissimo che era
quello poi che ci aspettavamo da questo
annuncio di Open ey vi ripeto per me è
strano che non è stato chiamato eh C GPT
5 GPT 5 perché secondo me se lo meritava
per tutta le unità però capisco quello
che stanno faccendo Come si stanno
muovendo in termini di VR le paure che
hanno e di cui abbiamo parlato molto
spesso qui sopra su questo canale se vi
interessano le cose che vi porto Questo
è il momento nel quale potete potete
fare una bella donazione per questo
video cliccate il pulsantino grazie
potete lasciare anche €1 Decidete voi la
cifra mi offrite un caffè e il vostro
modo di ringraziarmi oppure se volete
fate l'abbonamento che è una donazione
ricorrente tutti i mesi per dirmi
proprio Raffaè Te voglio bene assai Sei
il numero uno Grazie per le cose che mi
porti qui sopra magari non tutte queste
cose eh però capisco qual è il
significato di un vostro abbonamento Se
decidete di farlo io ringrazio dei
vostri ringraziamenti e poi come sempre
se abbiamo parlato tantissimo qui sopra
D le cose che si possono fare con cgpt
delle novità di quello che adesso
riceveranno gratuitamente anche le
persone che non hanno un abbonamento a
pagamento tra queste cose C'è anche la
la la funzionalità memoria e se non
l'avete vista in azione la funzionà
memoria è una figata pazzesca ci ho
fatto un tutorial da pochissimo cliccate
il video che vi metto adesso a schermo
Andate a vedere che cos'è la funzionà a
memoria e come la Potete utilizzare
anche voi Vai cliccate il video che
adesso compare
Voir Plus de Vidéos Connexes
Всё о новой нейросети GPT-4o за 7 минут!
OpenAI presenta ChatGPT-4 OMNI (GPT-4o): GPT ORA SEMBRA AVERE EMOZIONI!
GPT-4o is WAY More Powerful than Open AI is Telling us...
Why OpenAI's Announcement Was A Bigger Deal Than People Think
O film gerçek oluyor: Yeni GPT-4o yapay zeka modelinin sesine inanamayacaksınız!
BATALHA de INTELIGÊNCIA ARTIFICIAL! - Gemini | ChatGPT-4o
5.0 / 5 (0 votes)