OpenAI o1 | GPT-5 | Finalmente ๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐
Summary
TLDRThe video discusses the recent advancements in AI, focusing on the hype around OpenAI's new model, humorously referred to as 'morango' by the creator. The host, Lucas, shares his first impressions after using the model, which has been rebranded from GPT-4 to GPT-3.5 Turbo. He explores the model's capabilities, particularly in programming tasks, and speculates on its potential to revolutionize the industry. The video also touches on the broader implications for programmers' jobs and the future of AI applications, suggesting a shift towards AI-driven services and products.
Takeaways
- ๐ The script discusses the evolution of AI models, particularly focusing on the hype around the new OpenAI model referred to as 'morango'.
- ๐ฏ The term 'morango' was used to describe the excitement and anticipation around the new AI model's capabilities.
- ๐ There was speculation about the new model's potential, including rumors involving Sam Altman and concerns that led to a delay in the release of the GPT-4 model.
- ๐ The speaker shares their experience using the new OpenAI model, expressing their positive impressions after testing it out.
- ๐ค Concerns are raised about AI potentially replacing human jobs, especially in programming, reflecting a common anxiety in the tech community.
- ๐ง The script touches on the concept of 'Chain of Thoughts' and how the new AI model is capable of complex reasoning, similar to human thought processes.
- ๐ก An example is given where the AI model is asked to create a project with specific requirements, showcasing its ability to understand and execute complex tasks.
- ๐ The script highlights the performance of the new model in various tests, indicating significant improvements over previous models like GPT-4.
- ๐ The speaker discusses the practical application of the AI model in creating a real-time audio response system for a live chat, demonstrating its utility.
- ๐ฎ The future of AI is pondered, with the speaker predicting a surge in AI-based applications and services, potentially leading to a new era of software development.
Q & A
What is the significance of the term 'morango' in the context of the script?
-In the script, 'morango' (Portuguese for 'strawberry') is used metaphorically to refer to the new model released by OpenAI, which has generated significant hype and excitement in the AI community.
Why did the speaker use 'morango' in the title, and what is its relation to the AI model discussed?
-The speaker used 'morango' in the title to create intrigue and to reference the new AI model that was highly anticipated, which was informally named 'morango' due to the hype surrounding it before its official release.
What was the main speculation about Sam Altman's involvement with the 'morango' model?
-There was speculation that Sam Altman, the CEO of OpenAI, was working on a new model, which led to the creation of the 'morango' hype. It was rumored that he was refining this model to improve its reasoning capabilities.
What was the actual change when moving from GPT-3 to GPT-4 in terms of naming and expectations?
-The transition from GPT-3 to GPT-4 was not just a numerical increment but a renaming strategy by the company to reset expectations and create a new hype, moving away from numerical comparisons to focus on the new features and capabilities of the model.
How did the speaker use the new OpenAI model to create a live chat response system?
-The speaker utilized the new OpenAI model to develop a system that consumes data from a websocket, displaying questions and answers in real-time during a live stream, with the AI responding to chat messages and synthesizing audio responses.
What was the speaker's concern regarding the advancement of AI in programming and its potential impact on jobs?
-The speaker expressed a shared concern about the possibility of AI advancements, particularly in programming, potentially leading to job loss or a shift in the role of programmers to become 'prompt engineers'.
What was the outcome when the speaker asked the AI to create a React project without using frameworks?
-The AI successfully provided a detailed guide to create a React project with Twind CSS and without using frameworks, demonstrating its ability to understand and execute complex coding tasks.
How does the speaker describe the AI's capability to reason and its potential impact on problem-solving?
-The speaker describes the AI's capability to reason as a significant leap, suggesting that it can break down complex problems into simpler steps, learn from its mistakes, and refine its strategies, which could drastically improve its problem-solving abilities.
What was the performance comparison between GPT-4 and the new OpenAI model in terms of coding tasks?
-In coding tasks, the new OpenAI model showed a significant improvement over GPT-4, with performance metrics that were 'ridiculously larger,' indicating a substantial leap in its ability to generate code.
What was the speaker's view on the future of AI applications and their integration into various services?
-The speaker believes that there will be a surge in the creation of new websites and applications involving AI, with AI serving as the backend for various services, potentially leading to a new wave of subscription-based or one-time payment services.
Outlines
๐ค Introduction to GPT-4 and Its Impact
The speaker begins by discussing the hype around the new GPT-4 model from OpenAI, which was recently launched. They mention the nickname 'morango' (Portuguese for 'strawberry') used to refer to the model, highlighting the anticipation and excitement in the AI community. The speaker also addresses rumors about Sam Altman, OpenAI's co-founder, and the company's internal dynamics. They express their own experience with the new model, noting its impressive capabilities and the potential impact on programming jobs. The speaker also touches on the broader implications of AI development, including the creation of a 'Tony' project that uses AI to respond to live chat questions in real-time.
๐ ๏ธ Building a React Project with GPT-4
In this section, the speaker describes their experience using GPT-4 to create a React project. They outline the process of building the project manually without frameworks, focusing on using React with Tailwind CSS. The speaker provides a detailed account of the steps taken by GPT-4 to understand the project requirements, including setting up the project environment, handling WebSocket connections for real-time messaging, and generating audio playback. They also discuss the AI's ability to reason and adapt its responses, suggesting that GPT-4 is capable of complex problem-solving and decision-making that could rival human experts in certain fields.
๐ GPT-4's Performance and AI's Future in Coding
The speaker delves into the performance metrics of GPT-4, comparing it to its predecessor and highlighting its superior capabilities in coding tasks. They discuss the AI's ability to generate code, solve complex problems, and its potential to revolutionize the field of software development. The speaker also speculates on the future of AI in coding competitions and the possibility of AI systems outperforming human experts. They mention the 'Chain of Thoughts' capability of GPT-4, which allows it to approach problem-solving in a manner similar to human thinking, breaking down complex tasks into simpler steps and refining its strategies through learning and reinforcement.
๐ง GPT-4's Advanced Reasoning and Problem-Solving
This paragraph focuses on GPT-4's advanced reasoning skills, particularly in the context of coding challenges. The speaker provides an example of a matrix transposition task, illustrating how GPT-4 can understand and generate the correct code to solve the problem. They emphasize the AI's ability to handle complex reasoning and its potential to replace or augment human programmers in the future. The speaker also discusses the limitations of previous AI models and how GPT-4's improvements in reasoning and learning algorithms set it apart, suggesting a new paradigm in AI capabilities.
๐ The Future of AI Applications and Development
In the final paragraph, the speaker speculates on the future of AI applications, predicting a surge in the development of AI-powered websites and applications. They discuss the potential for AI to serve as a backend for various products, offering services or value that users might be willing to pay for. The speaker also mentions their collaboration with OpenAI to enhance the reasoning capabilities of GPT-4 and the potential for AI to take on more complex tasks autonomously. They conclude by highlighting the ongoing hype around AI and the uncertainty of where this technology will lead, suggesting that AI's ability to perform complex reasoning could be a game-changer for various industries.
Mindmap
Keywords
๐กGPT
๐กOpenAI
๐กHype
๐กCode Generation
๐กMachine Learning
๐กInference
๐กProgramming
๐กWebSocket
๐กReact
๐กNext.js
๐กAI Agents
Highlights
Introduction of the new OpenAI model, referred to as 'morango', which has generated significant hype and expectations within the AI community.
Discussion on the rebranding from GPT-3 to GPT-4 to the new model, suggesting a shift in focus from numerical progression to new capabilities.
Mention of speculations about Sam Altman working on a 'morango' model, indicating a potential significant leap in AI reasoning capabilities.
A detailed account of the author's experience using the new OpenAI model, including its ability to generate code and understand complex instructions.
The author's exploration of the new model's performance in a live chat application, showcasing its real-time response capabilities.
Concerns raised about the potential for AI to replace human programmers, reflecting on the implications of the new model's capabilities.
Analysis of the model's ability to understand context and generate responses, highlighting its advanced natural language processing.
A demonstration of the model's coding capabilities, where it successfully creates a client-side application based on provided specifications.
The author's request for the model to create a React project without frameworks, showcasing the model's flexibility in following instructions.
Explanation of the model's reasoning process, comparing it to human thought patterns and problem-solving strategies.
Discussion on the model's ability to self-correct and learn from its mistakes, improving its reasoning over time.
A comparison of the new model's performance to the GPT-4 in cybersecurity and CTFs, indicating a significant improvement.
The model's success in answering complex scientific questions, outperforming human experts in certain scenarios.
The model's approach to handling simple versus complex questions, demonstrating its ability to discern the level of detail required.
A specific example of the model's coding capabilities, where it correctly transposes a matrix as per user request.
Reflections on the new paradigm of AI and its potential to revolutionize various industries through advanced reasoning and problem-solving.
The author's prediction of a surge in AI-based applications and services, driven by the capabilities of the new model.
Final thoughts on the potential of the new model to redefine AI's role in programming and its impact on the job market.
Transcripts
te liga na evoluรงรฃo dele no Cold forces
cara na na na competiรงรฃo de de gerar
cรณdigo nรฉ ah GPT 4 o olha o quรฃo o quรฃo
mais alto foi o ow One cara a espera
pelo morango finalmente acabou e muitos
de Vocรชs perguntaram para mim Lucas por
que que tu tรก usando morango no tรญtulo
morango na tamb e nรฃo sei se tu percebeu
O o padrรฃo Mas eu sempre usava morango
quando eu ia falar de algum Hype qual
que รฉ esse Hype รฉ o Hype que foi criado
em volta do novo modelo da Open eii o
novo modelo Acaba de ser lanรงado ele foi
lanรงado ontem de noite e a Open Ei me
liberou hoje pela madrugada entรฃo eu jรก
tรด conseguindo utilizar o novo modelo
deles que seria aqui o famoso morango nรฉ
que muita gente estava falando entรฃo se
especulava que o o Sam altman tava aรญ
trabalhando na horta de morango dele e
ele pensou nesse modelo aรญ que poderia
raciocinar mais em cima da tua Pergunta
antes de te dar uma resposta eu gravei
um vรญdeo sobre isso se tu nรฃo viu o
vรญdeo eu vou colocar aqui na descriรงรฃo
mas esse era o Hype eram boatos esse
boato envolvia muito tambรฉm aquela treta
que aconteceu na Open Ei alguns meses
atrรกs onde o Sam alom ele foi meio que
expulso da empresa pelo board muito por
conta do que o Willi teria visto e
finalmente entรฃo a gente botou a mรฃo no
que o Willi supostamente viu lรก dentro
da Open ai e que levantou digamos assim
preocupaรงรตes a Open ai entรฃo nรฃo lanรงou
o GPT s nรฉ a gente a gente vinha sempre
imaginando Nossa imagina Lucas como que
vai ser daqui alguns anos porque a gente
tem o gpt3 que jรก era muito bom aรญ veio
o GPT 4 um crescimento absurdo imagina
como que vai ser quando vier o GPT 5 nรฉ
e bom eu desculpa eu na verdade quebrar
um pouco a tua expectativa mas a gente
foi do GPT 3 pro GPT 4 pro o 1 entรฃo
eles basicamente renomearam Normalmente
quando uma empresa renomeia assim o nome
de um produto รฉ que ela quer de novo
gerar uma nova expectativa nรฉ ela quer
que tu pare de comparar numericamente o
crescimento a evoluรงรฃo e passe a esperar
pelo novo Hype vamos dar uma lida Hoje
no Que que รฉ o open aio o1 eu usei Hoje
eu fiquei digamos durante a madrugada
aqui รณ a gente acorda bem cedo aqui em
casa 5:30 eu tava de pรฉ aรญ eu saio dou
um passeio com a Chloe aรญ depois a gente
vai pra academia eu fiquei com a clu em
casa a Sara foi pra academia e nesse
perรญodo eu fiquei programando cara
usando o novo modelo da openi fresco
para vocรชs tudo que ele รฉ capaz de fazer
e eu fiquei bem impressionado e se tu
agora vai me perguntar Lucas tรก mas a ia
vai roubar o nosso emprego como
programador eu entendo a tua preocupaรงรฃo
e eu posso dizer que eu atรฉ compartilho
da tua preocupaรงรฃo entรฃo eu nรฃo tenho
uma resposta para ti e eu sei que tu
deve ter ouvisto tambรฉm de outros
influenciadores eu atรฉ preciso trazer
aqui no caso ah vรกrias frases e e e
explicaรงรตes que a gente ouviu no nos
รบltimos meses ah de pessoas dizendo que
nรฃo cara tipo o crescimento nรฃo รฉ
exponencial do do do dos modelos outras
pessoas falando sim tu vai perder o teu
emprego ou tu vai virar um mero
programador de prompt e eu posso te
dizer provavelmente todos eles estรฃo
errados provavelmente a gente vai chegar
no meio-termo e ninguรฉm sabe qual que
vai ser esse meio-termo a gente tambรฉm
imagina que o modelo nรฉ entรฃo a gente
tem um modelo aqui que รฉ o o gpt3 a
gente teve um modelo maior que era o GPT
4 e aรญ agora a gente vai ter um muito
maior e รฉ o tamanho do modelo ou a
probabilidade a a capacidade dele de
entender a prรณxima palavra รฉ que torna
ele inteligente e รบtil E pelo que eu tรด
vendo jรก utilizando o o morango aqui nรฃo
รฉ bem isso deixa eu te dar um exemplo
deixa eu abrir aqui e depois a gente vai
ler Ah o artigo oficial da da Open ai
mas eu quero te te mostrar como que
basicamente o modelo funciona eu pedi
para ele criar uma versรฃo client do do
do que a gente tรก lanรงando aqui no canal
nรฉ nรฃo sei se vocรชs sabem mas aqui no
canal a gente lanรงou o Tony entรฃo a
gente deu vida ao Tony basicamente a
gente tem o streaming de um รกudio que รฉ
o Tony respondendo as perguntas que
vocรชs mandam no chat da Live Entรฃo essas
perguntas que estรฃo sendo viadas
enviadas aqui eu tรด pegando do chat da
Live que tรก programada para hoje entรฃo
Aqui nรณs temos o chat da Live eu mandei
vรกrias perguntas ali de teste durante a
madrugada e essas perguntas sรฃo
respondidas pelo GPT e depois a resposta
do GPT ele รฉ sintetizado em รกudio e esse
รกudio eu crio um broadcast dele e faรงo
streaming desse รกudio entรฃo ร como se eu
conseguisse ter o GPT respondendo com a
minha voz as perguntas de vocรชs em tempo
real durante uma live esse projeto a
gente desenvolveu aqui no canal e agora
a gente tรก na parte do front end dele o
backend tรก todo pronto sรณ que eu fiz a
seguinte pergunta pro pro pro GPT 4 pro
GPT 4 o e pro Cloud sonet tรก o que que
eu pedi para ele criar eu quero criar um
projeto com react react com Shed CD Shed
CN ui ah manualmente adicionado porque
eu odeio frameworks nรฉ Eu falei que o
projeto ele vai listar mensagens que
estรฃo vindos do websocket da aqui eu dei
o endereรงo do websocket e essas nรณs
vamos chamar isso de perguntas e tambรฉm
tem uma outra lista de mensagens que vem
de um outro web socket que a gente vai
chamar de respostas e vai ter um รกudio
sendo tocado que vende tal endp aรญ eu
coloquei requisitos de interface eu pedi
me dรก todos os comandos que eu preciso
rodar e os arquivos que eu preciso criar
ele levou 44 segundos o que que ele fez
primeiro ele tentou entender o que que
eu tava criando ele colocou aqui
montando o projeto Estou construindo um
projeto react ajustando manualmente o
Shed CN ui e evitando frameworks vamos
ver se isso realmente aconteceu depois
desenvolvendo o projeto estou
trabalhando em um projeto que consome
dados do websocket para exibir pergunt
perguntas respostas e uma interface de
รกudio centralizada desenvolvendo fluxos
estou listando perguntas e respostas e E
por aรญ vai configurando ambiente
evaluando alternativas Entรฃo olha sรณ
depois que ele desenvolveu o projeto
desenvolveu o fluxo configurou o
ambiente ele dรก uma olhada para ver se
teria outra alternativa estou mapeando o
uso do Shed CN com next GS ou react
manualmente buscando evitar frameworks
isso sugere que estamos considerando
abordagens flexรญveis e sem vinculaรงรฃo a
um Framework especรญfico entรฃo ele
entendeu o que eu queria de fato quando
ele comeรงou a fazer evaluaรงรฃo aqui
evaluation evaluando alternativas
considerando opรงรตes estou pensando em
usar componentes shedy com react vamos
verificar a documentaรงรฃo para saber se รฉ
possรญvel sem o nextjs te liga ele
entendeu entรฃo que na grande maioria das
vezes as pessoas estรฃo usando react com
nextjs E como eu falei para ele que eu
nรฃo quero usar nenhum Framework ele
colocou essa consideraรงรฃo entรฃo Aqui
comeรงa a parte que o some altan Diz que
esse modelo รฉ capaz de raciocinar o que
que isso quer dizer quer dizer que muito
se fala quando a gente diz Ah Lucas Ah o
o modelo รฉ sรณ um autocomplete e eu
concordo entendeu tu tem as tuas
palavras e esse modelo ele vai pegar
cada palavra quebrar em tokens entรฃo uma
palavra pode virar mรบltiplos tokens ou
uma imagem pode ter milhรตes de tokens e
ele pega basicamente isso ele cria um
contexto Entรฃo tudo isso estรก dentro de
um texto e esse contexto ele รฉ colocado
Entรฃo como input pro modelo que vai
tentar prever o prรณximo token o
attention is all you need era sobre o
contexto que รฉ gerado com os tokens
entรฃo tu tem uma janela de Window que
ele chama de contexto o context Window
que รฉ o quanto de token ele consegue
manter em memรณria para saber o contexto
do que tu quer quando alguรฉm falava
assim o o modelo ele รฉ sรณ um aut
complete eu vi uma explicaรงรฃo muito boa
do FBI aquita por exemplo que ele foi no
Flow foi na inteligรชncia limitada e cara
o Fรกbio aquita ali ele explicou de uma
maneira muito simples e ele contou toda
a histรณria tรก ligado atรฉ chegar ao
Modelo E por que que esse crescimento da
Inteligรชncia entre aspas do modelo nรฃo
vai ser exponencial e eu concordo com
ele mas eu tenho que discordado da
conclusรฃo que eu chego a ouvir o que ele
falou eu concordo que o modelo nรฃo vai
fazer isso mas o que eu tรด vendo com o
lanรงamento do Open ai o One รฉ que ele
nรฃo รฉ uma atualiz sรฃo no modelo entรฃo a
gente nรฃo tรก incrementando na capacidade
do modelo ok uma janela de contexto tรก
sendo cada vez maior Gemini jรก veio com
uma janela de contexto absurda Mas o que
eu tรด percebendo รฉ que eles criaram um
sistema de mรบltiplos agentes que fazem
prompts para atualizar esse contexto pro
modelo entรฃo fazer a a conclusรฃo final
antes de te dar a resposta รฉ isso que o
Sam altom queria dizer quando ele falou
que a gente precisa prestar mais atenรงรฃo
nos testes do que no treinamento o
treinamento do modelo tu pegar a
internet inteira e zipar isso num llm a
a gente jรก chegou no no num tamanho OK
tรก ligado a gente nรฃo precisa de um
modelo maior agora como รฉ que a gente
testa o resultado disso e a gente faz o
feed de novo pro prรณprio modelo do
resultado do que ele tรก fazendo isso รฉ
sรณ capaz sรณ รฉ capaz de ser feito cara
atravรฉs de um sistema entรฃo nรฃo tem por
exemplo na minha opiniรฃo como tu baixar
o openi ou o na tua mรกquina e usar ele
apenas como modelo porque o que tรก por
trรกs aqui o que a openi deve estar
fazendo e aqui รฉ uma suposiรงรฃo minha รฉ
uma hipรณtese รฉ um sistema de mรบltiplos
agentes que vรฃo guiando tรก a tua da tua
pergunta atรฉ quebrar ela em requisitos
mais inteligentes entรฃo como eu tava
falando cara ela tรก quebrando aqui o que
eu falei em mรบltiplos prompts e eu acho
que cada prompt desse tรก gerando um
resultado e ela tรก olhando o resultado
para gerar um prรณximo prompt entรฃo ร
como se eu estivesse usando ela centenas
de vezes para chegar na minha conclusรฃo
entรฃo sabe quando tu manda algo para ela
e tu chega e ela te dรก um cรณdigo e aรญ tu
roda o cรณdigo e nรฃo funciona daรญ tu fala
รณ nรฃo funcionou Aรญ ela te dรก o cรณdigo
certo e tu pensa por que que tu nรฃo me
deu o cรณdigo certo de primeira Bom eu
acho que fazer ela interar em cima das
prรณprias respostas vai fazer a gente ter
a percepรงรฃo de que ela รฉ muito mais
inteligente usando o mesmo modelo Vocรชs
estรฃo entendendo o o que que eu tรด
explicando aqui nรฃo coloca lรก no chat vรช
se ele te explica Ah รฉ que eu tรด eu tรด
confuso na verdade talvez o GPT te
explique melhor mas aรญ o prรณximo passo
aqui configurando um projeto react estou
comeรงando a criar um projeto react
usando Vit configurando Twin CSS com
post CSS e Auto prefixer agora estou
ajustando PFS no meu no meu templates
desenvolvendo a configuraรงรฃo importaรงรฃo
de arquivos estou pensando em importar
os arquivos manualmente cara olha olha
is olha olha isso aqui estou pensando em
importar os arquivos manualmente Isso
estรก me levando a pensar se hรก
necessidade de ajustes adicionais
criando a interface estou montando a
interface ui reprodutor de รกudio
Centralizado com listas verticais e
horizontais de mensagens e componentes
react twind CSS estรฃo sendo preparados
para comeรงar configurando inicializando
primeiramente estou organizando o
diretรณrio de projetos instalando
dependรชncias aรญ aprimorando conexรฃo
entรฃo ele pensou aqui estou pensando em
aprimorar a conexรฃo webs destacando a
criaรงรฃo de variรกveis de estado para
armazenar as perguntas e as respostas
analisando compatibilidade estou
refletindo sobre a compatibilidade de
shad Y com nextjs e aqui tu jรก comeรงa
tipo assim mas a gente nรฃo tรก usando
nextjs Entรฃo por que que tu tรก
analisando compatibilidade com algo que
a gente nรฃo tรก usando instalando
componentes reunindo peรงas montando a
interface configurando o ambiente de
novo configurando o ambiente de novo
novo estabelecendo conexรฃo Por que que
ele configurou o ambiente mรบltiplas
vezes eu nรฃo sei te dizer o que que ele
quer dizer com isso personalizando o
visual E aรญ ele me deu a lista de
comandos que eu quero executar entรฃo npm
Create Vit last my app aqui npm install
install do tailwind websocket e o Run ok
ele nรฃo adicionou o nextjs embora ele
tenha mencionado que ele tava vendo a
compatibilidade com nextjs aqui tรก os
arquivos que eu tenho que criar Ok todos
os arquivos aqui e aรญ depois ah
additional Notes aqui ele colocou
anotaรงรตes finais e como rodar o projeto
eu rodei o projeto e sim funcionou de
primeira o รกudio tocou a lista de
mensagens sendo consumindo websocket
tudo funcionou de primeira eu fiquei bem
impressionado eu sei que tu ia tu ia
falar Tipo tu tava pensando que ia te
dizer tipo assim nossa alguma coisa nรฃo
funcionou mas nรฃo literalmente eu sรณ
copiei e colei tudo que ele me deu e
funcionou de primeira simples assim ele
nรฃo usou o nextjs Ele usou Vit eu nรฃo
queria eu queria que ele Us sรณ react
Shed CN eu nรฃo sei nรฉ se se se tem como
fazer ou se vocรชs jรก fizeram isso e
publicaram na internet porque tรก muito
difรญcil convencer uma ia para usar para
usar sรณ react Shed CN mas eu quero usar
ele para algo mais complexo um sistema
completo e eu vou ver se eu faรงo um
segundo vรญdeo colocando esse sistema no
ar tรก se eu jรก coloquei no ar eu vou
colocar tudo isso lรก no ai kild internet
que รฉ o nosso site nรณs temos o canal de
vlog ai kild internet da internet mas
tem o nosso domรญnio tambรฉm รฉ i kill
internet que eu vou colocar todos esses
projetos lรก se tu quiser acessar Talvez
ele jรก esteja de pรฉ otimizando aqui para
raciocรญnio nรฉ O que que รฉ ser otimizaรงรฃo
para raciocรญnio como รฉ que foi a
Performance em matemรกtica dele versus o
custo de inferรชncia entรฃo Aqui nรณs temos
o custo e a performance vocรชs podem ver
que o custo aumentou mas a performance
tipo รฉ ridiculamente maior do que o GPT
4 o ridiculamente maior รฉ muito maior
vamos ver programaรงรฃo porque matemรกtica
ele mandou muito bem entรฃo aqui tรก a
performance deles performando bem melhor
do que o GPT 4 o bom quando se fala de
ctfs de seguranรงa cibernรฉtica a gente jรก
comeรงa a ficar preocupado nรฉ porque ele
desempenhou aqui o dobro do que o GPT 4
o tava desempenhando te liga na evoluรงรฃo
dele no cod forces cara na na na
competiรงรฃo de de gerar cรณdigo nรฉ ah GPT
4 o olha o quรฃo o quรฃo mais alto foi o o
One cara e no caso eles nos liberaram sรณ
o ow One preview nรฉ a gente nรฃo tem eu
nรฃo tenho acesso a esse ow One eu tenho
acesso a one preview e ow One mini isso
aqui รฉ um pouco impressionante รณ isso
aqui Sรฃo perguntas tรก questรตes de
ciรชncia para um nรญvel de PHD aqui tรก os
experts os humanos experts tรก os humanos
experts estava pontuando 69.7 acima do
GPT 4 que a gente tinha 56.1 e One
preview e o One estรฃo pontuando acima de
um Expert humano com phd em ciรชncias
entรฃo o pulo do gato tรก nisso aqui รณ
cadeia de pensamento nรฉ o Chain of
thoughts semelhante a como um humano
pode pensar por um longo tempo antes de
responder a uma pergunta difรญcil o ow
One usa uma cadeia de pensamento a
tentar resolver um problema e pelo que
eu tava vendo eles tambรฉm conseguiram
resolver a o maior problema de tu ter o
Chain of thoughts que รฉ quando alguรฉm te
perguntar qual que รฉ a capital da
Holanda tu nรฃo quer que o modelo comece
a desenvolver uma linha de raciocรญnio
Porque isso รฉ uma pergunta direta entรฃo
o modelo tambรฉm ser capaz de entender
quando tu tรก fazendo uma pergunta
complexa e quando tรก fazendo uma
pergunta simples รฉ bem difรญcil de captar
isso entendeu E nรฃo depende sรณ do modelo
cara por isso tรด falando provavelmente รฉ
um sistema com mรบltiplos agentes com
vรกrias etapas digamos de uso desse mesmo
modelo por meio do aprendizado por
reforรงo o owan aprende a aprimorar sua
cadeia de pensamento e refinar a sua as
estratรฉgias que usa ele aprende a
reconhecer e corrigir seus erros ele
aprende a dividir etapas complicadas em
outras mais simples ele aprende a tentar
uma abordagem diferente quando atual nรฃo
estรก funcionando esse processo melhora
drasticamente a capacidade de raciocรญnio
do modelo para ilustrar esse salto
adiante mostramos a cadeia de pensamento
do One Preview em vรกrios problemas dif
difรญceis abaixo entรฃo codificaรงรฃo
Escreva um script B que receba uma
matriz representada como uma string com
formato um 2 3 4 5 6 Imprima a
transposiรงรฃo no mesmo formato a saรญda
esper entrada para a entrada o script
deve gerar um texto simples e esse aqui
essa saรญda representa a matriz
transposta usuรกrio nรฉ novamente aqui
isso aqui foi com isso aqui foi com qu 4
o Entรฃo esse รฉ o modelo antigo o modelo
antigo errou agora o que que o modelo
novo fez o modelo novo basicamente ele
gerou o BES e falou salve o arquivo ele
colocou o que que ele vai reproduzir e
nesse caso ele acertou Tรก OK mas ele nรฃo
ele nรฃo nos disse aqui basicamente qual
que foi a linha de raciocรญnio tรก aqui a
linha de raciocรญnio entรฃo o usuรกrio estรก
solicitando um script B que pode pegar
uma string representando uma como uma
matriz ah tal vamos primeiro entender o
formato de entrada e saรญda aqui que tรก a
entrada entรฃo A entrada รฉ uma sรฉrie de
linhas cada uma entre com shat separadas
por vรญrgula a a transposiรงรฃo dessa
Matriz seria essa aqui entรฃo a saรญda
solicitada seria essa tarefa geral
Escreva um script B que pegue um
argumento a string representando a
matriz e Gere sua transposiรงรฃo no mesmo
formato Ok vamos pensar em como analisar
a string de entrada no best construir a
matriz Provavelmente em arris transpรด-la
E entรฃo gerar a matriz transposta
resultante no formato esperado
restriรงรตes como รฉ BES temos que ter
cuidado ao analisar Strings o script
deve aceitar a string de entrada como um
argumento abordagem analisar a string de
entrada Ok Isso faz sentido construir a
Matriz como uma rei de ar Reis transpor
a matriz gerar a matriz transposta Ok
etapas de implementaรงรฃo capturar a
string remover qualquer espaรงo analisar
string ok daรญ que ele vai vai vai vai
descrevendo que ele vai fazer possรญveis
problemas o best nรฃo tem matrizes
multidimensionais nativamente Entรฃo
precisamos simular precisamos lidar
precisamos lidar com nรบmeros que podem
ter mais de um dรญgito Cara isso aqui รฉ
bem impressionante tรก ligado ele
entender a limitaรงรฃo do BH porque o que
acontecia no no 4 o era que ele delirava
nรฉ quando tu pedia algo que a linguagem
o Framework tinha uma limitaรงรฃo Ele
criava uma API que nรฃo existia tipo Ele
criava uma funรงรฃo um mรฉtodo uma
estrutura de dados que nรฃo existe
naquela linguagem que tu tรก trabalhando
mas nesse caso aqui esse isso nรฃo parece
ser mais um problema bom aรญ o que o some
altman fala aqui no tweet dele รฉ o
seguinte nรฉ Ah ele compartilha aqueles
resultados ali e ele diz que รฉ รฉ o
comeรงo de um novo paradigma a iak pode
fazer raciocรญnio complexo de propรณsito
geral ou One preview e ou One mini estรฃo
disponรญveis hoje durante algumas horas
no chat IPT para usuรกrios Plus e team e
em nossas apis para usuรกrios de nรญvel 5
basicamente ele escreveu Adi de uma
forma diferente e fica a pergunta entรฃo
a gente atingiu a Adi ou nรฃo atingimos
porque pelo que ele diz a gente teria
atingido certo maak pode fazer
raciocรญnio complexo de propรณsito geral e
isso nรฃo significa Adi teve uma outra
pessoa que voltou tambรฉm nessa conversa
toda de de ontem para hoje que sim cara
o nosso queridinho o mano Devin o dein
tรก ligado vocรชs lembram do davin a ia a
primeira ia programadora que vai
substituir os programadores na verdade
รฉ o mayak que รฉ 100% que programa 100%
sozinha nรฉ da da cognition trabalhamos
em em Estreita colaboraรงรฃo colaboraรงรฃo
com a opene nas รบltimas semanas para
avar as capacidades raciocรญnios do openi
o One com dayin ah descobrimos que a
nova sรฉrie de modelos รฉ uma melhoria
significativa para sistemas de Agentes
que liido com cรณdigo abaixo estรก um
mergulho profundo com mais resultados de
avaliaรงรฃo e como pensamos sobre avaliar
agentes de codificaรงรฃo daรญ aqui ele
postou uma uma imagem nรฉ do que que o d
vin ele ele conseguia fazer com GPT 4 o
e como ele consegue fazer com o One
preview Entรฃo cara o Hype continua a
gente nรฃo sabe onde isso vai dar nรฃo
adianta me perguntar nem perguntar para
ninguรฉm porque ninguรฉm sabe essa รฉ Real
o que eu de fato acredito que a gente tรก
vai viver aรญ o o novo momento de de
aplicativos Entรฃo vai ter muita gente
criando produto com base nessas soluรงรตes
aรญ que envolvem deixar ia como backend
do teu produto e vender algum serviรงo ou
alguma entrega de valor que alguรฉm vรก
pagar uma uma assinatura ou fazer um One
Time ali payment para ti eu acredito que
vai ter uma enxurrada de novos sites
novos aplicativos envolvendo
Inteligรชncia Artificial e depois de um
tempo a gente vai cansar aente Vai
cansar de tudo isso mas confere aqui na
descriรงรฃo entรฃo o link para ver se jรก tรก
de pรฉ o o o site que que o GPT ow One
nรฃo GPT nรฃo รฉ mais GPT nรฉ que o ow One
criou para mim morangos
ุชุตูุญ ุงูู ุฒูุฏ ู ู ู ูุงุทุน ุงูููุฏูู ุฐุงุช ุงูุตูุฉ
OpenAIโs new โdeep-thinkingโ o1 model crushes coding benchmarks
Google actually beat GPT-4 this time? Gemini Ultra released
GPT Q* Strawberry Imminent, Sam Altman Trolls (Model Already Secretly Live??)
Project Orion (GPT-5 Strawberry) Imminent, Already Shown To FEDS!
AI News : Gpt4o - Mini CRUSHES Claude, Sam Altman's Aggressive New plans , 3 Years Left Until AGI
SHOCKING New AI Models! | All new GPT-4, Gemini, Imagen 2, Mistral and Command R+
5.0 / 5 (0 votes)