BATALHA de INTELIGÊNCIA ARTIFICIAL! - Gemini | ChatGPT-4o

OPINIÃO
20 May 202425:57

Summary

TLDRThe script details a week marked by an 'AI Battle' between Google's annual developer conference, Google I/O, and OpenAI's surprise announcement of Chat GPT 4, a multimodal linguistic model. Google showcased advancements in AI, including Gemini's AI with a context window of up to 2 million tokens, and AI integration into Google's search system. OpenAI's Chat GPT 4 promises more natural dialogue and versatility in tasks. The script also discusses AI's potential in revolutionizing education, with personalized learning and the ability to act as a tutor. Impressive demos of Google's AI capabilities, like real-time code interpretation and prototype smart glasses, hint at a future where AI could become as integral as a personal assistant, like Iron Man's Jarvis.

Takeaways

  • 🌐 Google I/O is an annual conference for developers and the press where Alphabet, Google's parent company, announces new features and updates on artificial intelligence (AI).
  • 🚀 OpenAI, the company behind Chat GPT, strategically announced their new model, Chat GPT 4, a multimodal linguistic model, a day before Google I/O to divert attention from Google's announcements.
  • 🤖 Chat GPT 4 is designed to have real-time conversations with users and can understand and generate text with improved precision and coherence compared to previous versions.
  • 🔍 Chat GPT 4 can handle various tasks, from answering questions and telling stories to assisting with studies and providing practical advice.
  • 🎧 The script demonstrates a feature where Chat GPT 4 can mimic the voice of Scarlett Johansson from the movie 'Her', which is about a man falling in love with a conversational AI.
  • 📸 Chat GPT 4 can interact with images, such as identifying objects in a photo of headphones and providing information about them.
  • 📈 Google announced an impressive track record with their AI, PaLM, which has a context window of up to 1 million tokens in a closed test for developers and up to 2 million tokens, aiming for an 'infinite context'.
  • 🔠 Tokens are the units of language that AI models use to process information, and a context window is the amount of information an AI can consider when generating a response.
  • 🧠 The larger context window allows AI to remember more information, similar to human memory, which is crucial for natural conversation and understanding long-term context.
  • 🏫 Google demonstrated the use of AI in education, showing how it can act as a personalized tutor for students, adapting to their learning pace and needs.
  • 🕵️‍♂️ The script also mentions other AI models like Google's J1.5 Pro for cloud-based operations, J1.5 Nano for local applications on devices like smartphones, and J1.5 Flash for low-latency responses.

Q & A

  • What event took place recently involving artificial intelligence companies?

    -The 'Batalha das Inteligências Artificiais' or 'Battle of the Artificial Intelligences' took place recently, involving Google I/O, Alphabet's annual conference, and OpenAI, the company behind Chat GPT, which announced new features and models in AI.

  • What is Google I/O and why is it significant?

    -Google I/O is Alphabet's annual conference aimed at developers and the press. It is significant because Alphabet typically announces new features and updates on artificial intelligence at this event.

  • What did OpenAI announce just before Google I/O?

    -OpenAI announced a presentation focused on diverting attention from Google I/O, where they introduced Chat GPT 4, a multimodal linguistic model capable of real-time conversation with users.

  • What is the significance of the multimodal aspect of Chat GPT 4?

    -The multimodal aspect of Chat GPT 4 means that it can interact with users through various modes, not just text, making the conversation more dynamic and engaging.

  • How does the new version of Chat GPT 4 differ from its predecessors?

    -Chat GPT 4 is an improved version with better precision and coherence in understanding and generating text. It is more adept at handling complex contexts and providing natural and useful responses.

  • What is the context window and why is it important for AI models?

    -The context window refers to the amount of information an AI model can consider when generating a response. It is important because it allows the AI to maintain context and provide more accurate and relevant answers.

  • What is the context window size for Chat GPT 4 and Google's Gemini AI?

    -Chat GPT 4 has a context window of up to 128,000 tokens, while Google's Gemini AI has a context window of 1 million tokens in closed testing and up to 2 million tokens.

  • How does the token system work in AI models?

    -Tokens are the units of language that an AI model uses to process information. They can represent words or parts of words and are used to reduce the vocabulary size that the AI needs to handle.

  • What is the potential impact of AI in education as demonstrated by Google's AI?

    -Google's AI demonstration showed the potential for AI to act as a personalized tutor for students, adapting to their learning pace and needs, which could revolutionize education by providing customized learning experiences.

  • What are the different versions of Google's AI models mentioned in the script?

    -The script mentions Google's LaMDA 1.5 Pro, which is designed for cloud-based operations, LaMDA Nano for local operations on devices like smartphones, and LaMDA Flash for low-latency and efficiency.

  • How does the multimodal capability of AI enhance the learning experience?

    -Multimodal capability allows AI to process and understand various types of inputs, such as text, images, and speech, which can make learning more interactive and comprehensive for students.

  • What is the Jarvis level and how does it relate to AI development?

    -The Jarvis level is a term used to measure how close an AI is to the level of sophistication and capability of J.A.R.V.I.S., the AI assistant from the 'Iron Man' movies. It signifies the advancement and human-like interaction capabilities of AI.

Outlines

00:00

🤖 AI Battle and Google I/O Conference Overview

The script discusses the recent developments in artificial intelligence during the Google I/O conference, which is an annual event for developers and press hosted by Alphabet, Google's parent company. The conference was expected to reveal new features and updates on AI, including a new version of Google's AI, Gemini, and its integration into Google's search system. However, a day before Google's event, OpenAI, Google's competitor, announced a presentation aimed at diverting attention from Google I/O. During this presentation, OpenAI unveiled Chat GPT 4, a multimodal linguistic model capable of real-time conversation with users. The presenter highlights the impressive capabilities of Chat GPT 4, such as its ability to converse in a human-like manner and even mimic specific voices, using the example of a voice similar to that of Samantha from the movie 'Her'.

05:00

📈 Understanding Tokens and Context in AI Language Models

This paragraph delves into the technical aspects of AI language models, focusing on the concept of 'tokens' and 'context window'. Tokens are the basic units of language that an AI model processes, which can correspond to words or parts of words. The context window refers to the amount of information a language model can consider when generating a response. The script highlights Google's impressive achievement of having a context window of 1 million tokens for their AI in closed testing, with the public version having 2 million tokens. The presenter explains the significance of this large context window, comparing it to the human brain's ability to recall past conversations and information. The large context window allows for more natural and informative conversations, as the AI can remember and reference a vast amount of data.

10:02

🏫 The Impact of AI on Education and Personalized Learning

The script addresses the potential impact of AI on education, particularly the use of AI as a personalized tutor. It discusses the social implications of AI replacing certain jobs, but also the benefits it could bring to education. The presenter anticipates AI being used as a personal tutor for students, providing customized learning experiences based on individual needs and pace. The script mentions Google's AI, which can adapt to a student's learning style and provide tailored educational content. This personalized approach could democratize education by providing high-quality tutoring to students who may not be able to afford a human tutor, thus leveling the playing field in terms of educational opportunities.

15:06

🎯 AI in Education: Customization and Interdisciplinary Learning

This paragraph further explores the application of AI in education, emphasizing the potential for customization and interdisciplinarity. The script discusses how AI can be molded to fit the pace and needs of individual students, understanding their strengths and weaknesses. It also touches on the multimodal aspect of AI, where it can process both text and graphics, making it a powerful tool for understanding and explaining complex concepts. The presenter provides an example of how AI can generate educational content in real-time, such as creating a notebook guide with a summary and addressing specific learning topics like force and motion through the lens of basketball.

20:08

🛠️ Google's AI Models: Flash, Pro, and Nano

The script introduces different AI models developed by Google, each with specific purposes and capabilities. Google's AI models are categorized into Flash, which is designed for quick responses and efficiency; Pro, which is suitable for cloud-based operations and can handle a large context window of 1 million tokens; and Nano, which is intended for local execution on devices like smartphones with limitations due to the hardware's processing power. The presenter also mentions the cost associated with using these AI models, indicating that while they require significant computational power and energy, the future holds promise for more accessible and environmentally friendly AI solutions.

25:10

🕵️‍♂️ AI Interactions: Real-time Translation and Description

The final paragraph showcases a demo of AI interactions, where one AI describes its environment to another AI that cannot see. This demonstration highlights the ability of AI to communicate and share information in real-time, even when one of the AI systems lacks visual input. The script also mentions the potential for AI to function as a personal assistant, similar to Jarvis from 'Iron Man', and the presenter expresses excitement about the rapid advancements in AI technology, which were once considered science fiction but are now becoming a reality.

Mindmap

Keywords

💡Artificial Intelligence (AI)

Artificial Intelligence refers to the simulation of human intelligence in machines that are programmed to think like humans and mimic their actions. In the video's context, AI is central to the discussion about recent advancements and announcements from major tech companies like Google and OpenAI. The script mentions AI's role in developing new functionalities and models like Google's Gemini and OpenAI's Chat GPT 4, which are designed to understand and generate human-like text and conversation.

💡Google I/O

Google I/O is an annual developer conference hosted by Alphabet Inc., Google's parent company. The event is pivotal for unveiling new products and technologies. In the script, Google I/O is highlighted as the platform where Google was expected to announce several AI innovations, including updates to its search engine's AI integration and a new version of its AI model, Gemini.

💡OpenAI

OpenAI is a research lab that develops AI technologies, including the popular Chat GPT model. The script discusses OpenAI's strategic announcement of Chat GPT 4 just before Google I/O, as a way to compete for attention in the AI space. Chat GPT 4 is described as a multimodal linguistic model capable of real-time conversation with users.

💡Chat GPT 4

Chat GPT 4 is an advanced version of the language model developed by OpenAI. It is designed to understand and generate text with greater precision and coherence than its predecessors. The script mentions Chat GPT 4's ability to handle complex contexts and perform a variety of tasks, such as answering questions, storytelling, and providing practical advice, making it a versatile tool for interaction.

💡Multimodal

In the context of AI, multimodal refers to the ability of a system to process and understand information from multiple modes of input, such as text, voice, and images. The script highlights Chat GPT 4's multimodal capabilities, where it can engage in conversation, interpret images, and provide responses based on a combination of these inputs.

💡Context Window

The context window in AI models refers to the amount of information the model can take into account when generating a response. The script discusses the impressive context windows of Google's AI models, with Gemini having a context window of 1 million tokens in a closed test for developers and up to 2 million tokens, which is a significant advancement for conversational AI.

💡Tokens

In AI and computational linguistics, a token is a unit of text, which can be a word, a punctuation mark, or a number. The script explains that tokens are used to represent language in a way that AI models can process. It also discusses how Google's AI models use a large number of tokens to maintain a broad context, which is crucial for understanding and responding to complex conversations.

💡Educational AI

Educational AI refers to the application of AI technologies in the field of education. The script describes a demo where Google's AI is used to create customized learning experiences for students, acting as a personal tutor. This includes adapting to the student's pace and understanding, providing a personalized approach to education that can potentially revolutionize learning.

💡Customization in Learning

Customization in learning means tailoring educational content and methods to suit the individual needs and preferences of a student. The script talks about AI's potential to offer customized learning experiences, recognizing each student's strengths and weaknesses and adapting the teaching approach accordingly, which can lead to more effective learning outcomes.

💡Interdisciplinarity

Interdisciplinarity is the approach of integrating knowledge and methods from multiple disciplines to enhance learning and understanding. The script mentions the potential of AI to facilitate interdisciplinarity by integrating various types of information and learning methods, allowing for a more holistic and comprehensive educational experience.

💡Jarvis Level

The term 'Jarvis Level' is used metaphorically in the script to describe the advancement and capability of AI systems, referencing the fictional AI assistant Jarvis from the 'Iron Man' movies. The script suggests that the current advancements in AI are moving towards a 'high Jarvis level,' indicating a sophisticated and interactive AI that can understand and respond to complex human needs.

Highlights

Google I/O, Alphabet's annual developer conference, announced several AI innovations.

OpenAI, the company behind Chat GPT, announced a presentation to divert attention from Google I/O.

Introduction of Chat GPT 4, a multimodal linguistic model for real-time conversation.

Chat GPT 4's ability to understand complex contexts and respond naturally and usefully.

Comparison of Chat GPT 4's response speed to human conversational expectations.

Google's impressive track record on the context window size for AI models.

Google's Gemini AI to have a context window of 1 million tokens, available for closed testing.

Google's ambition to achieve 'infinite context' for AI models.

The significance of token context in AI for natural conversation and memory.

Google's demonstration of AI in education, customizing teaching to the student's pace and needs.

Potential social benefits of AI as a personalized tutor for students.

AI's ability to understand and generate multimodal inputs, including images and text.

Google's J 1.5 Pro, designed for cloud-based operations, and its educational application.

Google's J 1.5 Flash, a model focused on low latency and efficiency.

Google's J Nano, intended for local device operations like smartphones.

Demonstration of real-time AI capabilities using a prototype pair of glasses.

AI's potential to revolutionize education by serving as personalized tutors.

The future of AI, moving towards more personalized and integrated learning experiences.

AI's current limitations in processing power and environmental impact.

The concept of 'Jarvis Level' as a measure of AI's advancement towards human-like intelligence.

Transcripts

play00:00

a gente teve nessa semana a Batalha das

play00:02

inteligências artificiais o que

play00:04

aconteceu foi o Google io que é a

play00:07

conferência anual da alphabet alphabet é

play00:10

a empresa mãe do Google tá é tipo

play00:12

Facebook chamam de meta enfim que é uma

play00:14

conferência para desenvolvedores e

play00:16

também pra imprensa todo mundo sabia que

play00:19

a alphabet ia anunciar várias novidades

play00:22

sobre inteligência artificial incluindo

play00:24

novas funções e uma nova versão do

play00:27

Gemini que é a inteligência artificial

play00:29

deles e também a integração de

play00:31

inteligência artificial no sistema de

play00:33

pesquisa do Google que a gente não viu

play00:35

ainda acontecer porém um dia antes

play00:39

sorrateiramente a openi a empresa do

play00:42

chat GPT que é o competidor anunciou uma

play00:46

apresentação claramente voltada para

play00:48

tirar o foco do Google io e nessa

play00:51

apresentação ela anunciou o chat chpt 4

play00:55

O que é um modelo linguístico multimodal

play00:57

a gente vai explicar o que que é isso

play00:59

que consegue com conversar com o usuário

play01:01

e manter um diálogo em tempo real a

play01:04

gente tá vivendo um momento absurdo eu

play01:06

tenho que mostrar para vocês porque eu

play01:08

não sei se vai funcionar porque tem

play01:10

muita gente usando agora e tá dando

play01:11

problema no servidor de vez em quando

play01:13

que é o chat pt4 o que tipo você uma das

play01:16

funções dele é que você consegue

play01:18

conversar com a inteligência artificial

play01:19

como se fosse uma pessoa eu escolhi um

play01:21

tipo de voz aqui eu vou tentar fazer

play01:22

esse teste agora com vocês que é a voz

play01:25

que imita a Scarlet joh Hansen no filme

play01:27

her se você conversar com eling inglês é

play01:30

a voz da Scarlet Hans tipo assim o filme

play01:33

her é um filme no qual um cara se

play01:34

apaixona por uma inteligência artificial

play01:36

de conversação E aí o que tá rolando

play01:37

gente é que o povo tá gamando mesmo vai

play01:40

não não aparentemente eles fizeram isso

play01:41

de propósito aparente não Certamente

play01:43

eles fizeram isso de propósito só que na

play01:45

na versão Dessa voz em português é

play01:47

diferente da Scarlet johansen e uma

play01:49

coisa engraçada que tem nessa voz aqui é

play01:52

que ela usa o r retroflexo ela fala com

play01:54

sotaque de press caba Tá então vamos lá

play01:57

eu vou tentar conversar para vocês verem

play01:59

como é que é Oi Chat GPT Eu tô aqui em

play02:02

live Agora Numa live stream com várias

play02:04

pessoas assistindo você você pode por

play02:06

favor dar um oi pra galera Oi pessoal

play02:09

Espero que todos estejam se divertindo

play02:11

na Live Se tiverem alguma pergunta ou

play02:14

quiserem conversar sobre qualquer coisa

play02:16

estou aqui para ajudar vamos aproveitar

play02:18

o tempo juntos exato a primeira coisa

play02:20

que eu queria que você e dissesse é

play02:23

falar um pouco sobre o chat PT 4 o essa

play02:27

nova versão que você é do chat ept e o

play02:29

que ela pode fazer Claro e o chat GPT 4

play02:32

é uma versão aprimorada do modelo de

play02:34

linguagem da Open Eye ele entende e gera

play02:36

texto com ainda mais precisão e

play02:38

coerência que as versões anteriores essa

play02:41

versão é melhor em entender contextos

play02:43

complexos e responder de forma mais

play02:45

natural e útil Além disso o chat GPT 4

play02:48

pode lidar lidar com tarefas variadas

play02:50

desde responder perguntas e contar

play02:52

histórias até ajudar com estudos ou dar

play02:55

dicas práticas ele é projetado para ser

play02:57

uma ferramenta útil e versátil para uma

play03:00

ampla Gama de interações Que bom

play03:02

obrigado pela resposta eu vou parar

play03:03

agora eu só tô impressionado com a

play03:05

velocidade você consegue responder muito

play03:07

rápido mesmo não tem que esperar nada

play03:09

para ter uma resposta é incrível

play03:13

isso fico feliz que você gostou A ideia

play03:16

é exatamente essa oferecer respostas

play03:18

rápidas e úteis se tiver mais perguntas

play03:21

ou quiser continuar a conversa estou

play03:24

aqui você sabe quem que ela lembra de

play03:27

sotaque a Rafa ciman

play03:30

não Ela errou ali eu falei chat ept 4 o

play03:34

Ela respondeu sobre o chat ept em geral

play03:35

S seu o o é esse de conversação que é

play03:38

multimodal você pode fazer várias coisas

play03:40

você pode mandar uma foto para ele eu

play03:42

fiz isso mais cedo eu fiquei

play03:43

impressionado Skynet de

play03:46

Birigui melhor comentário não a

play03:48

identificação de objeto eu tirei uma

play03:51

foto do fone de ouvido é esse fone de

play03:53

ouvido que eu tenho da Sonic é o design

play03:55

dele é até meio genérico tá gente tem

play03:57

vários fones de ouvido com esse design

play03:58

tem nada de especial aí eu perguntei o

play04:00

que que é isso ela respondeu você tá

play04:02

segurando um par de fones de ouvido da

play04:04

Sony especificamente do modelo w h 1000x

play04:09

M4 Tá certo Esses fones são conhecidos

play04:12

por sua qualidade de som superior e pelo

play04:14

excelente cancelamento de ruído ativo

play04:16

porque que eu fiquei mais impressionado

play04:18

aqui não sei se tem uma diferença física

play04:20

entre o WH 1000x M3 e o M4 Será que ela

play04:24

sabe quem a gente é não não esse daqui

play04:26

não tem contexto não não tem esse

play04:27

contexto não aí eu vou explicar sabe

play04:30

quem é o fone não ela não sabe porque é

play04:33

outra coisa que a gente vai ter que

play04:34

discutir sobre a Google depois a Google

play04:36

Apresentou um track impressionante que

play04:38

acho que nem a galera do chat PT tava

play04:40

antecipando e é um treco revolucionário

play04:42

que é a quantidade de token de contexto

play04:46

que é a quantidade de informação que o

play04:48

modelo linguístico consegue levar em

play04:50

conta para te dar uma resposta tá eu vou

play04:52

antecipar isso daqui agora o chat GPT

play04:54

até onde a gente sabe chega a 128.000

play04:57

tokens tokens seria a unid

play05:00

de comunicação de registro de linguagem

play05:03

do modelo como que eu explico um token

play05:05

aqui imagina uma palavra você pode

play05:07

pensar que cada token é uma palavra mas

play05:09

não é necessariamente uma palavra porque

play05:11

você para diminuir a quantidade o

play05:12

tamanho do vocabulário ao qual a

play05:14

inteligência artificial tem que ter

play05:16

acesso você pode quebrar palavras e eu

play05:18

vou ter que explicar isso porque isso é

play05:20

impressionante do negócio do Google

play05:22

durante o anúncio do Google o que eles

play05:24

anunciaram de mais impressionante Na

play05:26

minha opinião foi que o Gemini a

play05:28

inteligência artificial deles vai ter

play05:31

uma janela de contexto de 1 milhão de

play05:35

tokens a que já tá disponível pro

play05:37

público em teste fechado disponível para

play05:40

desenvolvedores essa janela de contexto

play05:42

chega a 2 milhões de tokens o que que é

play05:45

um token é basicamente uma informação

play05:48

numérica que normalmente corresponde a

play05:51

um vocábulo ou um vocabulário a qual a

play05:52

inteligência artificial tem acesso uma

play05:55

janela de contexto é a quantidade de

play05:57

informação que a inteligência artificial

play05:59

pode levar em conta para te dar resposta

play06:01

porque tipo assim pensa no cérebro

play06:02

humano a gente aqui tem um monte de

play06:04

coisa na nossa cabeça quando a gente tá

play06:05

tendo um pensamento uhum a inteligência

play06:08

artificial não consegue fazer isso tão

play06:09

bem ainda ela consegue ter uma uma

play06:11

quantidade de informação limitada depois

play06:13

que você enche essa quantidade de

play06:15

informação eh Muitas delas até dão

play06:17

problema você tem que recomeçar o chat

play06:19

sem sem contexto nenhum de novo entendeu

play06:21

porque tipo assim encheu encheu o Cash

play06:23

encher o cérebro dela do tanto de

play06:25

informação que ela pode considerar Ah

play06:28

então a gente mede essa quantidade de

play06:30

informação em token um token pode ser

play06:32

uma palavra tá mas você pode quebrar

play06:35

essa palavra também para diminuir o

play06:37

tamanho do vocabulário a qual a

play06:40

inteligência artificial precisa ter

play06:41

acesso por exemplo você pensa que você

play06:43

tem uma numa língua você tem a palavra

play06:46

normal normalmente comum comummente O

play06:49

que você pode fazer é dar um código

play06:51

numérico para cada uma dessas palavras

play06:52

pra Inteligência Artificial processar

play06:54

esse código o normal pode ser o 01

play06:57

normalmente Pode ser a palavra 02 o

play06:58

comum ser a palavra 03 e o comummente

play07:02

ser a palavra 04 só que você pode

play07:05

quebrar isso em termos dos tokens para

play07:07

poder meio que economizar nesse nessa

play07:09

sequência você pode quebrar o

play07:11

normalmente em dois tokens aí normal é a

play07:14

palavra 01 e no normalmente você tem

play07:17

duas palavras o normal que é o 01 que

play07:19

você já tem esse código e você tem o

play07:21

mente que você pode chamar da palavra 02

play07:23

aí quando você vai fazer o comumente de

play07:26

novo 0 mais 02 é não o comum é a palavra

play07:29

zer 0 3 comum mente você quebrou e dois

play07:31

comum 03 de novo e o mente você já falou

play07:34

em cima que é o 02 Então você saiu do

play07:36

contexto em que você tinha quatro

play07:37

palavras que você tinha que conhecer

play07:39

normal normalmente comum comum mente

play07:41

para ter três palavras que você tem que

play07:43

conhecer normal comum e mente é

play07:45

básicamente você e você estrutura o

play07:47

tokem assim porque assim que a

play07:48

inteligência artificial processa a

play07:50

informação tá você tem que pegar essas

play07:53

esses elementos linguísticos e você

play07:55

converter para um código numérico para

play07:57

ela processar simplificando para cá tá

play07:59

gente então o Google consegue ter o

play08:02

contexto de 1 milhão de token que já tá

play08:04

de tokens que já tá disponível que é

play08:05

coisa para caramba e em teste fechado

play08:07

ele tem 2 milhões e a ideia do Google é

play08:10

chegar a contexto infinito não sei o que

play08:12

que eles querem dizer com isso Tá Mas é

play08:14

impressionante tá com 2 milhões de

play08:16

tokens você pode ter em contexto 2 horas

play08:21

de vídeo Você pode ter em média tá cerca

play08:23

de 1 milhão e meio de palavras e coisa

play08:25

do tipo é uma coisa impressionante e

play08:27

quando eu falo Du horas de vídeo tá não

play08:29

é só as coisas que estão sendo ditas no

play08:31

vídeo são todas as informações dos

play08:33

vídeos as cenas os objetos que aparecem

play08:35

no vídeo a inteligência artificial pode

play08:38

ter aquilo no cérebro dela para você

play08:40

consultar e isso é muito importante para

play08:42

inteligências artificiais que faz esse

play08:43

negócio da conversa natural porque ela

play08:46

tem que saber aquela coisa que você

play08:47

falou há 30 anos atrás se um dia você

play08:50

quiser ter o Jarvis do Homem de Ferro el

play08:52

tem que lembrar disso ele tem que

play08:53

lembrar de tudo que você já falou com

play08:55

ele e eu acabei me adiantando tá porque

play08:57

tanto o Google quanto o chat de ter

play08:59

nessas nessa apresentação deles eles

play09:02

estão apresentando inteligências

play09:04

artificiais multimodais que não é só

play09:06

palavra você pode fazer palavra escrita

play09:08

falada ela entende o que você fala Até

play09:11

onde eu sei aqui ele não precisa mais

play09:12

fazer aquele processo de converter o que

play09:14

você fala para texto para processar o

play09:17

texto depois gerar um texto e converter

play09:18

aquele texto de novo para fala para

play09:20

falar com você ele meio que entende eles

play09:22

estão entendendo agora o que você fala

play09:23

tá não sei qual a especificidade de cada

play09:25

uma delas de como ela faz eles fazem

play09:27

esse processo mas é basicamente isso uma

play09:29

coisa que eu achei eu vou falar duas

play09:31

coisas aqui do io do Google porque foi

play09:34

uma apresentação de 2 horas mais

play09:37

massante do que tudo foi aquele negócio

play09:40

assistir e Tinta secar sabe qual é que

play09:43

eu V falo só que teve duas coisas que eu

play09:44

achei impressionante a primeira é uma

play09:47

coisa que eu tava antecipando já que

play09:49

acontecer que é o uso dessas

play09:50

inteligências artificiais de conversação

play09:53

em educação por isso é impressionante é

play09:56

aquele negócio de inteligência

play09:57

artificial é de Tecnologia é triste mas

play10:00

é verdade que muita gente vai perder

play10:01

emprego tá muitas pessoas que não

play10:03

deveriam não deveriam no sentido

play10:05

obviamente é um curso pessoal para elas

play10:06

né mas também um curso social grande

play10:09

porque o que vai ter no lugar dessas

play10:11

pessoas não vai

play10:13

eh gerar o mesmo benefício que essas

play10:16

pessoas empregadas geravam pra sociedade

play10:19

pra sociedade essa que é verdade tem

play10:21

Inteligência Artificial que não tem

play10:22

tecnologia que não leva a gente para um

play10:24

patamar melhor Ela traz a gente um

play10:26

bocado mas tem tecnologias que de fato

play10:28

melhoram a nossa vida vida que vai ter

play10:30

um curso social em termos de certas

play10:31

pessoas que vão sofrer com isso mas o

play10:35

curso social geral pra galera é positivo

play10:37

e uma das coisas que eu achava que que

play10:39

achei que era positivo embora seja uma

play10:41

polêmica que eu possa gerar aqui é o

play10:44

fato de você usar inteligência

play10:45

artificial para ser professor particular

play10:47

da criança porque hoje em dia você tem

play10:50

pessoas que trabalham como professor

play10:51

particular que são muito boas e fazem

play10:53

uma vida inteira disso e as pessoas vão

play10:55

continuar existindo elas muito boas tá

play10:56

porque a inteligência artificial não vai

play10:58

conseguir ser melhor que o indivíduo

play10:59

até onde eu até onde eu consigo

play11:01

antecipar melhor que o indivíduo muito

play11:02

bem informado dedicado preparado bom

play11:06

profissional mas uma a galera vai rodar

play11:07

principalmente a galera que tá fazer o

play11:09

bico disso sabe que não é dedicar que

play11:11

essa não é a profissão da pessoa e tal

play11:13

que talvez não fosse um um professor

play11:16

particular tão bom mas o contraponto

play11:17

disso é que você vai ter um benefício

play11:19

social muito grande se você tiver

play11:21

inteligências artificiais que consigam

play11:22

atuar como professor particular dos

play11:24

alunos porém no caso de inteligências

play11:27

artificiais agindo como professor

play11:29

particular L eu consigo imaginar um

play11:31

benefício social muito grande porque a

play11:33

maior parte dos alunos não tem grana

play11:35

para pagar um professor particular a

play11:37

quase totalidade se você for considerar

play11:39

é uma pequena porcentagem lá em cima que

play11:41

consegue pagar a hora de um professor

play11:44

particular e essa pessoas normalmente

play11:45

tem uma vantagem absurda normalmente

play11:47

você contrata um professor particular

play11:48

pro seu filho Seu filho tá tendo

play11:49

problema e o seu filho recebe uma ajuda

play11:51

por conta disso que crianças que não tem

play11:53

as mesmas condições não tem nem condição

play11:54

é que a grande maioria né que a grande

play11:56

maioria tipo assim em termos de

play11:57

competição pelo merc pelo várias coisas

play12:00

que vão surgir depois né de

play12:02

oportunidades na vida o filho de quem

play12:05

tem muito dinheiro se destaca porque ele

play12:06

vai ter mais suporte exato e o que eu

play12:09

tinha antecipado Era exatamente isso

play12:11

inteligências artificiais ensinando

play12:13

alunos mas isso é muito impressionante

play12:16

por se isso acontecendo porque você vai

play12:18

poder gerar uma inteligência artificial

play12:20

que é moldada ao ritmo do aluno a

play12:23

necessidade dele a inteligência

play12:25

customizada customizada ela sabe o que

play12:27

ele entende bem o que ele não entende a

play12:30

coisa que ele entende de forma acelerada

play12:31

coisa que ele entende de forma mais

play12:32

lenta e sabe como trabalhar qual a

play12:35

melhor metodologia para poder endereçar

play12:37

aquele aluno e esse demo aqui é

play12:58

sensacional 1.5 pro é a inteligência

play13:01

artificial do Google que atualmente né

play13:03

disponível no mercado Tá com contexto de

play13:05

1 milhão de tokens

play13:09

tá é o que você faz basicamente você

play13:12

pode dar o material tá você pode pegar

play13:14

livroos de datico coisa do tipo e

play13:16

colocar e ele meio que fica eu não sei

play13:18

qu o mecanismo se é aberto para uma

play13:20

janela de consulta ou se ele vai inteiro

play13:22

para dentro dessa desse contexto de 1

play13:24

milhão de tokens que o J tem

play13:37

source with 1.5 pro it Instant creates

play13:41

notebook guide with a helpful summary

play13:44

and can

play13:47

generate ISO impressionante

play14:21

eu só quero deixar a coisa clara aqui

play14:23

ele deu a informação e falou eles assim

play14:27

inteligência artificial sobre isso a

play14:29

gente tá vendo a inteligência artificial

play14:31

conversando gerando diálogo consigo

play14:33

mesma enquanto ele e o filho dele estão

play14:35

assistindo tá sobre a matéria

play15:05

on have a

play15:07

j yeah Can you give my son Jimmy a

play15:10

basketb exle Jimmy that's a Fantastic

play15:14

Idea Basketball is actually a great way

play15:16

to visualiz Force and motion Let's Break

play15:19

it Down Okay so first imagine a

play15:21

Basketball just sitting there on the

play15:24

moving because all the

play15:27

foran the

play15:31

cara isso é impressionante a gente tem

play15:35

que analisar tudo é multimodal porque

play15:37

parte dos inputs que ele colocou são

play15:39

também gráficos e coisas do tipo a

play15:41

inteligência artificial consegue olhar a

play15:42

imagem dos gráficos entender o que

play15:44

entender o que que é junto com os textos

play15:47

e levar essas coisas em consideração ela

play15:49

lê isso né É e ela gerou a voz e a voz

play15:52

soua natural a voz com ênfase na hora

play15:55

que ele falou pra Inteligência

play15:56

Artificial Você pode falar isso pro meu

play15:58

filho do Tom né oi não sei como se

play16:01

tivesse falando com a criança porque tem

play16:03

informação é o filho de alguém que tá

play16:05

falando isso prov ela deve ter pensado

play16:07

provavelmente uma criança pequena tal tô

play16:08

que tá aprendendo isso daqui que é

play16:09

matéria de escola Aí ela mudou a ênfase

play16:12

a inteligência artificial fez isso e

play16:15

isso daqui para mim de tudo de tudo que

play16:18

eu vi teve coisas impressionantes tá a

play16:20

coisa que eu acho que é uma das melhores

play16:23

aplicações de inteligência artificial é

play16:25

isso porque a revolução que vai fazer

play16:28

isso em termo de educação não que vai

play16:30

substituir o professor em sala de aula

play16:32

mas esse daqui substitui o professor

play16:34

particular em casa porque você pode

play16:36

aprender a matéria se o aluno não

play16:39

conseguiu entender ele tem outros

play16:42

recursos né é ele é é primeiro que você

play16:44

tem que ter um professor para apresentar

play16:46

a matéria de forma padronizada pro aluno

play16:48

porque não dá para você customizar tudo

play16:49

tem que ter uma noção quando você fala

play16:51

de ensino público Universal tem uma uma

play16:53

uma base que tem que ser comum né é

play16:55

mínima que é comum obviamente que depois

play16:57

você vai sair PR em outras áreas quando

play16:59

você for se profissionalizar quando você

play17:01

tiver outros interesses e tal mas a base

play17:03

tem que ser comum só que dentro do

play17:04

aprendizado dessa base as necessidades e

play17:07

dificuldades de cada aluno vão ser

play17:08

diferentes e como você tem um professor

play17:10

numa sala para 30 e coisa do tipo é

play17:12

muito difícil o professor endereçar tudo

play17:14

então você pode ter inteligência

play17:16

artificial entrando de forma customizada

play17:18

para cada aluno e eu acho isso muito

play17:20

interessante porque tem gente os métodos

play17:22

de aprendizado são diferentes tem gente

play17:24

que é mais visual tem gente que é mais

play17:26

né auditivo Tem gente que precisa pra

play17:29

escrever então você pode sei lá elaborar

play17:31

exercícios pra pessoa copiar enfim e

play17:34

quando você vai aumentando a janela de

play17:35

contexto você pode chegar em um momento

play17:37

que a inteligência artificial tem como

play17:39

contexto toda a vida Educacional do

play17:41

aluno Então ela sabe com o detalhe

play17:43

granular Qual é quais são as

play17:45

dificuldades as matérias na que são mais

play17:47

fáceis para ele onde ele já teve

play17:49

problema no passado que pode indicar se

play17:51

você fizer um cruzamento de dados com

play17:52

informações gerais assim se uma pesquisa

play17:54

e coisa do tipo em termos da da média

play17:56

dos alunos né O que pode indicar uma

play17:58

dificuldade que ele vai vai ter do

play17:59

Futuro em outra coisa e ela pode ser

play18:01

customizada nesse sentido E sem contar

play18:03

que tá tudo ali meio que dá para você

play18:05

fazer uma coisa a a

play18:07

interdisciplinaridade né funcionar de

play18:10

fato porque é uma coisa só que tá

play18:12

integrando todas essas informações Você

play18:13

pode buscar o cara é bom de química você

play18:16

pode buscar um exemplo lá na química

play18:17

para ele entender o outro na disciplina

play18:19

SIM SIM todo método de aprendizado tá

play18:22

disponível e o mais doido é que o aluno

play18:25

interage como se interagia cada vez mais

play18:28

né não totalmente Mas cada vez mais como

play18:30

se você interagir I com o professor é

play18:32

isso é assustador de fato mas não no

play18:34

futuro você vai ter geração de avatares

play18:36

ele vai poder inclusive ver uma pessoa

play18:38

você poder ter um professor particular

play18:40

só te acompanhando a vida inteira isso

play18:42

para mim é um negócio que eu falo assim

play18:44

isso daqui é um benefício social absurdo

play18:47

pra Inteligência Artificial o uso de

play18:50

inteligência artificial no ensino porque

play18:52

a gente fala muito assim de gerar imagem

play18:55

coisa do tipo mas o uso no ensino vai

play18:57

ser impressionando

play18:59

é claro que a gente não tá ignorando os

play19:00

problemas tá gente a gente tá fazendo um

play19:02

recorte aqui para mostrar algo que a

play19:04

gente tinha meio que antecipado também o

play19:06

Leon pelo menos havia até falado sobre

play19:08

isso na Live é e uma coisa que eu tenho

play19:10

que mencionar aqui também que é essa é

play19:13

outro demo que eu acho que eu fiquei

play19:14

impressionado que junto com o Gini 1.5

play19:17

pro que é esse que a gente viu aqui

play19:19

atuando na parte de educação e coisa do

play19:22

tipo que é o principal da Google a

play19:24

Google também tá divulgando o J 1.5

play19:28

flash que é um modelo baseado em baixa

play19:31

latência e eficiência tá e a gente tem

play19:34

que mencionar que ele ser um terceiro

play19:35

também que é o nano que é o para rodar

play19:36

em localmente em aplicativos tipo assim

play19:39

em aplicativos não em aparelhos que você

play19:40

tem para rodar no seu celular esse daqui

play19:42

que a gente viu o gmni 1.5 pro ele é

play19:45

feito para rodar nas nubens tá não é o

play19:48

computador da pessoa que tá usando que

play19:49

tá gerando isso que tá sendo gerado nos

play19:51

servidores do Google ele tá mandando de

play19:52

volta para você informação do seu

play19:54

computador aí tem um nano que é para

play19:56

rodar no computador local que obviamente

play19:58

tem

play19:59

uma série de limitações né por conta

play20:01

disso porque o seu celular normalmente

play20:03

não é tão potente quanto um servidor

play20:05

inteiro de de gpus não é mesmo e você

play20:07

tem o flash também que é basicamente PR

play20:10

resposta rápida esse aqui é o propósito

play20:12

dele e esse demo aqui achei sensacional

play20:15

vamos lá é deixar bem claro segundo

play20:17

Google tudo isso daqui é em tempo real

play20:20

são duas partes que foram capturadas uma

play20:22

com celular e uma com óculos em tempo

play20:24

real

play20:33

speak what that part speaker call

play21:00

What does that Part of The Code

play21:04

do thise encryption and decryption

play21:08

functions it seem to use aesb encryption

play21:12

To enc and dec data

play21:15

Key

play21:22

VV What ne do you think

play21:34

play21:37

certo

play21:48

Caramba aí o óculos agora essa já é

play21:51

outra dema esse óculos aqui não é um

play21:53

produto ainda tá é um protótipo Imagina

play21:55

você tá com óculos você tá

play22:24

name than enim ISO daí é ointe é

play22:28

impressionante tá é impressionante

play22:30

obviamente que tem uma crítica toda vez

play22:32

que a gente vê o demo igual a esse

play22:34

porque você começa a apontar é o seu

play22:36

celular para coisa primeiro isso daqui

play22:38

você tem que pensar que é é um ambiente

play22:40

extremamente controlado é a demo feita

play22:42

para parecer bonita obviamente que

play22:44

impressionante mas é tudo feito aqui

play22:46

para parecer bonito contanto que já tá

play22:47

pronto né a vizinhança lá de Kings Cross

play22:50

eu tipo assim gosta de chegar na na na

play22:52

Paulista né na Paulista falar onde é que

play22:54

eu tô ele tá numa ela tá numa rua lá do

play22:57

terza Maria Barb

play22:59

sabe lá em beru não tá ela não tá a

play23:01

gente sempre fica apontando essas coisas

play23:03

de reconhecimento de imagem para coisas

play23:04

que a gente conhece igual eu fiz com o

play23:05

meu fone de ouvido né ou até para poder

play23:08

checar né um jeito fácil de checar mas

play23:11

tipo assim ainda assim impressionante

play23:12

Quando a gente tiver isso funcionando o

play23:14

tempo inteiro o grande problema da

play23:16

Inteligência isso assim isso é

play23:17

impressionante tá gente não tem que

play23:18

falar se a gente conseguir chegar nesse

play23:20

nível de Jarvis smo eu vou criar esse

play23:23

esse termo agora é é uma escala quão

play23:25

perto a sua inteligência artificial é do

play23:27

Jarvis do do Homem de Ferro beleza é o

play23:30

nível de Jarvis isso daí é um nível bem

play23:32

alto de Jarvis chegar nisso aí seria

play23:34

impressionante o flash já tá disponível

play23:36

é tudo isso daqui custa dinheiro se eu

play23:38

não me engano o flash para cada 1 milhão

play23:40

de tokens É nos centavos eu acho e o pro

play23:43

se você quiser 1.5 pro acho que é ó para

play23:45

1 milhão de tokens é você tem que pagar

play23:47

para usar obviamente que tem

play23:48

impedimentos tá hoje em dia a

play23:50

inteligência artificial demanda muito

play23:51

processamento é muito processamento e

play23:54

muita energia para fazer esse

play23:55

processamento Então você tem um impacto

play23:57

ambiental Grande ainda mas eu vejo um

play23:59

futuro em que isso não seja tão pesado

play24:02

não só isso que você consiga rodar isso

play24:03

de aparelhos locais tipo do seu celular

play24:05

quando isso chegar todo mundo vai ter o

play24:08

seu jarbs por final só queria mostrar

play24:10

para vocês outra coisa que eu achei

play24:11

curioso que é um dos demos do chat PT

play24:14

vocês não vão ver com legenda aqui

play24:16

porque acho que não tem colocaram dois

play24:17

chat GPT 4 o para bater papo para bater

play24:20

papo today

play24:44

que ele fez aqui é o seguinte é uma

play24:46

inteligência artificial que pode fazer

play24:47

perguntas para outra essa inteligência

play24:49

artificial que tá fazendo perguntas ela

play24:51

não consegue ver o mundo a câmera

play24:53

fechada enquanto a outra tem a câmera

play24:56

fechada tem quear para ela

play25:03

aí ele tá descrevendo o cmodo para

play25:07

outro essa que consegue

play25:10

ver aí Chegou outra

play25:13

funcionária aí a outra

play25:18

responde pedindo a outra pedindo

play25:20

detalhes

play25:30

tá descrevendo a iluminação do ambiente

play25:32

e tal são duas inteligências artificiais

play25:34

conversando uma passando por voz

play25:36

informação para outra sobre o que ela tá

play25:39

vendo no ambiente e essa conversação foi

play25:41

essa que eu demonstrei no começo tá

play25:42

gente enfim eu só queria que vocês

play25:45

ficassem informados disso essas coisas

play25:47

que a gente estava antecipando tipo

play25:48

assim aquela coisa que eu falei que a

play25:51

velocidade o treca exponencial isso há

play25:53

um ano atrás era ficção científica Agora

play25:55

nós estamos aqui

Rate This

5.0 / 5 (0 votes)

Related Tags
Artificial IntelligenceGoogle I/OOpenAIMultimodal ModelsReal-Time InteractionAI EducationCustomized LearningTech ConferenceInnovative TechFuture Trends