O que IAs podem fazer? | Exemplos de Ferramentas
Summary
TLDRThe transcript discusses AI tools like ChatGPT that are being incorporated into daily life. It explains how large language models like GPT work, emphasizing they don't have true intelligence or consciousness. The speaker shows how AI can help generate video and audio content, and talks about helpful programming tools that integrate GPT. Overall the video explores current AI capabilities, dispelling hype while showing useful applications.
Takeaways
- 🙂 ChatGPT and similar AI tools have been increasingly incorporated into daily routines, especially with the excitement around ChatGPT 4 and its new features.
- 👨💻 The episode discussing the temporary ousting of OpenAI's CEO, Sam Altman, highlights ongoing controversies and internal drama within the tech community.
- 🧐 Current AI discussions are still in a primitive stage, with examples like LLMs (Large Language Models) being advanced but lacking true cognition or consciousness.
- 🚨 There's skepticism about reaching AGI (Artificial General Intelligence) anytime soon, with significant breakthroughs still required to achieve true digital consciousness.
- 🚀 Despite advancements, tools like ChatGPT are primarily sophisticated text generators, not indicative of human-like intelligence or reasoning abilities.
- 📲 The integration of AI in various domains, from video editing to customer service, demonstrates its utility in automating repetitive tasks rather than replacing human creativity.
- 📚 The script emphasizes the distinction between AI technologies like machine learning, deep learning, and LLMs, clarifying that 'AI' encompasses a variety of techniques.
- 🎥 Examples of AI-driven content creation and editing tools, such as Hey Jum and Eleven Labs, showcase the potential to generate highly realistic videos and voiceovers.
- 📈 AI tools are reshaping professions by automating low-value tasks, but they also augment high-skill jobs by streamlining complex processes like code generation and design.
- 🔍 The dynamic and volatile nature of the AI market is highlighted, with new tools emerging and disappearing regularly, making continuous learning and adaptation essential.
Q & A
What was the purpose of the experimental episode mentioned in the script?
-The purpose was to discuss the incorporation and opinions on AI tools like ChatGPT in daily life, not as an extensive review of all AI tools but focusing on those the speaker has experimented with and found useful.
What significant event involving OpenAI's CEO, Sam Altman, is mentioned?
-The script mentions a controversial episode where OpenAI's board decided to fire CEO Sam Altman without explanation, leading to employee threats to leave for Microsoft, which resulted in the decision being reversed.
What is AGI, and how does it relate to current AI technologies like LLMs?
-AGI, or Artificial General Intelligence, is the concept of a machine with the ability to understand, learn, and apply knowledge in a way that matches or surpasses human intelligence. Current AI technologies like LLMs (Large Language Models) are far from achieving AGI, as they lack true cognition and consciousness.
What is the main function of GPT as described in the script?
-GPT is described as a highly sophisticated text generator that continues text from where the user stops typing, without involving reasoning or cognition, and lacks human-like intelligence.
How did the speaker experiment with creating their own GPT character?
-The speaker experimented by creating a character named John Carmack and conversed with it, demonstrating the ability to generate text based on an initial prompt simulating a specific behavior or persona.
What advancements in AI and machine learning are mentioned for video editing and noise reduction?
-The script mentions advancements like the DaVinci Resolve's ability to re-light a scene using AI to analyze depth and position lights in 3D space, and its capability to isolate a speaker's voice from background noise, improving audio quality.
What is Adobe Firefly, and how does it differ from other image generation tools?
-Adobe Firefly is described as a tool similar to DALL-E or MidJourney, but it's trained exclusively on images with permissible copyright, reducing the risk of copyright infringement.
How does the script illustrate the impact of AI on job automation?
-The script discusses that AI will automate jobs that are simple and repetitive, not because AI has become overly intelligent, but because those jobs are inherently simple, citing examples like self-service checkouts and ordering systems.
What limitations of ChatGPT are mentioned, and what solution is proposed?
-A limitation mentioned is ChatGPT's lack of memory for previous conversations, starting each new interaction from scratch. A proposed solution is using tools like isel.io to process and embed documents into a database, enabling more contextual conversations based on uploaded documents.
What future outlook on AI and AGI is provided in the script?
-The script suggests that while we are far from achieving AGI and it remains in the realm of science fiction, the current state of AI technology is already highly capable and useful for tasks like content creation, indicating potential for future advancements to produce more natural results.
Outlines
😊 Intro to AI tools used daily
The paragraph introduces chatGPT and other AI tools that are used daily. It mentions the hype around GPT-4 capabilities to make your own GPT. It reiterates opinions about general AI and explains that current AI is far from true intelligence or consciousness.
😮 Examples of AI automation
The paragraph provides examples of jobs already being automated without needing advanced AI, like cashiers and fast food order taking. It mentions that basic templates and tools like Squarespace enable people to build websites without coding knowledge.
📷 Adobe and video editing AI integration
The paragraph demonstrates AI capabilities by explaining how this entire video was made with AI, using services like Reyeen and ElevenLabs. It gives examples of how video editing tools like DaVinci Resolve use AI for noise reduction and content filling. It recommends YouTube channels to learn more.
Mindmap
Keywords
💡Artificial Intelligence
💡LLMs
💡Automation
💡Consciousness
💡Dangers of AI
💡Video generation
💡Programming
💡Text generation
💡Limitations
💡Future developments
Highlights
This is an experimental short video, more for fun this time I want to talk a bit about AI chat tools like ChatGPT that I have incorporated into my daily life.
What is called AI today are large language models (LLMs) and LLMs are basically like your cell phone's autocorrect but more highly glorified.
With GPT-4 advances, even if GPT-5 is twice or triple or 10 times better than GPT-4, we are still not close to AGI which is general artificial intelligence.
The current stage of AI does not have good definitions for things like intelligence or consciousness, our definitions today are extremely primitive.
Fears that AI will replace many people's jobs are real, particularly because there are many activities that are merely copy and paste, very simple to automate.
Market of templates itself has lowered the cost of what used to be expensive and time consuming work for most people. This alone is enough and again we don't even need AI for this.
Many famous brands like Black Magic and Adobe have already integrated AI capabilities into video editing software like DaVinci Resolve or Adobe After Effects.
For text generation I don't need to waste time explaining how great ChatGPT is for writing summaries, disposable texts like a more formal email, same for GitHub Copilot.
Copilot helps a lot with repetitive, tedious tasks I always found annoying. A Copilot or GPT helps a lot and I recommend using it.
From the terminal I can ask about commands I don't remember all the options for by heart, like how to run a Docker container that deletes itself afterwards to not leave mess behind.
If you don't know how to discern good and bad code snippets obviously you are not a professional programmer.
Tools like Anthropic's Claude create an extended memory for conversations with ChatGPT, allowing you to reference previous information.
I'm not going to list every ChatGPT integrated tool because many appear and disappear daily, it's better to just Google the most famous tools of the time.
This is a short video, was just to chat about AI and experiment what it would be like to make a whole episode with AI.
If you liked the video, like, subscribe, click the bell, and share with your friends. See you later!
Transcripts
Olá pessoal Fabio aquita este vai ser um
episódio experimental curtinho mesmo
mais de brincadeira desta vez quero
falar um pouco sobre as ferramentas de
ia tipo chat GPT que tenho incorporado
no meu dia a dia não vai ser um review
extenso de tudo que existe só o que eu
já experimentei e Gostei de usar todo
mundo continua empolgado e hypado por
causa de chat GPT especialmente com o
lançamento do chat GPT 4 com
funcionalidades como abre aspas fazer
seu próprio GPT vou aproveitar tá para
explicar um pouco disso e reiterar
minhas opiniões sobre ia em geral Então
vamos
lá para começar Novembro Vimos um dos
episódios mais patéticos da história de
Silicon Valley tudo bem para ser honesto
teve mais patéticos como a história da
terranos ou da wwk mas o Hype sobre ias
continua num estágio muito primitivo de
discussão esse episódio patético foi a
diretoria da Open ai de emitir o CEO Sam
altman Sem Explicação nenhuma fazendo um
drama para depois voltarem atrás
quando todos os funcionários ameaçaram
sair e irem pra Microsoft ninguém deu
uma razão oficial para isso até agora
mas alguns especulam que tem a ver com
os riscos de estarem próximos de
atingirem a tal da agi ou Inteligência
Artificial geral a temida Skynet o que
se chama de ia hoje em dia são large
language models llms e llms são
basicamente como o aut corretor do
teclado do seu celular mais altamente
glorificado ele cospe coisas que parecem
ter sentido mas não houve Um milímetro
de cognição envolvida muito menos
consciência provavelmente amebas tem
mais consciência do que o melhor llm de
hoje explico isso em detalhes no meu
vídeo de como o chat GPT funciona depois
assistam para entender modelos são
embeds de textos matrizes
hiperdimensional de de pedaços de textos
Associados com valores probabilísticos
em resumo super resumido é assim que um
GPT gera textos GPT é um gerador de
textos sim um gerador Ultra sofisticado
mas ainda assim um gerador de textos não
existe inteligência no sentido humano
que envolve raciocínio ou cognição GPT
só continua o texto a partir de onde
você parou de digitar ele continua
textos a ideia toda de gerar seu próprio
GPT eu mostrei na Live que tá no meu
canal de ias são perigosas onde eu
mostro como criar um personagem eu criei
o John carmack e comecei a conversar com
ele assistam lá depois é a mesma coisa
no GPT 4 um prompt Inicial dizendo Faça
de conta que você é a pessoa Fulano com
comportamento assim ou assado e aí ele
continua o texto mesmo com os avanços do
GPT 4 mesmo se o GPT 5 for o dobro ou
triplo ou 10 vezes melhor que GPT 4
ainda assim não estamos pertos da tal
agi que é a inteligência artificial
geral a verdadeira consciência digital
que simula perfeitamente um ser vivo com
emoções e ambições a semente da Skynet
isso continua sendo ficção científica
Ainda faltam descobertas e breakthroughs
que não foram feitos não sabemos quais
descobertas são obviamente senão não
seriam descobertas mas sabemos que
faltam ao contrário do que as pessoas
pensam nós Engenheiros e cientistas não
fazemos as coisas a cegas aleatoriamente
sabemos quais os limites do que pode ser
feito com as ferramentas que temos
imaginação é exatamente uma das coisas
que nós sabemos fazer muito bem e que
ias não tem
capacidade mesmo assim muita gente
considerada gênio da área como um dos
fundadores da Open ai o ilia por alguma
razão resolveu aderir a crença de que
estamos perigosamente próximos de uma
agi que vai prejudicar a espécie humana
não vai não só tá longe como neste
estágio eu nem diria que temos certeza
se isso é sequer possível para começar
não existe nem boas definições para o
que caracteriza de fato coisas como
inteligência ou consciência nossas
definições hoje são extremamente
primitivas ainda é o mesmo tipo de gênio
que anos atrás ficava enchendo o saco
dizendo que o aquecimento global já
teria acabado com o mundo em 2023 Mas
isso é outro assunto mesmo assim sim os
receios que ias vão substituir o emprego
de muita gente são reais em particular
porque existem muitas atividades que são
meramente copy e paste muito simples de
serem automatizadas não porque a ia
ficou inteligente demais mas porque os
trabalhos em si eram muito simples não
precisou de ia para começar a substituir
caixa de supermercado ou tirar pedido em
fast food muitos mercados já TM caixas
self-service lugares como McDonald's já
já tem telas gigantes de pedidos self
service muitos botes de atendimento Via
Whatsapp já substituíram gente que
atendia telefone e por aí vai e isso é
normal faz mais de século que estamos
substituindo trabalhos de baixo valor
agregado para sistemas automatizados E
para isso não precisa de ia a geração
atual de L lems ajuda com toda certeza
no nosso caso de programadores sim
também existe automação mesmo em design
todo mundo que usa softwares como canva
já sabe disso o que antes precisava
pedir para alguém abrir o Photoshop para
fazer qualquer um sem nenhum treinamento
já consegue fazer agora quem é de
Photoshop lembra como separar uma pessoa
do fundo antigamente levava horas
precisava de técnicas avançadas com
lidar com canais de separação de cor
agora o app de câmera do iPhone ou Pixel
já conseguem fazer isso com um clique
mesmo antes de ia com serviços como
squarespace muita gente não técnica já
consegue fazer sites minimamente bonitos
o mercado de templates por si só
barateou bastante o que antes era um
trabalho caro e demorado pra maioria das
pessoas só isso já é suficiente e de
novo nem precisamos de ia para isso isso
tudo dito as ferramentas baseadas em
alguma coisa de ia de hoje são
extremamente úteis chat GPT e llms São
só um dos tipos de ia mas não são os
únicos tipos muitas ferramentas que usam
modelos de ia não são baseados em llms
Porque não são geradores de conteúdo
alguns usam machine learning alguns usam
Deep learning alguns usam combinações de
diversas técnicas a população leiga
chama tudo isso só de ia por isso gera
tanta confusão mas ia não é uma entidade
única é uma coleção de diversas
tecnologias diferentes trabalhando em
conjunto Muitas delas com decadas de
idade já se não ficou Claro Este vídeo
que você está assistindo Por Exemplo foi
inteiramente gerado com auxílio de ia
Estou usando o site Hey jum com que foi
treinado com trechos de vídeos antigos
esse site se integra com outro chamado
Eleven laabs que é especializado em
vozes via ia então só precisamos
escrever um novo script subir trechos no
reyen e ir gerando pedaços porque ele
não deixa gerar vídeos muito longos
ainda no final jogamos no da 20 resolve
de sempre para juntar os pedaços num
único vídeo Sim tudo que você assistiu
até aqui foi inteiramente gerado por ia
eu sou um avatar de
Fábio o Fábio de verdade foi sequestrado
e vou mantê-lo como refém
até estou brincando Claro claro se
duvida que sou ma o re pode fazer outra
coisa dublar qualquer áudio em qualquer
outra
língua
não se convenceram Então vamos ver de
novo só que
dublado Interessante não é assim que
muitos vídeos no tikt são feitos hoje e
já que estou falando de vde diversas
marcas famosas como black Magic e Adobe
já integraram funcionalidades de ia num
D 20 resolve ou Adobe Photoshop da vida
no resolve por exemplo ele consegue
coisas incríveis como reilin uma cena
Imagine que faltou uma luz de um lado o
que fazer a ia consegue analisar a cena
descobrir a profundidade dos objetos
filmados num espaço 3D e com isso
podemos posicionar uma nova luz em
qualquer lugar não achou isso
Interessante este trecho eu gravei com
barulho de fundo para simular gravação
na rua ou em eventos o da 20 é capaz de
separar sua voz do resto do barulho e a
qualidade fica quase como se tivesse
sido gravado em estúdio Vamos repetir
com o filtro este trecho eu gravei com
barulho de fundo para simular gravação
na rua ou em eventos o da 20 é capaz de
separar sua voz do resto do barulho e a
qualidade fica quase como se tivesse
sido gravado em estúdio viram e dá para
fazer muito mais gerar legendas antes
era manual Mas agora ele faz
automaticamente para mim como neste
trecho se você é editor de vídeo deveria
explorar essas opções dois canais do
YouTube que recomendo assistir para
aprender é o Mr Alex Tech e o do cas
Feris sobre colorização o melhor
profissional é o wakas cazi Adobe também
não fica atrás para começar existe agora
esse novo produto Adobe firefly que é
como um d dois ou mid Journey mas que a
Adobe garante que foi treinada só com
imagens cujos direitos autorais permitem
isso assim você não corre o risco de
gerar uma imagem que depois pode te
levar a ser processado Photoshop também
tá ganhando várias novas funcionalidades
de ya um dos mais notáveis é o
preenchimento de conteúdo Antigamente
ele usava pedaços da própria imagem para
preencher o vazio quando queríamos mudar
as dimensões da imagem Mas agora ele
consegue redesenhar como faz um mid
Journey com uma qualidade até que bem
aceitável em vários casos precisando
fazer muito pouco ajuste depois a melhor
ferramenta de edição de imagens ainda é
photoshop e tem dezenas de técnicas e
teorias que precisa saber para usar
direito recomendo assistir o canal Pixel
imperfect que ensina algumas das
melhores técnicas sobre geração de
textos não preciso perder tempo
explicando como chat GPT é ótimo para
fazer resumos escrever textos
descartáveis como um e-mail mais formal
mesma coisa vale pro github CoPilot
espero que vocês já tenham deixado para
trás a ideia idiota de achar que essas
ferramentas vão substituir todos os
programadores Como já disse nos vídeos
anteriores minha resposta é a mesma toda
atividade de baixo valor agregado
inclusive programação de baixo valor Vai
sim ser substituído bons programadores
não nenhum gerador de texto chega a 10%
de um programador de verdade mas o que
ele faz já nos ajuda bastante eu não
preciso ficar toda hora dando Alt Tab
pra documentação e ficar manualmente
procurando a sintaxe dessa ou daquela
função o CoPilot autocompleta direitinho
é basicamente automatizar o copy e paste
de stack overflow que todo mundo já
fazia para fazer coisas como htmls
básicos que é sempre a mesma estrutura
CSS básico que é sempre a mesma
estrutura códigos de testes unitários
que é sempre a mesma estrutura essas
coisas repetitivas e trabalhosas o
copilote ajuda bastante muita coisa que
eu sempre achei tedioso um CoPilot ou
GPT ajuda muito e recomendo que usem
integração com visual Studio até convin
já funcionam super bem mais do que isso
recomendo instalar GPT em linha de
comando Como aat assim do terminal posso
perguntar sobre comandos que não lembro
todas as opções de cabeça como que roda
um contêiner docker de tal forma que ele
Apague o contêiner depois que eu
terminar para não deixar sujeira para
trás só perguntar copiar o comando e já
colar direto no terminal e pronto lógico
como sempre nada disso serve para quem
não presta atenção Se não tomar cuidado
você vai estragar sua máquina colando
comandos sem saber o que fazem mas isso
já acontecia quando você colava comandos
do stack overflow se não sabe discernir
nem isso obviamente não é um
profissional de programação finalmente
uma das limitações do chat GPT pelo
menos até a versão atual é que ele não
guarda memória do que você conversou com
ele toda nova conversa começa do zero
ele não usa informações anteriores para
continuar respondendo mas existem
dezenas de ferramentas que aumentam
essas capacidades um desses exemplos é o
isel io nesse site podemos fazer upload
de documentos como Word ou PDF ele vai
processar essa informação criar em Bed
dos textos colocar num banco de dados de
vetores e usar essa informação no chat
que é integrado com chat GPT assim
podemos fazer perguntas em linguagem
natural sobre os dados que acabamos de
subir pense subir uma centena de
relatórios de feedback da empresa e
pedir um resumo de tudo ou perguntar
sobre uma pessoa em particular e coisas
assim não vou sair listando toda a
ferramenta integrada com chat GPT porque
várias aparecem e várias desaparecem
todos os dias é melhor ir no Google e
procurar as ferramentas mais famosinhas
da época esse ainda é um mercado Super
volátil eel 11 Labs Hey genen talvez
ainda existam daqui um ano talvez já
tenham sido substituídos por
alternativas melhores não temos como
saber como falei no começo Este é um
vídeo curto foi só para cagar regr sobre
ia e experimentar como ficaria um
episódio inteiro feito com ia quem sabe
embora a Gi não seja mais que ficção
científica ainda o que temos hoje já é
muito bom e já serve até para fazer
vídeos como este eu consigo ver estas
ferramentas sendo aprimoradas para
gerarem resultados mais naturais do
jeito que tá hoje os mais desavisados já
nem sabem mais a diferença entre real e
virtual se curtiram o vídeo deixem um
join assinem o canal cliquem no Sininho
e compartilhem com seus amigos a gente
se vê até mais
5.0 / 5 (0 votes)