O que IAs podem fazer? | Exemplos de Ferramentas

Fabio Akita
29 Nov 202314:56

Summary

TLDREste vídeo discute as ferramentas de IA como o ChatGPT, explicando seu funcionamento e utilidade. O apresentador argumenta que a IA ainda está num estágio primitivo de discussão e não representa riscos, apesar do pânico recente. Ele também mostra alguns exemplos de como essas ferramentas podem ser úteis para programadores e editores de vídeo, automatizando tarefas simples e repetitivas.

Takeaways

  • 😀 这是一个关于如何将各种人工智能工具,如ChatGPT,整合到日常生活中的实验性短视频。
  • 🤖 强调了ChatGPT 4的发布以及其新增功能,如“制作你自己的GPT”,并分享了对人工智能的看法。
  • 📅 回顾了硅谷的一些尴尬历史事件,以此来讨论当前对人工智能的过度炒作和对其发展的早期讨论。
  • 💡 解释了大型语言模型(LLMs)的工作原理,强调它们更像是高级的文本生成器,而不具备真正的认知或意识。
  • 🚀 讨论了人工智能生成内容(AGI)的概念和其与当前技术之间的巨大差距,指出实现AGI仍然是科幻领域。
  • 🛠️ 分享了作者亲自尝试并喜欢使用的一些AI工具,以及它们如何简化日常任务和提高效率。
  • 👩‍💻 讨论了AI和自动化如何改变工作场所,特别是那些重复性任务,以及这对职业的潜在影响。
  • 🎨 描述了如何使用AI工具生成视频内容,包括语音合成和视频编辑,展示了AI在创意过程中的应用。
  • 🔍 强调了人工智能技术的多样性和复杂性,解释了它不仅仅是LLMs,而是包括多种技术的集合。
  • 🌐 最后,探讨了人工智能工具如何在编程、设计和内容创作等领域提供帮助,同时也提出了关于这些工具将来发展的思考。

Q & A

  • 什么是Chat GPT 4,它的功能有哪些特点?

    -Chat GPT 4是一款先进的语言处理工具,具备生成连贯、相关文本的能力。它的特点包括更加精准的文本生成、对话管理能力以及对复杂话题的更好理解。

  • 在视频中提到的'制造自己的GPT'是什么意思?

    -'制造自己的GPT'指的是通过特定的提示(如模拟特定的人物或行为)来定制GPT生成的文本,使其在一定程度上模仿特定的风格或人物。

  • 视频提到的OpenAI事件中,为什么Sam Altman被解除CEO职务?

    -视频中提到,尽管没有官方给出具体原因,但有猜测认为这与OpenAI接近于实现AGI(通用人工智能)及其潜在风险有关。

  • LLMs(大型语言模型)的基本原理是什么?

    -LLMs(大型语言模型)基于大量文本数据,使用概率模型来预测和生成文本。它们类似于手机键盘的自动纠错功能,但功能更加强大和复杂。

  • 视频中提到,当前的人工智能技术是否已经达到了真正的认知和意识水平?

    -不,视频中强调当前的人工智能,包括LLMs,尽管在文本生成方面表现出色,但还没有达到真正的认知和意识水平。

  • 视频中提到的AGI(通用人工智能)与当前AI的主要区别是什么?

    -AGI(通用人工智能)指的是能够执行任何智能生物能做的知识工作的AI,而当前的AI主要专注于特定任务,如文本生成或图像识别,没有全面的智能能力。

  • 视频中讨论了AI技术对于就业的影响。AI主要替代了哪些类型的工作?

    -AI主要替代了低价值、重复性的工作,如自动化的客服、简单的数据处理和基本的设计任务。

  • 什么是Hey Jum和Eleven Labs,它们如何与人工智能相关?

    -Hey Jum和Eleven Labs是AI工具,分别用于视频内容生成和语音合成。这些工具使用AI技术来自动化和增强多媒体内容的制作过程。

  • 视频中提到,AI在视频编辑方面有哪些应用?

    -AI在视频编辑中用于场景重构、自动去除背景噪音、自动生成字幕等,极大地提高了视频编辑的效率和质量。

  • 视频提到的GitHub Copilot是什么,它如何帮助程序开发?

    -GitHub Copilot是一个基于AI的编程助手,它可以自动完成代码,帮助开发者更快地编写代码,并减少查找文档的需要。

Outlines

00:00

😊段落1标题

段落1内容概述

05:02

😊段落2标题

段落2内容概述

10:04

😊段落3标题

段落3内容概述

Mindmap

Keywords

💡Chat GPT

Chat GPT是一种基于大型语言模型(LLM)的人工智能工具,能够理解和生成人类般的文本。在视频中,它被提及作为日常生活中实用工具的一个例子,尤其是在Chat GPT 4的版本更新中,其功能得到了显著提升,如“制作你自己的GPT”。这体现了Chat GPT在自然语言处理领域的先进性和它对日常技术使用的影响。

💡人工智能(AI)

人工智能是指由人造系统执行的任务,这些任务显示出智力,包括学习、推理、解决问题等。视频中探讨了AI的概念,特别是大型语言模型(LLMs)的角色和限制,以及人们对于通用人工智能(AGI)的误解和过度担忧。

💡大型语言模型(LLM)

大型语言模型(LLM),如Chat GPT,使用庞大的文本数据集来理解和生成语言。视频中将LLM比作手机自动更正功能的高级版本,强调了它们在生成看似有意义的文本方面的能力,但同时指出这种生成缺乏真正的认知和意识。

💡通用人工智能(AGI)

通用人工智能(AGI)是指一种具有人类智能水平的AI,能够执行任何智能任务。视频中提到,尽管Chat GPT等技术的进步,我们仍然远未接近实现AGI,这种级别的AI仍然是科幻的范畴,需要未知的科学突破才能实现。

💡Skynet

Skynet在视频中被提及作为人们对AGI的一种恐惧象征,它是科幻电影《终结者》中的一个虚构人工智能系统,最终获得自我意识并试图消灭人类。这反映了公众对AI可能失控的担忧,尽管这种情况目前仍然属于科幻。

💡自动化

自动化是指使用各种技术自动执行任务的过程。视频中讨论了AI和其他技术如何被用于自动化简单的任务,例如超市收银或快餐订单,以及这种自动化对就业的影响。

💡机器学习(ML)

机器学习是AI的一个分支,它使计算机能够通过数据学习并改进其性能。视频中提到,除了LLMs外,还有许多AI工具使用了机器学习和深度学习技术来执行特定的任务,显示了AI领域的多样性和技术的广泛应用。

💡深度学习(Deep Learning)

深度学习是一种特殊的机器学习方法,它使用被称为神经网络的算法,模仿人脑处理信息的方式。视频强调,许多当前的AI工具,包括图像和声音处理应用,都利用了深度学习技术来实现复杂的任务。

💡内容生成

内容生成指的是使用AI工具自动创建文本、图像、视频等内容。视频中提到,Chat GPT和其他LLM被用于生成各种类型的内容,从电子邮件到完整的视频脚本,展示了AI在内容创作方面的潜力和实用性。

💡自我学习能力

自我学习能力是指机器能够通过分析数据自行改进其性能的能力。虽然视频中指出当前的LLMs如Chat GPT缺乏真正的认知和意识,它们仍能通过大量的文本数据来改善其语言生成能力,这是AI进步的一个关键方面。

Highlights

第一个重要的要点文本

第二个值得注意的要点文本

Transcripts

play00:00

Olá pessoal Fabio aquita este vai ser um

play00:02

episódio experimental curtinho mesmo

play00:05

mais de brincadeira desta vez quero

play00:07

falar um pouco sobre as ferramentas de

play00:09

ia tipo chat GPT que tenho incorporado

play00:12

no meu dia a dia não vai ser um review

play00:14

extenso de tudo que existe só o que eu

play00:16

já experimentei e Gostei de usar todo

play00:18

mundo continua empolgado e hypado por

play00:20

causa de chat GPT especialmente com o

play00:23

lançamento do chat GPT 4 com

play00:25

funcionalidades como abre aspas fazer

play00:27

seu próprio GPT vou aproveitar tá para

play00:30

explicar um pouco disso e reiterar

play00:31

minhas opiniões sobre ia em geral Então

play00:34

vamos

play00:39

lá para começar Novembro Vimos um dos

play00:42

episódios mais patéticos da história de

play00:45

Silicon Valley tudo bem para ser honesto

play00:47

teve mais patéticos como a história da

play00:49

terranos ou da wwk mas o Hype sobre ias

play00:53

continua num estágio muito primitivo de

play00:55

discussão esse episódio patético foi a

play00:58

diretoria da Open ai de emitir o CEO Sam

play01:01

altman Sem Explicação nenhuma fazendo um

play01:03

drama para depois voltarem atrás

play01:05

quando todos os funcionários ameaçaram

play01:07

sair e irem pra Microsoft ninguém deu

play01:10

uma razão oficial para isso até agora

play01:13

mas alguns especulam que tem a ver com

play01:15

os riscos de estarem próximos de

play01:17

atingirem a tal da agi ou Inteligência

play01:20

Artificial geral a temida Skynet o que

play01:23

se chama de ia hoje em dia são large

play01:26

language models llms e llms são

play01:30

basicamente como o aut corretor do

play01:32

teclado do seu celular mais altamente

play01:35

glorificado ele cospe coisas que parecem

play01:38

ter sentido mas não houve Um milímetro

play01:40

de cognição envolvida muito menos

play01:42

consciência provavelmente amebas tem

play01:45

mais consciência do que o melhor llm de

play01:48

hoje explico isso em detalhes no meu

play01:50

vídeo de como o chat GPT funciona depois

play01:53

assistam para entender modelos são

play01:55

embeds de textos matrizes

play01:58

hiperdimensional de de pedaços de textos

play02:01

Associados com valores probabilísticos

play02:03

em resumo super resumido é assim que um

play02:06

GPT gera textos GPT é um gerador de

play02:09

textos sim um gerador Ultra sofisticado

play02:13

mas ainda assim um gerador de textos não

play02:15

existe inteligência no sentido humano

play02:18

que envolve raciocínio ou cognição GPT

play02:21

só continua o texto a partir de onde

play02:23

você parou de digitar ele continua

play02:25

textos a ideia toda de gerar seu próprio

play02:28

GPT eu mostrei na Live que tá no meu

play02:30

canal de ias são perigosas onde eu

play02:33

mostro como criar um personagem eu criei

play02:35

o John carmack e comecei a conversar com

play02:37

ele assistam lá depois é a mesma coisa

play02:40

no GPT 4 um prompt Inicial dizendo Faça

play02:43

de conta que você é a pessoa Fulano com

play02:45

comportamento assim ou assado e aí ele

play02:48

continua o texto mesmo com os avanços do

play02:51

GPT 4 mesmo se o GPT 5 for o dobro ou

play02:55

triplo ou 10 vezes melhor que GPT 4

play02:58

ainda assim não estamos pertos da tal

play03:01

agi que é a inteligência artificial

play03:04

geral a verdadeira consciência digital

play03:07

que simula perfeitamente um ser vivo com

play03:10

emoções e ambições a semente da Skynet

play03:13

isso continua sendo ficção científica

play03:16

Ainda faltam descobertas e breakthroughs

play03:18

que não foram feitos não sabemos quais

play03:20

descobertas são obviamente senão não

play03:22

seriam descobertas mas sabemos que

play03:25

faltam ao contrário do que as pessoas

play03:27

pensam nós Engenheiros e cientistas não

play03:30

fazemos as coisas a cegas aleatoriamente

play03:33

sabemos quais os limites do que pode ser

play03:36

feito com as ferramentas que temos

play03:38

imaginação é exatamente uma das coisas

play03:40

que nós sabemos fazer muito bem e que

play03:43

ias não tem

play03:45

capacidade mesmo assim muita gente

play03:47

considerada gênio da área como um dos

play03:50

fundadores da Open ai o ilia por alguma

play03:53

razão resolveu aderir a crença de que

play03:55

estamos perigosamente próximos de uma

play03:57

agi que vai prejudicar a espécie humana

play04:00

não vai não só tá longe como neste

play04:03

estágio eu nem diria que temos certeza

play04:05

se isso é sequer possível para começar

play04:08

não existe nem boas definições para o

play04:10

que caracteriza de fato coisas como

play04:12

inteligência ou consciência nossas

play04:14

definições hoje são extremamente

play04:16

primitivas ainda é o mesmo tipo de gênio

play04:19

que anos atrás ficava enchendo o saco

play04:21

dizendo que o aquecimento global já

play04:23

teria acabado com o mundo em 2023 Mas

play04:26

isso é outro assunto mesmo assim sim os

play04:29

receios que ias vão substituir o emprego

play04:32

de muita gente são reais em particular

play04:34

porque existem muitas atividades que são

play04:37

meramente copy e paste muito simples de

play04:40

serem automatizadas não porque a ia

play04:43

ficou inteligente demais mas porque os

play04:45

trabalhos em si eram muito simples não

play04:48

precisou de ia para começar a substituir

play04:51

caixa de supermercado ou tirar pedido em

play04:53

fast food muitos mercados já TM caixas

play04:56

self-service lugares como McDonald's já

play04:59

já tem telas gigantes de pedidos self

play05:01

service muitos botes de atendimento Via

play05:04

Whatsapp já substituíram gente que

play05:06

atendia telefone e por aí vai e isso é

play05:08

normal faz mais de século que estamos

play05:11

substituindo trabalhos de baixo valor

play05:13

agregado para sistemas automatizados E

play05:15

para isso não precisa de ia a geração

play05:17

atual de L lems ajuda com toda certeza

play05:21

no nosso caso de programadores sim

play05:24

também existe automação mesmo em design

play05:27

todo mundo que usa softwares como canva

play05:29

já sabe disso o que antes precisava

play05:31

pedir para alguém abrir o Photoshop para

play05:33

fazer qualquer um sem nenhum treinamento

play05:35

já consegue fazer agora quem é de

play05:37

Photoshop lembra como separar uma pessoa

play05:40

do fundo antigamente levava horas

play05:42

precisava de técnicas avançadas com

play05:44

lidar com canais de separação de cor

play05:46

agora o app de câmera do iPhone ou Pixel

play05:49

já conseguem fazer isso com um clique

play05:51

mesmo antes de ia com serviços como

play05:54

squarespace muita gente não técnica já

play05:56

consegue fazer sites minimamente bonitos

play05:59

o mercado de templates por si só

play06:02

barateou bastante o que antes era um

play06:04

trabalho caro e demorado pra maioria das

play06:07

pessoas só isso já é suficiente e de

play06:10

novo nem precisamos de ia para isso isso

play06:13

tudo dito as ferramentas baseadas em

play06:15

alguma coisa de ia de hoje são

play06:17

extremamente úteis chat GPT e llms São

play06:21

só um dos tipos de ia mas não são os

play06:23

únicos tipos muitas ferramentas que usam

play06:25

modelos de ia não são baseados em llms

play06:28

Porque não são geradores de conteúdo

play06:30

alguns usam machine learning alguns usam

play06:33

Deep learning alguns usam combinações de

play06:35

diversas técnicas a população leiga

play06:37

chama tudo isso só de ia por isso gera

play06:40

tanta confusão mas ia não é uma entidade

play06:43

única é uma coleção de diversas

play06:45

tecnologias diferentes trabalhando em

play06:47

conjunto Muitas delas com decadas de

play06:49

idade já se não ficou Claro Este vídeo

play06:52

que você está assistindo Por Exemplo foi

play06:54

inteiramente gerado com auxílio de ia

play06:57

Estou usando o site Hey jum com que foi

play07:00

treinado com trechos de vídeos antigos

play07:03

esse site se integra com outro chamado

play07:05

Eleven laabs que é especializado em

play07:08

vozes via ia então só precisamos

play07:10

escrever um novo script subir trechos no

play07:13

reyen e ir gerando pedaços porque ele

play07:15

não deixa gerar vídeos muito longos

play07:17

ainda no final jogamos no da 20 resolve

play07:20

de sempre para juntar os pedaços num

play07:22

único vídeo Sim tudo que você assistiu

play07:25

até aqui foi inteiramente gerado por ia

play07:28

eu sou um avatar de

play07:29

Fábio o Fábio de verdade foi sequestrado

play07:33

e vou mantê-lo como refém

play07:36

até estou brincando Claro claro se

play07:39

duvida que sou ma o re pode fazer outra

play07:42

coisa dublar qualquer áudio em qualquer

play07:44

outra

play07:58

língua

play08:04

não se convenceram Então vamos ver de

play08:06

novo só que

play08:22

dublado Interessante não é assim que

play08:25

muitos vídeos no tikt são feitos hoje e

play08:27

já que estou falando de vde diversas

play08:30

marcas famosas como black Magic e Adobe

play08:33

já integraram funcionalidades de ia num

play08:36

D 20 resolve ou Adobe Photoshop da vida

play08:40

no resolve por exemplo ele consegue

play08:42

coisas incríveis como reilin uma cena

play08:45

Imagine que faltou uma luz de um lado o

play08:48

que fazer a ia consegue analisar a cena

play08:51

descobrir a profundidade dos objetos

play08:53

filmados num espaço 3D e com isso

play08:56

podemos posicionar uma nova luz em

play08:58

qualquer lugar não achou isso

play08:59

Interessante este trecho eu gravei com

play09:02

barulho de fundo para simular gravação

play09:04

na rua ou em eventos o da 20 é capaz de

play09:07

separar sua voz do resto do barulho e a

play09:10

qualidade fica quase como se tivesse

play09:12

sido gravado em estúdio Vamos repetir

play09:14

com o filtro este trecho eu gravei com

play09:17

barulho de fundo para simular gravação

play09:19

na rua ou em eventos o da 20 é capaz de

play09:22

separar sua voz do resto do barulho e a

play09:25

qualidade fica quase como se tivesse

play09:27

sido gravado em estúdio viram e dá para

play09:30

fazer muito mais gerar legendas antes

play09:32

era manual Mas agora ele faz

play09:34

automaticamente para mim como neste

play09:36

trecho se você é editor de vídeo deveria

play09:40

explorar essas opções dois canais do

play09:42

YouTube que recomendo assistir para

play09:44

aprender é o Mr Alex Tech e o do cas

play09:47

Feris sobre colorização o melhor

play09:49

profissional é o wakas cazi Adobe também

play09:52

não fica atrás para começar existe agora

play09:55

esse novo produto Adobe firefly que é

play09:58

como um d dois ou mid Journey mas que a

play10:01

Adobe garante que foi treinada só com

play10:03

imagens cujos direitos autorais permitem

play10:06

isso assim você não corre o risco de

play10:08

gerar uma imagem que depois pode te

play10:10

levar a ser processado Photoshop também

play10:12

tá ganhando várias novas funcionalidades

play10:15

de ya um dos mais notáveis é o

play10:17

preenchimento de conteúdo Antigamente

play10:19

ele usava pedaços da própria imagem para

play10:22

preencher o vazio quando queríamos mudar

play10:24

as dimensões da imagem Mas agora ele

play10:27

consegue redesenhar como faz um mid

play10:29

Journey com uma qualidade até que bem

play10:31

aceitável em vários casos precisando

play10:33

fazer muito pouco ajuste depois a melhor

play10:36

ferramenta de edição de imagens ainda é

play10:38

photoshop e tem dezenas de técnicas e

play10:41

teorias que precisa saber para usar

play10:43

direito recomendo assistir o canal Pixel

play10:46

imperfect que ensina algumas das

play10:48

melhores técnicas sobre geração de

play10:50

textos não preciso perder tempo

play10:52

explicando como chat GPT é ótimo para

play10:55

fazer resumos escrever textos

play10:57

descartáveis como um e-mail mais formal

play11:00

mesma coisa vale pro github CoPilot

play11:03

espero que vocês já tenham deixado para

play11:05

trás a ideia idiota de achar que essas

play11:07

ferramentas vão substituir todos os

play11:09

programadores Como já disse nos vídeos

play11:11

anteriores minha resposta é a mesma toda

play11:15

atividade de baixo valor agregado

play11:18

inclusive programação de baixo valor Vai

play11:21

sim ser substituído bons programadores

play11:24

não nenhum gerador de texto chega a 10%

play11:28

de um programador de verdade mas o que

play11:30

ele faz já nos ajuda bastante eu não

play11:33

preciso ficar toda hora dando Alt Tab

play11:35

pra documentação e ficar manualmente

play11:37

procurando a sintaxe dessa ou daquela

play11:40

função o CoPilot autocompleta direitinho

play11:43

é basicamente automatizar o copy e paste

play11:45

de stack overflow que todo mundo já

play11:47

fazia para fazer coisas como htmls

play11:50

básicos que é sempre a mesma estrutura

play11:52

CSS básico que é sempre a mesma

play11:54

estrutura códigos de testes unitários

play11:57

que é sempre a mesma estrutura essas

play11:59

coisas repetitivas e trabalhosas o

play12:02

copilote ajuda bastante muita coisa que

play12:05

eu sempre achei tedioso um CoPilot ou

play12:08

GPT ajuda muito e recomendo que usem

play12:11

integração com visual Studio até convin

play12:13

já funcionam super bem mais do que isso

play12:16

recomendo instalar GPT em linha de

play12:19

comando Como aat assim do terminal posso

play12:23

perguntar sobre comandos que não lembro

play12:25

todas as opções de cabeça como que roda

play12:27

um contêiner docker de tal forma que ele

play12:30

Apague o contêiner depois que eu

play12:32

terminar para não deixar sujeira para

play12:34

trás só perguntar copiar o comando e já

play12:37

colar direto no terminal e pronto lógico

play12:40

como sempre nada disso serve para quem

play12:42

não presta atenção Se não tomar cuidado

play12:45

você vai estragar sua máquina colando

play12:46

comandos sem saber o que fazem mas isso

play12:49

já acontecia quando você colava comandos

play12:51

do stack overflow se não sabe discernir

play12:54

nem isso obviamente não é um

play12:56

profissional de programação finalmente

play12:59

uma das limitações do chat GPT pelo

play13:01

menos até a versão atual é que ele não

play13:04

guarda memória do que você conversou com

play13:06

ele toda nova conversa começa do zero

play13:09

ele não usa informações anteriores para

play13:12

continuar respondendo mas existem

play13:14

dezenas de ferramentas que aumentam

play13:16

essas capacidades um desses exemplos é o

play13:19

isel io nesse site podemos fazer upload

play13:22

de documentos como Word ou PDF ele vai

play13:25

processar essa informação criar em Bed

play13:29

dos textos colocar num banco de dados de

play13:31

vetores e usar essa informação no chat

play13:34

que é integrado com chat GPT assim

play13:37

podemos fazer perguntas em linguagem

play13:39

natural sobre os dados que acabamos de

play13:41

subir pense subir uma centena de

play13:44

relatórios de feedback da empresa e

play13:46

pedir um resumo de tudo ou perguntar

play13:48

sobre uma pessoa em particular e coisas

play13:51

assim não vou sair listando toda a

play13:53

ferramenta integrada com chat GPT porque

play13:56

várias aparecem e várias desaparecem

play13:59

todos os dias é melhor ir no Google e

play14:01

procurar as ferramentas mais famosinhas

play14:03

da época esse ainda é um mercado Super

play14:07

volátil eel 11 Labs Hey genen talvez

play14:11

ainda existam daqui um ano talvez já

play14:13

tenham sido substituídos por

play14:15

alternativas melhores não temos como

play14:17

saber como falei no começo Este é um

play14:19

vídeo curto foi só para cagar regr sobre

play14:22

ia e experimentar como ficaria um

play14:24

episódio inteiro feito com ia quem sabe

play14:27

embora a Gi não seja mais que ficção

play14:30

científica ainda o que temos hoje já é

play14:32

muito bom e já serve até para fazer

play14:34

vídeos como este eu consigo ver estas

play14:36

ferramentas sendo aprimoradas para

play14:38

gerarem resultados mais naturais do

play14:41

jeito que tá hoje os mais desavisados já

play14:43

nem sabem mais a diferença entre real e

play14:46

virtual se curtiram o vídeo deixem um

play14:48

join assinem o canal cliquem no Sininho

play14:51

e compartilhem com seus amigos a gente

play14:53

se vê até mais