Generative AI is just the Beginning AI Agents are what Comes next | Daoud Abdel Hadi | TEDxPSUT

TEDx Talks
20 Mar 202413:16

Summary

TLDRこのスクリプトは、AIと特に機械学習の進歩を説明し、GPT-3の登場以来の大きな一歩を強調しています。AIは従来のように特殊なタスクに限定されていなく、自然言語を使用してパターンを認識し、理論的に人間のようになります。AIの現在の状態と、将来的には自動化されたエージェントとして機能する可能性についても説明しています。これらのエージェントは、エンドツーエンドのワークフローを自動化し、人間の介入を最小限に抑えます。スクリプトでは、AIが私たちの生活やビジネスにどのように影響を与えるかを具体的に示しています。

Takeaways

  • 🎓 脚本の主人公はAIの硕士号を接近し、AIが真の知能を持ち得るまでの距離が遠いと感じていた。
  • 🤖 AIは診断、詐欺検知、交通最適化など多くの分野で役立つが、特定のタスクに特化しており、人間のように一般化能力が低い。
  • 🚀 2年後にOpenAIがGPT-3をリリースし、AIの大きな進化をもたらした。
  • 📚 GPT-3は書籍、記事、研究論文などをデータとして、強力なコンピュータで訓練された大規模な言語モデル。
  • 💡 GPT-3は自然言語で文章を書く、質問に答え、コードを読み書きすることができ、知能の兆候を見せる。
  • 🤔 GPT-3は完璧ではない。事実をでっち上げる「幻觉」を起こすことがあり、情報が古く、基本的な数学の問題にも苦戦する。
  • 🧠 人間は問題解決能力を持っている。それは知識だけではなく、計画能力、問題を小分けする能力、行動の結果を反映する能力、ツールの使用能力が関与している。
  • 🤖 AIをチャットボットではなく、自主的なエージェントとして考えると、ワークフローを自動化し、人間の介入が少なくなります。
  • 🛠️ エージェントは、AIが使用するツールを自分で選択し、使い方を決定し、自主的に実行する。
  • 🌐 エージェントの可能性は、ウェブ開発やデータ分析、旅行計画など、様々なタスクを自動化することにある。
  • 📈 技術の発展により、エージェントは私たち生活にますます近づいている。MicrosoftのCopilotやShopifyのSidekickなどが既に存在している。
  • 🌟 AIの発展により、コンピュータとの交渉方法が変わり、より協力的な関係になる可能性がある。

Q & A

  • AIが真の知能を持ち得るに至ったカギは何ですか?

    -AIが真の知能を持ち得るカギは、大規模な言語モデルGPT-3の登場です。これにより、AIは自然言語を理解し、様々なトピックの質問に答え、コードを書く、または記事、歌、詩を書くことができるようになりました。

  • GPT-3がリリースされる前に、AIが人間の仕事を完全に自動化するという考えはどのように見えましたか?

    -GPT-3がリリースされる前は、AIが人間の仕事を完全に自動化するという考えは非常に遠いものと見えました。AIは特定のタスクに特化したものであり、人間のように他のタスクに簡単に一般化することができませんでした。

  • GPT-3がもたらしたAIの進化は何ですか?

    -GPT-3がもたらしたAIの進化は、AIが単なる専門家から、自然言語を用いて様々なタスクを理解し、実行するようになることでした。これにより、AIはプログラミングする必要なく、自然に文章を書き、問題を解決する能力を獲得しました。

  • GPT-3が得意とすることは何ですか?

    -GPT-3は自然に文章を書き、幅広いトピックの質問に答え、コードを書くことができるようになっています。また、記事、歌、詩など様々な形の書き込みを行うことができます。

  • GPT-3がまだ完璧ではない理由は何ですか?

    -GPT-3はまだ完璧ではない理由は、事実を架空することや、情報が古くなること、基本的な数学問題を扱うことが難しいこと、またはマルチタスクでの課題に対応するのが難しいことが挙げられます。

  • AIが人類と同様の問題を解決する能力とは何ですか?

    -AIが人類と同様の問題を解決する能力とは、将来を予測し、問題を小さく分け、行動の結果を反省する能力、そしてツールを使用して目標を達成する能力を指します。

  • AIエージェントが何を自動化するのですか?

    -AIエージェントは、ワークフローを自動化し、人間の介入を最小限に抑えます。これには、計画の立案、行動の実行、結果の反映、そしてツールの使用が含まれます。

  • AIエージェントが使用するツールは何ですか?

    -AIエージェントは、人類が使用する同様のツールを使用します。これには、ウェブブラウザ、エクセル、プログラミングツール、データ分析ツールなどが含まれます。ただし、AIはこれらのツールを自動的に選択し、使用する方法を決定します。

  • AIエージェントがビジネスにおいてどのように役立つか?

    -AIエージェントは、ビジネスにおけるデータ分析、ウェブサイトの構築、旅行の計画、エッセイの執筆など、様々なタスクを自動化することができます。これにより、ビジネスはより効率的になり、コスト削減や新しいサービスの創出が可能になります。

  • AIエージェントの普及がもたらす可能性は何ですか?

    -AIエージェントの普及は、コンピューターとのインタラクションの進化をもたらす可能性があります。これには、グラフィカルインターフェースからAIアシステッドインターフェースへの移行や、より多くの人々が革新を起こしやすくなることなどが含まれます。

  • AIの発展がもたらす可能性についての個人的な考えは何ですか?

    -AIの発展は、技術スキルが民主化され、革新の壁が低くなることを意味しています。これにより、より多くの人々が製品やサービスを作り、問題を解決することができます。AIは私たちよりもツールを使用するのに優れていますが、それは私たちがより大きなpicturedに焦点を当て、本当に重要なツールを使用する機会を与えるものです。

Outlines

00:00

🤖 AIと機械学習の進化と課題

この段落では、著者は自分の人工智能(AI)の修士課程を終えた当時、AIと機械学習が様々な分野で役立っている一方で、それらは特定のタスクに特化しており、人間のように一般化することができないという問題点に触れています。AIが人間の仕事を完全に自動化するというアイデアは信じがたいものだと感じていたが、OpenAIがGPT-3という大規模な言語モデルをリリースしたことで、その考え方が劇的に変わりました。GPT-3は自然言語を用いて文章を書く、質問に答え、コードを読み書きすることができる能力を示しており、知能の兆候を示しています。

05:00

🤖 代理人(Agents)の概念とその可能性

この段落では、AIをツールとして使用することで、代理人(Agents)がどのようにしてタスクを自動化するかについて説明されています。代理人は、人間がAIにタスクと最終目標を説明し、AIが必要なツールを選択して使用する方法を計画し、自主的に実行します。これにより、Web開発者を雇うのではなく、AIがビジネスを説明してウェブサイトを構築するなど、より迅速で効率的な作業が可能になります。また、データ分析や旅行計画など、様々なタスクを自動化できる可能性が示されています。

10:01

🤖 既存のAI代理人の例とその将来

最後の段落では、既に存在するAI代理人の例が挙げられています。MicrosoftのCo-PilotやShopifyのSidekick、Hyperwriteなどが、それぞれのアプリケーションを通じてAIを活用してタスクを自動化する例です。また、GPT-3自体も様々なエージェントを提供しています。これらの代理人がより普及し、より高度なAIとして進化すると、コンピュータとの相互作用の考え方乃至びに社会全体が変わることになる可能性についても触れられています。最終的には、AIとの協働関係が重要であり、人間の創造性や経験を活かすことが強調されています。

Mindmap

Keywords

💡AI

AI(Artificial Intelligence)は、コンピュータシステムが人間の思考や行動を模倣し、自己の知恵や判断に基づいて行動する技術です。このビデオでは、AIが特定のタスクをこなす「専門家」から、自然言語を使用して問題を解決し、ツールを使うことで自己の知識を超えた「エージェント」へと進化しているというテーマに沿って説明されています。

💡machine learning

機械学習は、コンピュータがデータからパターンを学習し、未来の予測や判断を行う能力を獲得する技術です。このビデオでは、機械学習がAIの発展に不可欠であることや、GPT-3のような大規模な言語モデルの開発において重要な役割を果たしていることが強調されています。

💡GPT-3

GPT-3は、OpenAIによって開発された大規模な自然言語処理モデルです。このモデルは、書籍、記事、研究論文など、膨大なデータを学び、最も強力なコンピュータで訓練することで、自然な文章生成、質問の回答、コードの読み書き、甚至は詩や歌の作成など多岐にわたるタスクをこなすことが可能です。

💡intelligent agents

知能エージェントとは、自己の知識を超え、問題解決やタスクの自動化を目的としたAIシステムです。このビデオでは、AIが単にチャットボットとして機能するのではなく、エンドツーエンのワークフローを自動化し、人間のように計画、問題解決、ツールの使用を行うことで、より高度なタスクを遂行できるようになることが示されています。

💡natural language processing

自然言語処理(NLP)は、コンピュータが人間の言葉を理解し、応答する技術です。このビデオでは、NLPがAIが自然に文章を生成し、質問に答え、コードを読み書きする能力を可能にする重要な要素であることが強調されています。

💡code

コードは、コンピュータが実行する命令の集合であり、プログラミング言語を使用して書かれます。ビデオでは、すべてのスクリーン表示はコードに基づくものであり、エージェントはコードを用いて、人間が行うタスクを自動化することができることが示されています。

💡multitasking

マルチタスキングは、同時に複数のタスクをこなす能力です。このビデオでは、AIがマルチタスキングに苦労することがあることや、それに対処するための技術の進歩が触れられています。

💡digital labor

デジタル労働は、コンピュータやAIが人間の労働を代替し、自動化を行うことを指します。このビデオでは、AIエージェントがウェブを自動的に閲覧し、ファイルの使用、アプリケーションの操作、甚至はデバイスの制御を行うことで、デジタル労働を可能にしていることが示されています。

💡innovation

革新は、新しいアイデアや技術の開発によって生み出される変化や進歩を指します。このビデオでは、AIが技術革新を促進し、技術的なスキルが民主化されることで、より多くの人々が革新的なソリューションを考案できるようになるという希望が示されています。

💡collaborative

協調的とは、複数の要素や個人が協力して作業を進め、共通の目標を達成することを指します。このビデオでは、AIと人間が協力し合い、AIがツールとして使用されることで、人間はより大きな問題に焦点を当てることができるという協調的な関係が強調されています。

Highlights

Six years ago, the speaker was completing their master's degree in AI, feeling that true intelligence with computers was far away.

AI and machine learning have been revolutionary in diagnosing illnesses, detecting fraud, and optimizing traffic flow.

AI has traditionally been a specialist in specific tasks, not generalizing well to others, similar to humans.

OpenAI's release of GPT-3 marked a massive leap forward in AI, demonstrating more generalized intelligence.

GPT-3 can write naturally, answer questions on various topics, and even read and write code, showcasing impressive capabilities.

Despite its abilities, GPT-3 and similar AI are not perfect, can make mistakes, and struggle with basic math and multitasking.

The speaker suggests that intelligence is not just knowledge but also the ability to plan, reflect, and use tools effectively.

AI can be thought of as autonomous agents, designed to automate workflows with minimal human intervention, similar to how humans approach problems.

Agents use language models to plan tasks, reflect on outcomes, and use tools, much like humans do in practical operations.

The potential of agents includes building websites, making business decisions, and planning trips, all without human knowledge of specific tools.

Agents are digital labor, capable of browsing the web, navigating files, using applications, and controlling devices on our behalf.

Everything on our screens is formed of code, allowing AI to use and combine various tools and applications creatively.

Agents operate through a cycle of planning and executing actions using language models, breaking down tasks into a series of actions.

Examples of agents include Microsoft's Copilot, Shopify's Sidekick, and Hyperwrite, each automating specific tasks in their respective domains.

As agents become more widespread, intelligent, and sophisticated, they may change how we think about computers and human-computer interaction.

The democratization of skills through AI empowers more people to innovate and build solutions, lowering barriers for individuals and small businesses.

AI's ability to use tools quickly and efficiently may lead to a collaborative relationship with humans, focusing on bigger-picture thinking and creativity.

Transcripts

play00:00

[Music]

play00:15

about six years

play00:18

ago I was approaching the end of my

play00:20

master's degree in Ai and despite

play00:23

studying a variety of different projects

play00:25

involving machine learning genetic

play00:27

algorithms and even generative AI

play00:30

I couldn't help but feel like we were

play00:32

still so far away from creating true

play00:35

intelligence with

play00:36

computers yes Ai and more specifically

play00:39

machine learning has been a revelation

play00:41

in so many ways helping us diagnose

play00:44

illnesses detect fraudulent activity

play00:47

optimize traffic flow and so much more

play00:51

but if you've worked with AI in practice

play00:54

you'll know AI has always been more like

play00:57

a specialist very good but at very

play01:01

specific tasks and unlike humans they

play01:04

don't generalize very well to other

play01:06

tasks so to me at the time the idea that

play01:10

AI would completely automate people's

play01:12

work seemed quite far-fetched

play01:17

except I was

play01:19

wrong very wrong only two years later we

play01:22

saw a massive Leap Forward for AI That's

play01:26

when open AI introduced the world to

play01:28

large language models with the release

play01:30

of gpt3 the predecessor to chat

play01:34

GPT it was basically one big

play01:37

experiment what would happen if we

play01:39

gathered all the data we can find every

play01:42

book every article every research paper

play01:45

and trained in AI with the most powerful

play01:48

computers

play01:49

available many of you will have tried

play01:51

chat jpt and seen for yourselves what we

play01:54

get are signs of intelligence even

play01:57

without programming it to do so

play02:00

it can write in a natural way it can

play02:03

answer questions on a huge range of

play02:05

topics it can read and write code and it

play02:09

can do different forms of writing like

play02:11

articles songs and

play02:13

poems what's impressive is it does those

play02:15

things surprisingly well but what's

play02:17

arguably more impressive is the way it

play02:20

can reason and recognize patterns in

play02:22

similar ways to

play02:24

us using just natural language we can

play02:27

ask a question or give it an instruction

play02:30

and somehow it understands our

play02:33

request AI now is no longer just a

play02:36

specialist and that in

play02:38

itself is a huge

play02:42

milestone now many of you will have

play02:44

tried Chachi PT or something similar and

play02:46

thought this is great for brainstorming

play02:49

ideas writing content doing some editing

play02:52

and maybe even answering some queries

play02:55

but that's just the tip of the iceberg

play02:57

of what generative AI can actually do

play03:01

to understand just how far this

play03:02

technology can go I'd actually like to

play03:05

start with what it doesn't do very well

play03:07

first and you'll see why in a second now

play03:11

a lot has been said about whether this

play03:13

technology is actually

play03:15

intelligent that's because they're not

play03:18

perfect they can make

play03:20

mistakes for example it can completely

play03:23

make up facts also known as

play03:26

hallucinating the information it has

play03:28

isn't always up to date

play03:31

and surprisingly it can struggle with

play03:33

even basic maths and it can often times

play03:36

struggle with

play03:38

multitasking these can be big issues

play03:41

depending on what you're trying to do

play03:43

but if we're going to be

play03:45

fair we're not perfect either many of us

play03:48

can struggle with those same things as

play03:50

well but maybe a counterargument to that

play03:53

is we still manage to solve problems and

play03:56

get things done why is

play03:58

that

play04:00

that's because our intelligence isn't

play04:02

confined to just our knowledge and what

play04:04

we know it encompasses a lot more like

play04:08

our ability to plan ahead and break down

play04:10

problems into smaller

play04:12

problems it's down to our ability to

play04:14

reflect on the outcomes of our actions

play04:18

and of course down to our ability to use

play04:20

tools to help us complete a given

play04:23

goal now here's where things get

play04:27

interesting what if we try try to use or

play04:31

replicate the way humans approach

play04:32

problems using language models it's at

play04:36

this point when we stop thinking about

play04:38

AI like chat GPT as just a chatbot that

play04:41

requires constant human input to

play04:43

complete a task and instead think think

play04:47

of them as agents or autonomous

play04:51

agents agents are designed to automate

play04:54

workflows end to endend with little to

play04:57

no human intervention and they do so

play05:00

by planning their tasks reflecting on

play05:02

the outcomes of their actions and using

play05:04

tools to help them out so very similar

play05:06

to us to understand what agents actually

play05:11

do let's think about how we generally

play05:13

operate practically everything we do

play05:15

nowadays involves our phones and our

play05:18

computers the applications and programs

play05:21

on our devices act as tools to do

play05:23

certain

play05:24

things so if I'm writing an essay I

play05:27

might use a web browser to access the

play05:29

intern internet to research a topic if

play05:32

I'm an

play05:33

accountant I could use a different set

play05:35

of tools maybe Excel or an accounting

play05:38

software if I'm a programmer again I

play05:41

have a different set of tools but we're

play05:44

basically constantly using a variety of

play05:46

different tools to help us with a given

play05:48

task and this is where agents are a bit

play05:51

different instead of us using those

play05:53

tools we just describe to an AI what the

play05:56

task is and what the end goal is and

play05:59

then then it plans which tools it needs

play06:01

to use and how to use them and then it

play06:04

actually does it on its own not only can

play06:07

they complete the task much quicker than

play06:09

we can but in theory we wouldn't even

play06:11

need to know how to use these tools in

play06:13

the first place so imagine this you're

play06:17

an entrepreneur you've just started a

play06:19

business and you need a website but you

play06:21

have no idea how to build one but

play06:23

instead of hiring a web developer you

play06:26

just describe your business to an AI you

play06:28

describe how you want the website to be

play06:31

and then the AI uses the same tools the

play06:34

web developer does and builds the entire

play06:36

thing in a matter of

play06:38

seconds or maybe you've been collecting

play06:41

a bunch of data and you want to make

play06:42

Better Business decisions instead of

play06:45

hiring a data analyst the AI is using

play06:49

data analysis tools to answer your

play06:51

business queries instantly or finally

play06:54

maybe you're just looking to travel

play06:55

somewhere nice so you ask an AI to plan

play06:58

your trip for you finally you flight

play07:00

options accommodation and even plans

play07:03

your activities once you're there that's

play07:06

the potential of agents and believe it

play07:08

or not we're not far off from that

play07:11

world agents are like digital labor

play07:14

capable of automatically browsing the

play07:17

web navigating our files using our

play07:20

applications and potentially even

play07:22

controlling our devices for

play07:25

us so how is this all possible it sounds

play07:28

a bit like s science fiction but because

play07:31

of today's technology it's simpler than

play07:34

it

play07:35

seems first an important thing to

play07:38

understand is that everything we see on

play07:40

our screens is just a visual

play07:42

representation we can make sense of so

play07:46

but in the background everything is

play07:48

formed of code so for every button and

play07:51

for every action you can do there's a

play07:53

piece of code Associated to it and

play07:55

here's just a couple of examples this is

play07:58

the programming way of using chat GPT so

play08:01

instead of going on the website and

play08:04

using their interface you can just run

play08:05

this line of code and it gives you gpt's

play08:08

answer similarly this is how you might

play08:11

do a Google search so uh just an

play08:15

alternative to Google search and this is

play08:17

how you might use or create a Word

play08:21

document the only reason why I show this

play08:23

is because when things are formed of

play08:25

code it means we can assemble programs

play08:28

that combine different different

play08:29

functionalities and different

play08:31

applications in creative and interesting

play08:33

ways and and that's a core aspect of how

play08:37

agents work by its ability to use

play08:39

different tools

play08:41

interchangeably and so if we look at the

play08:44

framework of a of an agent it consists

play08:47

of a set of actions it can do and again

play08:50

these actions are just code just like we

play08:53

saw in the last slide and the language

play08:55

model like chat GPT and first the user

play09:00

gives a request in this example it might

play09:02

be book me the cheapest flight to

play09:05

London and then we start a cycle of

play09:09

questioning and answering with the

play09:11

language model and we can ask a question

play09:13

as simple as this based on the user's

play09:16

request what do you think the next

play09:18

action should be because language models

play09:21

are so smart we can get them to break

play09:23

down a task into a series of actions it

play09:26

needs to perform to complete the end

play09:28

goal and so in this example it might be

play09:32

searching flights and again because

play09:35

language models can read and WR code we

play09:38

can get them to format the input just

play09:40

how we need them to be to execute that

play09:42

code with no errors then once it does we

play09:46

can get the output which might be a list

play09:48

of flights and their prices and then we

play09:50

repeat this questioning process again

play09:53

based on the information you have now

play09:55

what do you think the next action should

play09:57

be and then we repeat this process over

play10:01

and over until the task is actually

play10:03

complete so agents are just a feedback

play10:07

loop of planning and executing actions

play10:10

using language models and I mentioned

play10:13

that we're not far off having agents but

play10:16

in reality they're already

play10:19

here for example Microsoft's co-pilot is

play10:22

an example of an

play10:24

agent within Excel you can just use

play10:26

natural language to get it to analyze

play10:29

your spreadsheets and reports without

play10:31

needing to know all the fancy formulas

play10:33

and all the complex

play10:35

functionalities similarly Shopify has a

play10:38

sidekick that helps you build a website

play10:41

using

play10:42

AI hyper write acts like a personal

play10:46

assistant that can book flights for you

play10:49

order takeaway and even organize your

play10:51

emails for you and even chat GPT itself

play10:54

has a whole catalog of Agents known as

play10:57

gpts and this is just the start I

play11:01

believe many more businesses will start

play11:03

incorporating agents both internally and

play11:06

as part of their products and services

play11:08

language models are getting cheaper and

play11:10

cheaper every year to the point where

play11:12

they're virtually free and not only that

play11:16

but they're also very accessible and

play11:18

easy to use so practically anyone with

play11:20

basic programming knowledge can get

play11:22

started with building an

play11:24

agent but as agents become more

play11:27

widespread more intelligent and more

play11:29

sophisticated it'll likely change the

play11:32

way we think about computers in the

play11:33

first

play11:34

place in the same way that the

play11:37

transition from a command line interface

play11:39

to a graphical interface completely

play11:41

revolutionized the way we interact with

play11:44

computers perhaps the next evolution of

play11:47

that is a kind of AI assisted interface

play11:50

maybe like Tony Stark and his AI

play11:53

Jarvis there's no doubt that a world

play11:56

full of intelligent assistants and

play11:58

agents is going to be

play12:00

strange the technical skills we once

play12:03

thought are unique to us are now being

play12:05

outsourced to AI even as a data

play12:08

scientist myself I wonder how long

play12:11

before an AI can do the things that I

play12:13

can do it is a scary thought but at the

play12:17

same time as an optimist I can't help

play12:20

but feel like it's also incredibly

play12:23

empowering with our skills

play12:25

democratized the barriers to Innovation

play12:28

are lower than ever

play12:30

more people can participate in creating

play12:32

Solutions and building things that were

play12:34

once only in the hands of large

play12:36

corporations and specialized

play12:38

professionals and in the same way that

play12:41

Jarvis doesn't replace Tony Stark I

play12:44

believe our relationship with AI will

play12:46

always be one of kind of a collaborative

play12:50

one sure AI might be better and quicker

play12:53

at using the tools than us but that

play12:55

gives us an opportunity to focus on the

play12:57

bigger picture and use the tools that

play13:00

actually matter our creativity Ingenuity

play13:04

and Human

play13:05

Experience thank

play13:10

[Applause]

play13:14

you

Rate This

5.0 / 5 (0 votes)

Related Tags
AI進化機械学習言語モデルチャットGPT自動化デジタル労働創造性協力関係技術革新未来予測
Do you need a summary in English?