【生成式AI導論 2024】第0講:課程說明 (17:15 有芙莉蓮雷)

Hung-yi Lee
23 Feb 202425:39

Summary

TLDR李宏毅教授在《生成式人工智能导论》课程中,分享了开设此课程的初衷,即帮助学生理解生成式AI的全貌和背后原理。他通过ChatGPT展示AI的实用性,并强调了理解AI原理的重要性。课程不要求先修知识,适合初学者,旨在培养学生对AI的深入理解,而非仅仅教会使用特定工具。课程作业将涵盖AI应用开发和模型训练,让学生体验AI技术的实际应用。

Takeaways

  • 📚 李宏毅教授开设了《生成式人工智能导论》这门课程,旨在介绍深层式人工智能的原理和应用。
  • 🤖 教授通过一个学生提问如何自动对文章分类的例子,引出了使用ChatGPT等生成式AI的便捷性。
  • 🔍 ChatGPT可以作为一个强大的助手,通过简单的指令就能执行新闻分类等任务,无需深入学习机器学习原理。
  • 🌐 通过展示ChatGPT的操作界面,说明了生成式AI的易用性和强大功能,强调了其作为工具的实用性。
  • 🛠️ 课程将教授如何在自己的程序中调用像ChatGPT这样的AI,以嵌入到自己的应用或服务中。
  • 🚀 李宏毅教授认为,生成式AI的发展速度非常快,过去需要自己开发和训练模型,现在可以直接使用现成的AI工具。
  • 📈 课程不仅介绍ChatGPT,而是提供生成式AI的全貌,包括背后的原理和未来的可能性。
  • 👨‍🏫 课程适合不同背景的学生,无需先修课程,可以作为人工智能领域的入门课程。
  • 📝 通过作业,学生将体验使用生成式AI构建应用和训练自己的AI模型,尽管过程可能耗时且结果难以预测。
  • 🔮 教授强调了理解AI原理的重要性,比喻为了解魔术背后的手法,能更深刻地欣赏其精妙之处。
  • 🎓 课程内容将涵盖从基础概念到最新研究,鼓励学生阅读相关论文以深入了解AI技术的最新进展。

Q & A

  • 李宏毅教授开设生成式人工智能导论课程的初衷是什么?

    -李宏毅教授开设这门课程的初衷是因为在教授机器学习课程时,发现许多学生对机器学习的应用感兴趣,但可能并不需要深入了解机器学习的原理。他希望通过这门课程,让学生了解生成式AI的全貌以及背后的原理,帮助他们判断何时应该自己开发模型,何时可以使用现成的人工智能。

  • 为什么李宏毅教授建议想要进行文章分类的学生直接使用ChatGPT而不是学习机器学习原理?

    -李宏毅教授认为,如果学生的目标是实现具体的应用,如文章分类,而不是深入理解机器学习的原理,那么使用像ChatGPT这样的现成工具会更高效。这样可以节省时间,直接利用强大的AI能力来满足需求。

  • ChatGPT在实际应用中可以扮演什么角色?

    -ChatGPT在实际应用中可以作为用户的智能助理,帮助完成各种任务,例如自动对文章进行分类,只要用户给出相应的指令和示例,ChatGPT就能根据这些信息进行操作。

  • 如何将ChatGPT的功能嵌入到自己的应用程序或服务中?

    -课程的第三次作业会教授学生如何在自己的程序中调用像ChatGPT这样的人工智能,以便将这种智能功能集成到自己的应用程序或服务里。

  • 生成式人工智能导论课程与李宏毅教授之前开设的机器学习课程有何不同?

    -生成式人工智能导论课程不专注于教授如何使用特定的工具或技术,如ChatGPT,而是旨在提供生成式AI的全貌和背后的原理。相比之下,机器学习课程更侧重于机器学习的原理和模型开发。

  • 为什么李宏毅教授认为即使学生已经会使用ChatGPT,了解其背后原理仍然很重要?

    -了解ChatGPT背后原理可以帮助学生更深入地认识这项技术,避免对其能力有错误的理解和期待。就像知道魔术背后的手法可以让人更欣赏魔术师的技巧,了解AI的原理可以让学生更精准地判断何时应该使用现成的AI工具,何时需要自己开发模型。

  • 课程是否会涉及到如何使用ChatGPT?

    -课程不会特别着重于教如何使用ChatGPT,因为ChatGPT的使用非常简单,且网络上已有大量教学资源。课程的重点是教授生成式AI的概念、原理以及未来的可能性。

  • 学生是否需要有人工智能、数学或编程背景才能参加这门课程?

    -不需要。这门课程没有预设任何先修要求,可以作为学生人生中的第一堂人工智能相关课程。

  • 课程中的作业难度是如何分布的?

    -课程作业的难度会逐渐增加。前两个作业相对简单,基本上是送分题,而后面的作业会涉及到编程和模型训练,难度会更高,需要学生投入更多的时间和精力。

  • 学生在课程中是否会体验到训练模型的过程?

    -是的,课程中的作业会让学生体验如何使用生成式AI来构建应用,并且会教授学生如何训练自己的生成式AI模型,让他们了解训练模型可能遇到的挑战,如时间消耗和结果的不确定性。

  • 课程是否会使用外部平台或工具来辅助教学或作业批改?

    -会的。课程中会使用CodeLab或Cargo等工具来辅助编程和模型训练,而且作业的批改可能会使用大型语言模型来完成,以提高效率。

Outlines

00:00

📚 课程介绍与生成式AI的启示

李宏毅教授在课程开始前介绍了开设生成式人工智能导论课的初衷。自2014年起在台大教授机器学习相关课程,并于2015年开设相关课程。一次课后,有学生询问如何让机器自动对文章分类,教授从机器学习的角度回答了问题,但随后意识到学生可能更关心如何实现文章分类而非学习机器学习原理。于是,教授推荐使用ChatGPT,并解释了ChatGPT的使用方法和功能,展示了如何通过简单的指令让ChatGPT对新闻进行分类。此外,教授还提到了如何将ChatGPT的功能嵌入自己的应用程序中,并强调了这门课程的目的是教授生成式AI的全貌,而不仅仅是如何使用ChatGPT。

05:01

🔮 生成式AI的趋势与课程定位

教授强调了生成式AI技术的快速发展,并指出了解这些技术可以帮助更精确地判断何时应该自己开发模型,何时可以使用现成的人工智能。课程的定位是介绍生成式AI的全貌,而不是仅仅教授如何使用ChatGPT。ChatGPT只是一个例子,学习使用它并不需要专门的课程,因为它的使用非常直观。课程的目标受众是已经使用过生成式AI并希望进一步了解其背后原理的人。教授还提到,这门课程不需要任何先修课程,可以是学生的第一门人工智能相关课程。

10:03

🎓 课程内容与学习目标

教授介绍了课程内容和学习目标,强调了理解生成式AI背后的概念和原理的重要性。通过学习这些原理,学生可以更深入地理解AI的能力,避免对其有错误的期待。课程与机器学习课程相比,内容差异很大,即使是已经学习过机器学习的学生,也能从这门课程中获益。课程旨在为学生提供人工智能的基础知识,为将来学习更高级的课程打下基础。

15:05

🚀 技术发展速度与作业规划

教授讨论了生成式AI技术的快速发展,并用GPT-2模型的发展来说明这一点。通过比较过去和现在的模型大小,强调了技术进步的速度。课程作业的目标是让学生体验使用生成式AI构建应用,并尝试训练自己的模型。教授提到,尽管训练模型可能耗时且结果可能无法预测,但这些体验对于学生未来面对挑战是有帮助的。

20:06

🛠️ 作业要求与资源支持

教授介绍了作业的要求和资源支持情况。学生不需要自己准备GPU或其他硬件资源,所有编程和模型训练都将通过CodeLab或Cargo平台完成。教授还对作业难度进行了评估,并提到了作业的截止日期。此外,教授提到了使用大型语言模型来批改作业的计划,并感谢了NTK的达芬奇团队对课程的支持。

25:09

🤖 业界分享与课程展望

教授提到了MTK团队将在课程中进行分享,介绍他们如何使用生成式AI以及他们对这项技术的看法。此外,MTK的技术团队也会分享他们开发大型语言模型的经验。这些分享将为学生提供业界视角,增进对生成式AI应用和开发的理解。

Mindmap

Keywords

💡生成式人工智能

生成式人工智能是一种人工智能技术,它能够创建新的数据实例,如文本、图像等,而不仅仅是识别或分类现有数据。在视频中,教授提到了生成式人工智能的发展趋势和技术进步,强调了它在自动文章分类等应用中的实用性。

💡机器学习

机器学习是人工智能的一个分支,它使计算机系统能够从数据中学习并做出决策或预测。视频中提到,教授自2015年起每年都开设机器学习相关课程,但随着生成式人工智能的出现,传统的机器学习方法可能被更高效的工具所取代。

💡ChatGPT

ChatGPT是一种基于生成式人工智能的聊天机器人,能够理解和生成自然语言文本。视频中,教授展示了如何使用ChatGPT进行新闻分类,说明了它在实际应用中的简单性和有效性。

💡模型训练

模型训练是机器学习中的过程,通过提供大量数据来训练算法,使其能够学习并做出预测。视频里教授提到,尽管生成式AI使得模型训练变得更加容易,但它仍然需要时间和资源,且结果可能存在不确定性。

💡参数

在机器学习和人工智能中,参数是模型中的变量,决定了模型的行为。视频中提到70亿参数的模型,暗示参数的数量可以作为衡量模型复杂性和能力的一个指标。

💡GPT-3.5与GPT-4

GPT-3.5和GPT-4是指特定版本的生成式人工智能模型,其中GPT-3.5是免费版本,而GPT-4是付费版本。视频里教授使用GPT-3.5来展示生成式AI的基本功能。

💡应用嵌入

应用嵌入指的是将人工智能功能集成到现有的应用程序或服务中。视频提到,学生将学习如何在自己的程序中调用像ChatGPT这样的人工智能来执行任务。

💡技术发展速度

技术发展速度描述了技术进步和创新的快速性。视频中通过比较五年前的GPT-2和现在的模型,展示了生成式人工智能技术快速发展的情况。

💡预训练模型

预训练模型是指在大量数据上预先训练好的人工智能模型,可以用于特定任务或微调。视频里教授提到了使用预训练模型来快速实现人工智能应用的可能性。

💡CodeLab和Cargo

CodeLab和Cargo是编程环境或工具,用于编写和运行代码。视频中提到,学生不需要自己准备GPU或其他硬件资源,可以直接使用这些工具来训练模型。

💡达芬奇平台

达芬奇平台是一个技术平台,提供算力和工具来支持人工智能的开发和应用。视频中特别感谢了NTK的达芬奇团队,因为他们提供了平台支持,使得使用大型语言模型批改作业成为可能。

Highlights

李宏毅教授开设生成式人工智能导论课程,旨在介绍深层式人工智能的原理和应用。

教授自2014年起在台大教授机器学习相关课程,并于2015年开设了生成式人工智能导论。

学生提出如何让机器自动对文章分类的问题,教授建议使用ChatGPT而非深入学习机器学习原理。

ChatGPT页面简单,只有一个对话框,但功能强大,可作为个人助理。

通过ChatGPT可以轻松实现新闻分类等任务,展示了生成式AI的实用性。

课程将教授如何在自己的程序中调用像ChatGPT这样的人工智能。

教授强调生成式AI技术日新月异,课程旨在教授长期适用的概念和原理。

课程不要求学生有人工智能、数学或编程背景,适合作为人工智能的第一门课程。

了解生成式AI背后原理的重要性,类比于了解魔术背后的手法。

课程内容与机器学习课程有较大差异,即使学过机器学习也能从中获益。

课程作业将教授训练一个70亿参数的模型,体验生成式AI的构建和训练过程。

教授比喻训练模型的过程就像养小动物或种花草,结果可能无法预测。

课程作业将使用CodeLab或Cargo平台,学生无需自备GPU等硬件资源。

课程作业设计包括正面和负面体验,让学生全面理解生成式AI的构建过程。

课程将使用大型语言模型进行作业批改,提高效率并减少教师负担。

NTK团队将分享他们在业界使用生成式AI的经验和看法。

MTK技术团队将分享他们开发大型语言模型的心得和技术细节。

Transcripts

play00:00

好 那個各位同學大家好啊

play00:06

感謝大家來生成式人工智慧導論這門課捧場

play00:10

那我們就開始上課

play00:12

我是李宏毅

play00:14

那在開始上課之前呢

play00:16

我們先講一下

play00:18

為什麼我會想要開深層式人工智慧導論這門課

play00:22

那我從2014年開始在臺大任教

play00:26

然後2015年呢

play00:28

每年都開機器學習相關的課程

play00:31

那在去年的春季班

play00:33

在機器學習這門課的下課後呢

play00:36

有一個同學來問我這樣一個問題

play00:39

他問說

play00:40

怎麼讓機器自動對一篇文章做分類

play00:43

那這是機器學習的課程

play00:45

我就從機器學習的角度來回答他

play00:48

告訴他說這是一個很標準的分類問題

play00:51

你要先準備一些標注資料

play00:53

然後你就可以訓練一個自己的模型

play00:56

講到這邊

play00:57

我腦中突然想起了一個聲音

play01:00

我突然獲得了一個天啟

play01:02

我問他說

play01:03

你是真的想要學機器學習的原理嗎

play01:07

還是你只是想要知道

play01:10

怎麼做到文章分類這件事

play01:13

你為什麼會想要做文章分類呢

play01:15

他說

play01:16

這是我新創需要的服務

play01:18

那我說你還浪費時間學機器學習嗎

play01:21

別管我剛才說的那些,直接Call ChatGPT就好了

play01:25

這句話到底是什麼意思呢?當我說直接用ChatGPT就好的時候

play01:31

到底是什麼意思呢?

play01:33

也許我直接操作一下,大家會比較能夠想像

play01:40

這個是ChatGPT的頁面

play01:44

那我這邊用的是GPT-3.5

play01:48

GPT-3.5是免費的

play01:50

GPT-4是需要付費的

play01:52

所以我等一下展示的功能

play01:54

是免費版的功能

play01:56

是每一個人都可以

play01:58

唾手取得的功能

play02:00

那第一次看到這個

play02:02

ChatGPT的頁面的人啊

play02:04

往往會不知所措

play02:06

這個頁面上就

play02:08

只有一個對話框

play02:10

那在這個對話框裡面

play02:12

可以輸入任何的文字

play02:14

但這樣一個

play02:16

我們可以跟我們對話的人工智慧

play02:19

到底有什麼樣的作用呢

play02:22

我會無聊到需要每天跟ChetGPT說話嗎

play02:26

我有寂寞到需要跟人工智慧不斷的聊天嗎

play02:30

可能沒有

play02:31

所以很多人覺得說

play02:33

這不過是一個聊天機器人

play02:35

他能有什麼作用

play02:37

事實上呢

play02:39

ChetGBT可以是你的好助理

play02:42

你有什麼要求

play02:44

直接告訴他

play02:46

舉例來說

play02:48

我們今天想要對新聞

play02:50

做分類

play02:52

那你直接把你的指令貼給他

play02:54

跟他說

play02:56

新聞就分成以下的類別

play02:58

那這邊呢就簡單定義一下

play03:00

新聞分成政治社會財經生活

play03:02

影視娛樂體育

play03:04

等等

play03:06

那接下來呢跟他說以下我會給你一篇新聞

play03:08

請告訴我這篇新聞屬於哪一類

play03:10

只給我類別就好

play03:12

接下來就貼一段新聞的內容給他

play03:16

比如說這邊

play03:17

隨便找一個新聞

play03:19

元宵

play03:20

逢最小滿月

play03:22

隨便貼一段新聞給他

play03:25

就貼在這邊

play03:26

然後輸入

play03:30

他就告訴你說這則新聞呢

play03:32

屬於生活

play03:34

或者我們再試另外一個例子吧

play03:37

這邊這個是跟AI有關的新聞

play03:42

那我們把這段新聞的直接貼到這裡

play03:48

那GPT知道說這個是影視娛樂

play03:56

所以你可以輕易的用GPT打造你想要的AI應用

play04:02

但是有人可能會想說這個是一個demo的網頁啊

play04:08

我要怎麼把這個功能

play04:10

嵌入我的應用裡面

play04:14

嵌入我的服務裡面

play04:16

那在這門課的作業三會告訴你

play04:18

怎麼在你自己的程式中

play04:20

呼叫像ChairGPT這樣的人工智慧出來幫你做事

play04:28

總之我的想法是

play04:29

大人時代變了

play04:31

過去呢

play04:32

在做這個人工智慧有關的應用的時候

play04:35

我們往往都是自己開發人工智慧的模型

play04:39

自己訓練機器學習的模型

play04:42

這就像是在決鬥的時候用劍一樣

play04:44

今天有人可以直接掏出一把槍

play04:47

在瞬間就完成人工智慧的應用

play04:51

所以也許作為一個人工智慧的基礎的課程

play04:56

我想要開一門新的課

play04:58

告訴大家今天這個世界

play05:00

如果你想做人工智慧相關應用的話

play05:03

可能是什麼樣子

play05:06

當然有能力自己開發模型

play05:08

仍然非常重要

play05:10

所以並不是說機器學習這門課就不重要

play05:13

也並不代表我以後就不會開機器學習這門課

play05:17

那我只是想要告訴大家說

play05:19

瞭解今天生成式AI的趨勢

play05:22

瞭解今天生成式AI的技術

play05:25

發展到什麼地步

play05:27

可以幫助你更精確的判斷

play05:29

什麼時候你應該自己開發模型

play05:32

什麼時候可以用一個現成的人工智慧

play05:37

好那在開始課程之前呢

play05:39

我來講一下這門課的定位

play05:41

那因為這個課的一開場呢

play05:43

就跟你講了ChatGPT

play05:45

可能會給你帶來一個誤解

play05:47

我看到網路上有很多同學說

play05:49

這是一門教大家怎麼用ChatGPT的課

play05:53

那其實這不是一門

play05:55

教大家怎麼用ChatGPT的課

play05:57

ChatGPT

play05:58

只是眾多生成式人工智慧的其中一個例子

play06:02

當然他是今天最具有代表性的應用

play06:05

所以我們課堂上一定會反覆的提到

play06:08

ChatGPT這一個人工智慧

play06:11

但他只是生成式AI的一個例子而已

play06:15

而這門課要講的是

play06:17

期待能夠帶給大家生成式AI的全貌

play06:21

那其實ChatGPT非常容易上手

play06:24

很多人都會問說

play06:26

我要怎麼學習用ChatGPT呢

play06:29

用ChatGPT這件事情是不用學的

play06:33

你只要能夠跟另外一個人溝通

play06:35

你大概就有辦法跟ChatGPT溝通

play06:38

所以學習用ChatGPT這件事

play06:40

其實不需要花一整個學習的時間

play06:44

來學怎麼用ChatGPT

play06:46

而且另外一方面

play06:48

ChatGPT的學習資源真的非常多

play06:50

你要在YouTube上面打ChatGPT

play06:52

滿坑滿谷的網紅通通在教你

play06:55

怎麼用ChatGPT

play06:56

在這個去年年初ChatGPT剛火的時候

play07:00

只要是個網紅通通在講ChatGPT

play07:03

歷史的頻道就要讓ChatGPT

play07:04

偽裝成歷史的古人跟他對話

play07:07

一個打遊戲王的頻道也要逼迫ChatGPT

play07:10

跟他玩遊戲王

play07:11

明明ChatGPT根本玩不了遊戲王

play07:13

也要逼迫ChatGPT跟他玩遊戲王

play07:15

總之已經有太多人

play07:17

提供ChatGPT的教學資源

play07:20

所以這一門課要講的

play07:21

並不是教你怎麼使用ChatGPT

play07:25

這一個人工智慧的應用

play07:28

那這一門課要講的是什麼呢

play07:30

這一門課呢我預設的目標受眾是

play07:34

假設你已經用過ChatGPT這類的生成式AI

play07:39

你知道他們可以做什麼

play07:42

你知道他們有多厲害

play07:44

但是你想要更進一步瞭解這些生成式AI背後的原理

play07:50

他們到底是怎麼來的

play07:52

怎麼被訓練出來的

play07:54

怎麼變得像今天一樣這麼厲害

play07:56

以及你想要知道這一些人工智慧

play07:59

未來有什麼樣的可能性

play08:01

還有哪些可能的發展

play08:03

這一門課就是為你開的

play08:06

那為什麼這一門課不會特別著重某一個應用

play08:10

比如說ChatGPT的使用呢

play08:12

因為今天這個技術真的是日新月異

play08:15

而如果你在這個2022年年底

play08:18

ChatGPT一上線的時候就有用它的話

play08:21

你會發現ChatGPT現在它的介面

play08:23

跟它剛上線的時候

play08:24

介面已經有很大的差異

play08:27

它能做的事 它的能力也有非常多的不同

play08:31

所以這個應用是日新月異

play08:34

所以你在某一門課

play08:35

就算你學到了怎麼使用ChatGPT

play08:38

可能同樣的技巧

play08:40

在幾個月甚至幾週之後

play08:42

就已經不適用了

play08:44

但我們在大學開一堂課是希望可以教你

play08:48

也許在往後數年甚至一輩子都可以用得上的東西

play08:53

所以這一門課真正想要傳達的

play08:55

並不是教你怎麼用ChatGPT這一個應用

play08:59

而是告訴你深層式AI背後概念和原理

play09:04

那這一門課呢

play09:06

我沒有預設需要任何的預修課程

play09:09

也就是如果你想要修這一門課的話

play09:12

你不需要修過任何人工智慧相關的課程

play09:15

不需要有任何數學跟程式的背景

play09:18

也不需要修過任何機器學習相關的課程

play09:23

這門課可以是你人生的第一堂人工智慧相關課程

play09:29

那有人可能會問說我已經會用ChatGPT了

play09:32

用ChatGPT就是如此的簡單

play09:35

只要你會說話

play09:36

只要你會打字

play09:37

你知道怎麼跟另外一個人溝通

play09:39

你就可以用ChatGPT

play09:41

我已經會用啦

play09:42

那會用就好啦

play09:44

我幹嘛知道他背後的原理是什麼

play09:47

那確實就算你不知道Chain 3D的原理

play09:50

你也有機會打造人工智慧的應用

play09:54

但是瞭解他的原理

play09:56

可以帶你走向另外一個層次

play09:59

假如像說魔術非常的神奇

play10:02

今天的人工智慧也像是魔術一樣

play10:06

但是如果你又知道魔術背後的手法的話

play10:11

你在觀看魔術的時候

play10:12

你可以更能夠欣賞

play10:14

魔術師他厲害的地方

play10:16

你看到魔術師把一個人聚成兩半再黏在一起的時候

play10:19

你不會覺得他是真的把人聚成兩半

play10:22

然後用念能力把他黏在一起

play10:24

你會知道說這是一個手法

play10:26

你不會覺得魔術師是一個有超能力的人

play10:29

或者是一個念能力者

play10:30

你知道這是魔術的手法

play10:33

那對於深層式AI也是一樣的

play10:35

今天深層式AI展現出非常神奇的能力

play10:38

但是假設你可以正確瞭解他背後的概念跟原理的話

play10:43

那就好像是瞭解了魔術背後的手法

play10:46

你可以更精確的認識他

play10:48

至少你不會對他的能力有錯誤的誤解

play10:52

或有錯誤的期待

play10:53

那有同學問我說這門課跟機器學習

play10:56

我自己開機器學習這門課

play10:58

有什麼重疊的地方嗎

play11:00

play11:02

你應該要問說還有什麼一樣的地方

play11:04

基本上就是沒有什麼一樣的地方

play11:06

所以就算是你修過我的機器學習

play11:10

或者是修過其他老師開的機器學習

play11:13

我相信這一門課也可以帶給你很大的幫助

play11:17

那我剛才有說這一門課可以作為你的人工智慧的第一堂課

play11:22

你可以把這一門課作為你學人工智慧的基礎

play11:25

未來再去學其他機器學習相關的課程

play11:29

那要再聲明一下在這一門課你不會學到什麼

play11:33

因為這是一門入門的課

play11:35

所以如果我們繼續用魔術這個比喻的話

play11:38

這一門課會手把手帶你變幾個魔術

play11:42

但是可能不足以訓練你成為魔術師

play11:45

也沒有辦法帶你創造新的魔術

play11:49

但這並不代表說這一門課是沒有用的

play11:52

這一門課可以作為

play11:53

假設你的目標未來是要成為頂尖的魔術師

play11:56

要做些大變活人之類的

play11:58

那這一門課可以作為你成為魔術師的開始

play12:03

那上課因為時間有限

play12:05

然後把這門課設定為是兩學分的課

play12:08

所以我們上課時間只有兩個小時而已

play12:10

因為上課時間有限

play12:12

所以我們無法深入提到所有的技術

play12:15

所以很多地方可能會讓你覺得

play12:17

我什麼都脫了

play12:19

就只給我看這個

play12:21

所以很多地方可能沒有辦法講得非常的深入

play12:25

但是這是你的第一門人工智慧的課

play12:28

他不會是你最後一門人工智慧的課

play12:32

未來你可以修其他相關的課程

play12:34

或者是假設你想要深入研究

play12:37

上課所提到的一些技術背後的原理的話

play12:41

你可以看投影片上引用的論文

play12:44

那講到引用這件事啊

play12:46

我講一下說

play12:47

在我們這門課

play12:49

我們的投影片上

play12:50

多數的論文呢

play12:51

都是引用來自一個叫做

play12:53

archive 的網站

play12:55

所以看到說

play12:56

上課引用的論文連結

play12:58

他上面會寫這個

play13:00

archive.org

play13:02

archive 是什麼呢

play13:04

如果是這個電腦科學領域的同學

play13:07

一定都知道Archive是什麼

play13:09

但我知道說這門課的同學呢

play13:10

來自於各個不同的領域

play13:13

所以我介紹一下什麼是Archive

play13:15

我知道說一般我們在做這個研究的時候

play13:18

你知道說你做研究有了一個新的想法

play13:22

那你會把你的想法呢寫成論文

play13:25

發表在國際會議跟國際期刊上

play13:29

但是這個國際會議國際期刊論文往往一審

play13:32

都是個一年半載

play13:34

對於AI的領域而言

play13:37

技術變化實在是太快了

play13:39

一年半載的時間往往就會有翻天覆地的變化

play13:44

往往你投一篇文章

play13:46

六個月之後被國際會議接受

play13:48

那個技術已經不行了

play13:50

所以怎麼辦呢

play13:52

有一個網站叫做阿凱

play13:54

今天往往你有新的想法

play13:56

尤其是電腦科學人工智慧相關的新的論文

play14:00

往往不先投國際會議 先直接放archive

play14:04

搶先公開出來

play14:06

所以在archive上比較容易找到最新的研究

play14:10

那這邊教大家怎麼看archive文章上傳的時間

play14:14

那archive的文章後面都會有一個數字

play14:18

這個數字的前兩個代表的是年份

play14:22

後面兩個數字代表的是月份

play14:25

所以2205的意思就是

play14:27

這篇文章是在2022年的5月被公開來放在R-CAPE上

play14:34

之後你在我們的課程的投影片上

play14:36

會看到很多文章

play14:38

這些文章往往是幾個月前

play14:41

甚至是幾週前才被放在R-CAPE上的

play14:46

那講到這個技術迅速的變化這件事啊

play14:49

我就想分享一件事情

play14:52

在這門課裡面

play14:53

我們的作業會教大家訓練一個

play14:57

有70億個,7個Billion

play15:00

縮寫是7B,7B這麼多參數的模型

play15:05

雖然說是訓練,但實際上是微調啦

play15:07

不過我們還沒有講到訓練跟微調的差異

play15:10

這個我們之後再講

play15:11

現在就當作你要訓練一個7B的模型

play15:15

那這個70億的參數到底是什麼意思呢

play15:21

我們還沒有講到參數的概念

play15:23

我們下一堂課會講參數的概念

play15:25

但是你現在就想成參數量越多

play15:28

就代表這個模型越厲害

play15:31

雖然實際上影響模型能力的這個因素還有很多

play15:35

不是隻有參數的數量

play15:37

不過今天大家往往把參數的數量

play15:39

來當作誇耀模型能力的一個指標

play15:44

那有70億個參數的模型

play15:47

70億聽起來是一個很大的數字

play15:49

跟地球的人口差不多多

play15:52

70億個參數的模型

play15:53

它是一個很大的模型嗎

play15:55

它顯然不是一個特別大特別厲害的模型

play15:59

因為這是我們課堂的一個作業

play16:01

你可以想像修完這堂課以後有上千人

play16:04

都能夠訓練70億個參數的模型

play16:07

而且你今天用免費的運算資源

play16:10

就可以訓練一個70億參數的模型

play16:12

所以它顯然不是一個特別厲害的模型

play16:16

但是要是你穿越到五年前

play16:20

穿越回2019年

play16:22

2019年的時候發生什麼事呢?

play16:24

2019年的時候

play16:26

OpenAI釋出了第二代的GPT

play16:30

那個時候網路上各種文章也是拼命的吹捧

play16:34

比如說史上最強NLP模型GPT2.0

play16:38

或者是逆天語言模型GPT2.0

play16:42

最大的模型GPT2.0

play16:45

但這個GPT2到底有多大呢?

play16:48

它只有15億個參數

play16:51

它大概是你今天作業要用的模型的四分之一到五分之一

play16:57

所以今天假設你帶著我們的作業穿越回五年前

play17:01

你手上有的是一個毀天滅地的巨大模型

play17:05

OpenAI跟Google看到你都得下跪你知道嗎

play17:08

這是一個當時最大大家沒有辦法想像的巨大模型

play17:13

這讓我想到什麼呢

play17:14

我想到贊頌的福利連

play17:16

這個是福利連那個動畫的第三話

play17:20

這個福利連已經播很久了

play17:22

所以講福利連的劇情不算爆雷了吧

play17:24

那如果你不怕被雷的話

play17:25

就把耳朵捂起來

play17:28

好來講個這個葬送的福利連裡面的故事

play17:31

這個福利連呢他是一個精靈

play17:33

他在80年前

play17:35

曾經參加勇者小隊去討伐魔王

play17:39

在魔王手下有一個很厲害的幹部

play17:41

叫做撫賢庫瓦爾

play17:43

撫賢庫瓦爾非常的厲害

play17:45

他發明瞭一個殺人魔法

play17:47

可以穿透任何的防禦

play17:50

所以沒有人可以擋住他的一擊

play17:52

所有的勇士都被他殺了

play17:55

連弗利連都沒有辦法打倒他

play17:58

只能夠把他暫時封印起來

play18:01

過了八十年之後

play18:03

他的封印鬆動了

play18:04

庫瓦爾復活了

play18:06

弗利連就帶著他的弟子費倫想要來幹掉庫瓦爾

play18:11

一開始費倫非常的緊張

play18:13

想說庫瓦爾他的殺人魔法是沒有辦法防禦的

play18:16

我們要怎麼樣才能夠打倒庫瓦爾呢

play18:19

弗莉蓮說到時候就知道了

play18:22

然後庫瓦爾呢對費倫使了一技殺人魔法

play18:25

弗莉蓮跟這個費倫說你就把防壁展開

play18:29

鏘就擋住了

play18:30

然後費倫就說這什麼殺人魔法

play18:33

不過就是普通攻擊而已啊

play18:35

對就是當80年前的殺人魔法

play18:39

過了80年後就只是普通攻擊而已

play18:42

因為80年對人類來說實在是太長了

play18:46

人類已經鑽研了庫瓦爾的魔法

play18:49

已經尋找到了防禦的方法

play18:52

而在生成式AI的領域也是一樣

play18:55

當年的GPT-2就像是庫瓦爾一樣

play18:59

當年一個毀天滅地的巨大模型

play19:01

今天在你的眼中

play19:03

也已經不算什麼了

play19:05

這個例子是要告訴你說生成式AI的技術變化是非常的快

play19:09

不要說是五年

play19:11

有時候五個月五個星期都會有很大的變動

play19:15

這邊講到作業就跟大家說一下這個作業的規劃

play19:21

作業的目標是要讓大家體驗生成式AI

play19:26

這個體驗分成兩個面向

play19:29

第一個層面的體驗是體驗我們怎麼用生成式AI來打造某些應用

play19:36

另外一個層面是教大家怎麼訓練出自己的生成式AI模型

play19:45

當然程式助教都已經寫好了

play19:48

要做的事情往往就是一直按Enter

play19:50

但是你可以體驗怎麼訓練出一個自己的生成式AI模型

play19:56

那在這門課裡面呢

play19:58

我保留了一些負面的體驗

play20:01

什麼樣負面的體驗呢

play20:02

比如說訓練模型很花時間

play20:05

那當然今天所謂的很花時間在作業裡面

play20:08

可能就是兩三個小時那麼久

play20:11

你知道這個痛苦是比較出來的

play20:14

你可能覺得訓練兩三個小時很花時間

play20:16

事實上如果你要訓練真正的大模型

play20:19

往往他的時間都是用周作單位來進行計算

play20:24

那另外你可能還會有什麼負面的體驗呢

play20:27

你可能會發現說

play20:28

就算你完全按照助教的指示按Enter

play20:32

你得到的結果

play20:33

可能也會跟主教得到的結果不一樣

play20:37

很多第一次訓練模型的同學會覺得非常的驚奇

play20:40

想說訓練模型不就是寫個程式嗎

play20:43

它是電腦啊

play20:44

它怎麼每次還會得到不一樣的結果呢

play20:47

我告訴你這個訓練模型呢

play20:49

你不要用程式來想它

play20:52

你要想成好像是在養小動物

play20:55

好像是在種花食草一樣

play20:58

它的結果往往是有可能無法預測的

play21:02

當然我們可以把這些負面的體驗拿掉

play21:05

就不讓你自己訓練模型就好

play21:06

但是我仍然把好幾個訓練模型的工作

play21:11

保存在作業中

play21:13

為了讓你得到一些負面的體驗

play21:15

期待這些負面的體驗

play21:16

可以像是疫苗一樣

play21:19

幫助你在未來面對更大的挑戰

play21:23

我知道說在座各位

play21:25

不是每一個人未來都會成為工程師

play21:28

不是每一個人都會訓練模型

play21:30

但也許透過這堂課的體驗你可以知道說

play21:33

訓練模型是可能很花時間的

play21:36

是可能很難預測的

play21:38

有一天你當了大老闆

play21:40

也許你可以對你手下的肥宅工程師多一些寬容

play21:47

好那這個是作業內容的規劃啦

play21:49

這門課呢總共有十個作業

play21:51

那公告的日期呢我都已經寫在投影片上

play21:54

那每一個作業呢如果沒有特別說明預設

play21:57

他的截止日期就是在兩週後

play22:00

那這些作業呢 有好幾個是需要寫程式 甚至是訓練模型的

play22:07

那有同學就會問說 那要訓練模型 我需要準備什麼東西呢

play22:12

我需要買自己的GPU嗎 你什麼都不用準備

play22:17

那在執行程式訓練模型的部分 我們都會用CodeLab或者是Cargo

play22:23

那你不知道CodeLab或Cargo是什麼也沒有關係

play22:25

總之你只要記得 你什麼都不用準備

play22:29

這邊我稍微估射了一下作業的難度

play22:34

在這個作業裡面如果打一個三角形就是送分給你

play22:38

所以等一下作業1還有下週講的作業2

play22:41

基本上就是送分給你

play22:43

這個開局就先送大家20分

play22:47

但是後面的作業會逐漸的有一些難度

play22:51

如果兩個三角形就是代表說

play22:53

假設你不在意分數的話

play22:55

這個作業也可能可以非常快完成

play22:58

但是假設你想要拿到滿分

play23:00

你還是需要花一些時間自己努力的

play23:04

那三個三角形代表說這個作業是需要訓練模型的

play23:07

所以你至少需要好幾個小時才能完成

play23:11

但我要再強調一次

play23:12

痛苦是比較出來的

play23:13

好幾個小時已經算是非常快了

play23:17

過去2015年我剛開機器學習這門課的時候

play23:20

有好幾個作業呢

play23:21

他的訓練時間大概是比如說三天

play23:24

我就跟同學講說這個作業就是要訓練三天

play23:27

所以今天假設離作業的截止日期不到三天

play23:31

你唯一能做的事情就是放棄這樣子

play23:34

因為你已經不可能把模型訓練出來了

play23:38

但今天訓練模型最多就是幾個小時

play23:41

你在前一晚作業deadline的前一晚再趕

play23:43

也許還來得及

play23:46

好所以有關這門課的份量呢

play23:48

我這邊給一個註解啦

play23:50

因為有十個作業

play23:51

幾乎每週都會公告一個作業

play23:53

所以就通識來看

play23:55

就假設你把這門課當作一個通識

play23:57

因為畢竟這門課的名字裡有導論這兩個字

play24:00

它不會是一個太難的課程

play24:02

但是如果把它當作通識來看

play24:04

它可以是一個非常充實的通識

play24:07

當然如果把它看作是選修課

play24:10

那它可能是一個比較輕鬆的負擔沒有那麼重的選修課

play24:15

那跟大家講一下作業可能的負擔給大家參考

play24:19

那有關上課內容規劃的部分

play24:21

這個我們下一節再講

play24:24

好,那這邊大家常常會問的一個問題就是

play24:26

這門課能不能夠用人工智慧

play24:29

比如說ChangeBT來寫作業呢?

play24:32

答案就是可以

play24:33

這個是深層式AI導論這門課

play24:36

當然應該可以用深層式AI來寫作業

play24:39

但是同時老師也要用人工智慧來改作業

play24:43

到時候我們的作業基本上能夠用大型語言模型改的

play24:47

我們都會用大型語言模型來批改

play24:50

這邊特別感謝NTK的達芬奇達哥團隊

play24:54

提供給我們達芬奇的平臺

play24:56

提供給我們算力跟提供給我們平臺

play25:00

讓我們可以透過達芬奇的平臺來批改作業

play25:04

就算他們知道說我們這一堂課可能會有超過一千人選修

play25:09

他們也願意無條件的大力支持

play25:12

所以在此特別感謝NTK的達哥團隊

play25:16

好那這個3月15號的時候呢

play25:19

MTK的團隊會來跟大家分享

play25:21

他們是怎麼使用生成式AI

play25:24

他們對生成式AI在業界有什麼樣的看法

play25:27

那5月24號的時候

play25:29

MTK自己也有開發大型語言模型

play25:32

所以技術團隊會來跟大家分享

play25:34

他們開發大型語言模型的心路歷程

Rate This

5.0 / 5 (0 votes)

Related Tags
深度学习生成式AI李宏毅AI原理模型训练技术趋势应用开发课程导论AI教育行业见解技术分享
Do you need a summary in English?