【生成式AI導論 2024】第0講:課程說明 (17:15 有芙莉蓮雷)
Summary
TLDR李宏毅教授在《生成式人工智能导论》课程中,分享了开设此课程的初衷,即帮助学生理解生成式AI的全貌和背后原理。他通过ChatGPT展示AI的实用性,并强调了理解AI原理的重要性。课程不要求先修知识,适合初学者,旨在培养学生对AI的深入理解,而非仅仅教会使用特定工具。课程作业将涵盖AI应用开发和模型训练,让学生体验AI技术的实际应用。
Takeaways
- 📚 李宏毅教授开设了《生成式人工智能导论》这门课程,旨在介绍深层式人工智能的原理和应用。
- 🤖 教授通过一个学生提问如何自动对文章分类的例子,引出了使用ChatGPT等生成式AI的便捷性。
- 🔍 ChatGPT可以作为一个强大的助手,通过简单的指令就能执行新闻分类等任务,无需深入学习机器学习原理。
- 🌐 通过展示ChatGPT的操作界面,说明了生成式AI的易用性和强大功能,强调了其作为工具的实用性。
- 🛠️ 课程将教授如何在自己的程序中调用像ChatGPT这样的AI,以嵌入到自己的应用或服务中。
- 🚀 李宏毅教授认为,生成式AI的发展速度非常快,过去需要自己开发和训练模型,现在可以直接使用现成的AI工具。
- 📈 课程不仅介绍ChatGPT,而是提供生成式AI的全貌,包括背后的原理和未来的可能性。
- 👨🏫 课程适合不同背景的学生,无需先修课程,可以作为人工智能领域的入门课程。
- 📝 通过作业,学生将体验使用生成式AI构建应用和训练自己的AI模型,尽管过程可能耗时且结果难以预测。
- 🔮 教授强调了理解AI原理的重要性,比喻为了解魔术背后的手法,能更深刻地欣赏其精妙之处。
- 🎓 课程内容将涵盖从基础概念到最新研究,鼓励学生阅读相关论文以深入了解AI技术的最新进展。
Q & A
李宏毅教授开设生成式人工智能导论课程的初衷是什么?
-李宏毅教授开设这门课程的初衷是因为在教授机器学习课程时,发现许多学生对机器学习的应用感兴趣,但可能并不需要深入了解机器学习的原理。他希望通过这门课程,让学生了解生成式AI的全貌以及背后的原理,帮助他们判断何时应该自己开发模型,何时可以使用现成的人工智能。
为什么李宏毅教授建议想要进行文章分类的学生直接使用ChatGPT而不是学习机器学习原理?
-李宏毅教授认为,如果学生的目标是实现具体的应用,如文章分类,而不是深入理解机器学习的原理,那么使用像ChatGPT这样的现成工具会更高效。这样可以节省时间,直接利用强大的AI能力来满足需求。
ChatGPT在实际应用中可以扮演什么角色?
-ChatGPT在实际应用中可以作为用户的智能助理,帮助完成各种任务,例如自动对文章进行分类,只要用户给出相应的指令和示例,ChatGPT就能根据这些信息进行操作。
如何将ChatGPT的功能嵌入到自己的应用程序或服务中?
-课程的第三次作业会教授学生如何在自己的程序中调用像ChatGPT这样的人工智能,以便将这种智能功能集成到自己的应用程序或服务里。
生成式人工智能导论课程与李宏毅教授之前开设的机器学习课程有何不同?
-生成式人工智能导论课程不专注于教授如何使用特定的工具或技术,如ChatGPT,而是旨在提供生成式AI的全貌和背后的原理。相比之下,机器学习课程更侧重于机器学习的原理和模型开发。
为什么李宏毅教授认为即使学生已经会使用ChatGPT,了解其背后原理仍然很重要?
-了解ChatGPT背后原理可以帮助学生更深入地认识这项技术,避免对其能力有错误的理解和期待。就像知道魔术背后的手法可以让人更欣赏魔术师的技巧,了解AI的原理可以让学生更精准地判断何时应该使用现成的AI工具,何时需要自己开发模型。
课程是否会涉及到如何使用ChatGPT?
-课程不会特别着重于教如何使用ChatGPT,因为ChatGPT的使用非常简单,且网络上已有大量教学资源。课程的重点是教授生成式AI的概念、原理以及未来的可能性。
学生是否需要有人工智能、数学或编程背景才能参加这门课程?
-不需要。这门课程没有预设任何先修要求,可以作为学生人生中的第一堂人工智能相关课程。
课程中的作业难度是如何分布的?
-课程作业的难度会逐渐增加。前两个作业相对简单,基本上是送分题,而后面的作业会涉及到编程和模型训练,难度会更高,需要学生投入更多的时间和精力。
学生在课程中是否会体验到训练模型的过程?
-是的,课程中的作业会让学生体验如何使用生成式AI来构建应用,并且会教授学生如何训练自己的生成式AI模型,让他们了解训练模型可能遇到的挑战,如时间消耗和结果的不确定性。
课程是否会使用外部平台或工具来辅助教学或作业批改?
-会的。课程中会使用CodeLab或Cargo等工具来辅助编程和模型训练,而且作业的批改可能会使用大型语言模型来完成,以提高效率。
Outlines
📚 课程介绍与生成式AI的启示
李宏毅教授在课程开始前介绍了开设生成式人工智能导论课的初衷。自2014年起在台大教授机器学习相关课程,并于2015年开设相关课程。一次课后,有学生询问如何让机器自动对文章分类,教授从机器学习的角度回答了问题,但随后意识到学生可能更关心如何实现文章分类而非学习机器学习原理。于是,教授推荐使用ChatGPT,并解释了ChatGPT的使用方法和功能,展示了如何通过简单的指令让ChatGPT对新闻进行分类。此外,教授还提到了如何将ChatGPT的功能嵌入自己的应用程序中,并强调了这门课程的目的是教授生成式AI的全貌,而不仅仅是如何使用ChatGPT。
🔮 生成式AI的趋势与课程定位
教授强调了生成式AI技术的快速发展,并指出了解这些技术可以帮助更精确地判断何时应该自己开发模型,何时可以使用现成的人工智能。课程的定位是介绍生成式AI的全貌,而不是仅仅教授如何使用ChatGPT。ChatGPT只是一个例子,学习使用它并不需要专门的课程,因为它的使用非常直观。课程的目标受众是已经使用过生成式AI并希望进一步了解其背后原理的人。教授还提到,这门课程不需要任何先修课程,可以是学生的第一门人工智能相关课程。
🎓 课程内容与学习目标
教授介绍了课程内容和学习目标,强调了理解生成式AI背后的概念和原理的重要性。通过学习这些原理,学生可以更深入地理解AI的能力,避免对其有错误的期待。课程与机器学习课程相比,内容差异很大,即使是已经学习过机器学习的学生,也能从这门课程中获益。课程旨在为学生提供人工智能的基础知识,为将来学习更高级的课程打下基础。
🚀 技术发展速度与作业规划
教授讨论了生成式AI技术的快速发展,并用GPT-2模型的发展来说明这一点。通过比较过去和现在的模型大小,强调了技术进步的速度。课程作业的目标是让学生体验使用生成式AI构建应用,并尝试训练自己的模型。教授提到,尽管训练模型可能耗时且结果可能无法预测,但这些体验对于学生未来面对挑战是有帮助的。
🛠️ 作业要求与资源支持
教授介绍了作业的要求和资源支持情况。学生不需要自己准备GPU或其他硬件资源,所有编程和模型训练都将通过CodeLab或Cargo平台完成。教授还对作业难度进行了评估,并提到了作业的截止日期。此外,教授提到了使用大型语言模型来批改作业的计划,并感谢了NTK的达芬奇团队对课程的支持。
🤖 业界分享与课程展望
教授提到了MTK团队将在课程中进行分享,介绍他们如何使用生成式AI以及他们对这项技术的看法。此外,MTK的技术团队也会分享他们开发大型语言模型的经验。这些分享将为学生提供业界视角,增进对生成式AI应用和开发的理解。
Mindmap
Keywords
💡生成式人工智能
💡机器学习
💡ChatGPT
💡模型训练
💡参数
💡GPT-3.5与GPT-4
💡应用嵌入
💡技术发展速度
💡预训练模型
💡CodeLab和Cargo
💡达芬奇平台
Highlights
李宏毅教授开设生成式人工智能导论课程,旨在介绍深层式人工智能的原理和应用。
教授自2014年起在台大教授机器学习相关课程,并于2015年开设了生成式人工智能导论。
学生提出如何让机器自动对文章分类的问题,教授建议使用ChatGPT而非深入学习机器学习原理。
ChatGPT页面简单,只有一个对话框,但功能强大,可作为个人助理。
通过ChatGPT可以轻松实现新闻分类等任务,展示了生成式AI的实用性。
课程将教授如何在自己的程序中调用像ChatGPT这样的人工智能。
教授强调生成式AI技术日新月异,课程旨在教授长期适用的概念和原理。
课程不要求学生有人工智能、数学或编程背景,适合作为人工智能的第一门课程。
了解生成式AI背后原理的重要性,类比于了解魔术背后的手法。
课程内容与机器学习课程有较大差异,即使学过机器学习也能从中获益。
课程作业将教授训练一个70亿参数的模型,体验生成式AI的构建和训练过程。
教授比喻训练模型的过程就像养小动物或种花草,结果可能无法预测。
课程作业将使用CodeLab或Cargo平台,学生无需自备GPU等硬件资源。
课程作业设计包括正面和负面体验,让学生全面理解生成式AI的构建过程。
课程将使用大型语言模型进行作业批改,提高效率并减少教师负担。
NTK团队将分享他们在业界使用生成式AI的经验和看法。
MTK技术团队将分享他们开发大型语言模型的心得和技术细节。
Transcripts
好 那個各位同學大家好啊
感謝大家來生成式人工智慧導論這門課捧場
那我們就開始上課
我是李宏毅
那在開始上課之前呢
我們先講一下
為什麼我會想要開深層式人工智慧導論這門課
那我從2014年開始在臺大任教
然後2015年呢
每年都開機器學習相關的課程
那在去年的春季班
在機器學習這門課的下課後呢
有一個同學來問我這樣一個問題
他問說
怎麼讓機器自動對一篇文章做分類
那這是機器學習的課程
我就從機器學習的角度來回答他
告訴他說這是一個很標準的分類問題
你要先準備一些標注資料
然後你就可以訓練一個自己的模型
講到這邊
我腦中突然想起了一個聲音
我突然獲得了一個天啟
我問他說
你是真的想要學機器學習的原理嗎
還是你只是想要知道
怎麼做到文章分類這件事
你為什麼會想要做文章分類呢
他說
這是我新創需要的服務
那我說你還浪費時間學機器學習嗎
別管我剛才說的那些,直接Call ChatGPT就好了
這句話到底是什麼意思呢?當我說直接用ChatGPT就好的時候
到底是什麼意思呢?
也許我直接操作一下,大家會比較能夠想像
這個是ChatGPT的頁面
那我這邊用的是GPT-3.5
GPT-3.5是免費的
GPT-4是需要付費的
所以我等一下展示的功能
是免費版的功能
是每一個人都可以
唾手取得的功能
那第一次看到這個
ChatGPT的頁面的人啊
往往會不知所措
這個頁面上就
只有一個對話框
那在這個對話框裡面
可以輸入任何的文字
但這樣一個
我們可以跟我們對話的人工智慧
到底有什麼樣的作用呢
我會無聊到需要每天跟ChetGPT說話嗎
我有寂寞到需要跟人工智慧不斷的聊天嗎
可能沒有
所以很多人覺得說
這不過是一個聊天機器人
他能有什麼作用
事實上呢
ChetGBT可以是你的好助理
你有什麼要求
直接告訴他
舉例來說
我們今天想要對新聞
做分類
那你直接把你的指令貼給他
跟他說
新聞就分成以下的類別
那這邊呢就簡單定義一下
新聞分成政治社會財經生活
影視娛樂體育
等等
那接下來呢跟他說以下我會給你一篇新聞
請告訴我這篇新聞屬於哪一類
只給我類別就好
接下來就貼一段新聞的內容給他
比如說這邊
隨便找一個新聞
元宵
逢最小滿月
隨便貼一段新聞給他
就貼在這邊
然後輸入
他就告訴你說這則新聞呢
屬於生活
或者我們再試另外一個例子吧
這邊這個是跟AI有關的新聞
那我們把這段新聞的直接貼到這裡
那GPT知道說這個是影視娛樂
所以你可以輕易的用GPT打造你想要的AI應用
但是有人可能會想說這個是一個demo的網頁啊
我要怎麼把這個功能
嵌入我的應用裡面
嵌入我的服務裡面
那在這門課的作業三會告訴你
怎麼在你自己的程式中
呼叫像ChairGPT這樣的人工智慧出來幫你做事
總之我的想法是
大人時代變了
過去呢
在做這個人工智慧有關的應用的時候
我們往往都是自己開發人工智慧的模型
自己訓練機器學習的模型
這就像是在決鬥的時候用劍一樣
今天有人可以直接掏出一把槍
在瞬間就完成人工智慧的應用
所以也許作為一個人工智慧的基礎的課程
我想要開一門新的課
告訴大家今天這個世界
如果你想做人工智慧相關應用的話
可能是什麼樣子
當然有能力自己開發模型
仍然非常重要
所以並不是說機器學習這門課就不重要
也並不代表我以後就不會開機器學習這門課
那我只是想要告訴大家說
瞭解今天生成式AI的趨勢
瞭解今天生成式AI的技術
發展到什麼地步
可以幫助你更精確的判斷
什麼時候你應該自己開發模型
什麼時候可以用一個現成的人工智慧
好那在開始課程之前呢
我來講一下這門課的定位
那因為這個課的一開場呢
就跟你講了ChatGPT
可能會給你帶來一個誤解
我看到網路上有很多同學說
這是一門教大家怎麼用ChatGPT的課
那其實這不是一門
教大家怎麼用ChatGPT的課
ChatGPT
只是眾多生成式人工智慧的其中一個例子
當然他是今天最具有代表性的應用
所以我們課堂上一定會反覆的提到
ChatGPT這一個人工智慧
但他只是生成式AI的一個例子而已
而這門課要講的是
期待能夠帶給大家生成式AI的全貌
那其實ChatGPT非常容易上手
很多人都會問說
我要怎麼學習用ChatGPT呢
用ChatGPT這件事情是不用學的
你只要能夠跟另外一個人溝通
你大概就有辦法跟ChatGPT溝通
所以學習用ChatGPT這件事
其實不需要花一整個學習的時間
來學怎麼用ChatGPT
而且另外一方面
ChatGPT的學習資源真的非常多
你要在YouTube上面打ChatGPT
滿坑滿谷的網紅通通在教你
怎麼用ChatGPT
在這個去年年初ChatGPT剛火的時候
只要是個網紅通通在講ChatGPT
歷史的頻道就要讓ChatGPT
偽裝成歷史的古人跟他對話
一個打遊戲王的頻道也要逼迫ChatGPT
跟他玩遊戲王
明明ChatGPT根本玩不了遊戲王
也要逼迫ChatGPT跟他玩遊戲王
總之已經有太多人
提供ChatGPT的教學資源
所以這一門課要講的
並不是教你怎麼使用ChatGPT
這一個人工智慧的應用
那這一門課要講的是什麼呢
這一門課呢我預設的目標受眾是
假設你已經用過ChatGPT這類的生成式AI
你知道他們可以做什麼
你知道他們有多厲害
但是你想要更進一步瞭解這些生成式AI背後的原理
他們到底是怎麼來的
怎麼被訓練出來的
怎麼變得像今天一樣這麼厲害
以及你想要知道這一些人工智慧
未來有什麼樣的可能性
還有哪些可能的發展
這一門課就是為你開的
那為什麼這一門課不會特別著重某一個應用
比如說ChatGPT的使用呢
因為今天這個技術真的是日新月異
而如果你在這個2022年年底
ChatGPT一上線的時候就有用它的話
你會發現ChatGPT現在它的介面
跟它剛上線的時候
介面已經有很大的差異
它能做的事 它的能力也有非常多的不同
所以這個應用是日新月異
所以你在某一門課
就算你學到了怎麼使用ChatGPT
可能同樣的技巧
在幾個月甚至幾週之後
就已經不適用了
但我們在大學開一堂課是希望可以教你
也許在往後數年甚至一輩子都可以用得上的東西
所以這一門課真正想要傳達的
並不是教你怎麼用ChatGPT這一個應用
而是告訴你深層式AI背後概念和原理
那這一門課呢
我沒有預設需要任何的預修課程
也就是如果你想要修這一門課的話
你不需要修過任何人工智慧相關的課程
不需要有任何數學跟程式的背景
也不需要修過任何機器學習相關的課程
這門課可以是你人生的第一堂人工智慧相關課程
那有人可能會問說我已經會用ChatGPT了
用ChatGPT就是如此的簡單
只要你會說話
只要你會打字
你知道怎麼跟另外一個人溝通
你就可以用ChatGPT
我已經會用啦
那會用就好啦
我幹嘛知道他背後的原理是什麼
那確實就算你不知道Chain 3D的原理
你也有機會打造人工智慧的應用
但是瞭解他的原理
可以帶你走向另外一個層次
假如像說魔術非常的神奇
今天的人工智慧也像是魔術一樣
但是如果你又知道魔術背後的手法的話
你在觀看魔術的時候
你可以更能夠欣賞
魔術師他厲害的地方
你看到魔術師把一個人聚成兩半再黏在一起的時候
你不會覺得他是真的把人聚成兩半
然後用念能力把他黏在一起
你會知道說這是一個手法
你不會覺得魔術師是一個有超能力的人
或者是一個念能力者
你知道這是魔術的手法
那對於深層式AI也是一樣的
今天深層式AI展現出非常神奇的能力
但是假設你可以正確瞭解他背後的概念跟原理的話
那就好像是瞭解了魔術背後的手法
你可以更精確的認識他
至少你不會對他的能力有錯誤的誤解
或有錯誤的期待
那有同學問我說這門課跟機器學習
我自己開機器學習這門課
有什麼重疊的地方嗎
呃
你應該要問說還有什麼一樣的地方
基本上就是沒有什麼一樣的地方
所以就算是你修過我的機器學習
或者是修過其他老師開的機器學習
我相信這一門課也可以帶給你很大的幫助
那我剛才有說這一門課可以作為你的人工智慧的第一堂課
你可以把這一門課作為你學人工智慧的基礎
未來再去學其他機器學習相關的課程
那要再聲明一下在這一門課你不會學到什麼
因為這是一門入門的課
所以如果我們繼續用魔術這個比喻的話
這一門課會手把手帶你變幾個魔術
但是可能不足以訓練你成為魔術師
也沒有辦法帶你創造新的魔術
但這並不代表說這一門課是沒有用的
這一門課可以作為
假設你的目標未來是要成為頂尖的魔術師
要做些大變活人之類的
那這一門課可以作為你成為魔術師的開始
那上課因為時間有限
然後把這門課設定為是兩學分的課
所以我們上課時間只有兩個小時而已
因為上課時間有限
所以我們無法深入提到所有的技術
所以很多地方可能會讓你覺得
我什麼都脫了
就只給我看這個
所以很多地方可能沒有辦法講得非常的深入
但是這是你的第一門人工智慧的課
他不會是你最後一門人工智慧的課
未來你可以修其他相關的課程
或者是假設你想要深入研究
上課所提到的一些技術背後的原理的話
你可以看投影片上引用的論文
那講到引用這件事啊
我講一下說
在我們這門課
我們的投影片上
多數的論文呢
都是引用來自一個叫做
archive 的網站
所以看到說
上課引用的論文連結
他上面會寫這個
archive.org
archive 是什麼呢
如果是這個電腦科學領域的同學
一定都知道Archive是什麼
但我知道說這門課的同學呢
來自於各個不同的領域
所以我介紹一下什麼是Archive
我知道說一般我們在做這個研究的時候
你知道說你做研究有了一個新的想法
那你會把你的想法呢寫成論文
發表在國際會議跟國際期刊上
但是這個國際會議國際期刊論文往往一審
都是個一年半載
對於AI的領域而言
技術變化實在是太快了
一年半載的時間往往就會有翻天覆地的變化
往往你投一篇文章
六個月之後被國際會議接受
那個技術已經不行了
所以怎麼辦呢
有一個網站叫做阿凱
今天往往你有新的想法
尤其是電腦科學人工智慧相關的新的論文
往往不先投國際會議 先直接放archive
搶先公開出來
所以在archive上比較容易找到最新的研究
那這邊教大家怎麼看archive文章上傳的時間
那archive的文章後面都會有一個數字
這個數字的前兩個代表的是年份
後面兩個數字代表的是月份
所以2205的意思就是
這篇文章是在2022年的5月被公開來放在R-CAPE上
之後你在我們的課程的投影片上
會看到很多文章
這些文章往往是幾個月前
甚至是幾週前才被放在R-CAPE上的
那講到這個技術迅速的變化這件事啊
我就想分享一件事情
在這門課裡面
我們的作業會教大家訓練一個
有70億個,7個Billion
縮寫是7B,7B這麼多參數的模型
雖然說是訓練,但實際上是微調啦
不過我們還沒有講到訓練跟微調的差異
這個我們之後再講
現在就當作你要訓練一個7B的模型
那這個70億的參數到底是什麼意思呢
我們還沒有講到參數的概念
我們下一堂課會講參數的概念
但是你現在就想成參數量越多
就代表這個模型越厲害
雖然實際上影響模型能力的這個因素還有很多
不是隻有參數的數量
不過今天大家往往把參數的數量
來當作誇耀模型能力的一個指標
那有70億個參數的模型
70億聽起來是一個很大的數字
跟地球的人口差不多多
70億個參數的模型
它是一個很大的模型嗎
它顯然不是一個特別大特別厲害的模型
因為這是我們課堂的一個作業
你可以想像修完這堂課以後有上千人
都能夠訓練70億個參數的模型
而且你今天用免費的運算資源
就可以訓練一個70億參數的模型
所以它顯然不是一個特別厲害的模型
但是要是你穿越到五年前
穿越回2019年
2019年的時候發生什麼事呢?
2019年的時候
OpenAI釋出了第二代的GPT
那個時候網路上各種文章也是拼命的吹捧
比如說史上最強NLP模型GPT2.0
或者是逆天語言模型GPT2.0
最大的模型GPT2.0
但這個GPT2到底有多大呢?
它只有15億個參數
它大概是你今天作業要用的模型的四分之一到五分之一
所以今天假設你帶著我們的作業穿越回五年前
你手上有的是一個毀天滅地的巨大模型
OpenAI跟Google看到你都得下跪你知道嗎
這是一個當時最大大家沒有辦法想像的巨大模型
這讓我想到什麼呢
我想到贊頌的福利連
這個是福利連那個動畫的第三話
這個福利連已經播很久了
所以講福利連的劇情不算爆雷了吧
那如果你不怕被雷的話
就把耳朵捂起來
好來講個這個葬送的福利連裡面的故事
這個福利連呢他是一個精靈
他在80年前
曾經參加勇者小隊去討伐魔王
在魔王手下有一個很厲害的幹部
叫做撫賢庫瓦爾
撫賢庫瓦爾非常的厲害
他發明瞭一個殺人魔法
可以穿透任何的防禦
所以沒有人可以擋住他的一擊
所有的勇士都被他殺了
連弗利連都沒有辦法打倒他
只能夠把他暫時封印起來
過了八十年之後
他的封印鬆動了
庫瓦爾復活了
弗利連就帶著他的弟子費倫想要來幹掉庫瓦爾
一開始費倫非常的緊張
想說庫瓦爾他的殺人魔法是沒有辦法防禦的
我們要怎麼樣才能夠打倒庫瓦爾呢
弗莉蓮說到時候就知道了
然後庫瓦爾呢對費倫使了一技殺人魔法
弗莉蓮跟這個費倫說你就把防壁展開
鏘就擋住了
然後費倫就說這什麼殺人魔法
不過就是普通攻擊而已啊
對就是當80年前的殺人魔法
過了80年後就只是普通攻擊而已
因為80年對人類來說實在是太長了
人類已經鑽研了庫瓦爾的魔法
已經尋找到了防禦的方法
而在生成式AI的領域也是一樣
當年的GPT-2就像是庫瓦爾一樣
當年一個毀天滅地的巨大模型
今天在你的眼中
也已經不算什麼了
這個例子是要告訴你說生成式AI的技術變化是非常的快
不要說是五年
有時候五個月五個星期都會有很大的變動
這邊講到作業就跟大家說一下這個作業的規劃
作業的目標是要讓大家體驗生成式AI
這個體驗分成兩個面向
第一個層面的體驗是體驗我們怎麼用生成式AI來打造某些應用
另外一個層面是教大家怎麼訓練出自己的生成式AI模型
當然程式助教都已經寫好了
要做的事情往往就是一直按Enter
但是你可以體驗怎麼訓練出一個自己的生成式AI模型
那在這門課裡面呢
我保留了一些負面的體驗
什麼樣負面的體驗呢
比如說訓練模型很花時間
那當然今天所謂的很花時間在作業裡面
可能就是兩三個小時那麼久
你知道這個痛苦是比較出來的
你可能覺得訓練兩三個小時很花時間
事實上如果你要訓練真正的大模型
往往他的時間都是用周作單位來進行計算
那另外你可能還會有什麼負面的體驗呢
你可能會發現說
就算你完全按照助教的指示按Enter
你得到的結果
可能也會跟主教得到的結果不一樣
很多第一次訓練模型的同學會覺得非常的驚奇
想說訓練模型不就是寫個程式嗎
它是電腦啊
它怎麼每次還會得到不一樣的結果呢
我告訴你這個訓練模型呢
你不要用程式來想它
你要想成好像是在養小動物
好像是在種花食草一樣
它的結果往往是有可能無法預測的
當然我們可以把這些負面的體驗拿掉
就不讓你自己訓練模型就好
但是我仍然把好幾個訓練模型的工作
保存在作業中
為了讓你得到一些負面的體驗
期待這些負面的體驗
可以像是疫苗一樣
幫助你在未來面對更大的挑戰
我知道說在座各位
不是每一個人未來都會成為工程師
不是每一個人都會訓練模型
但也許透過這堂課的體驗你可以知道說
訓練模型是可能很花時間的
是可能很難預測的
有一天你當了大老闆
也許你可以對你手下的肥宅工程師多一些寬容
好那這個是作業內容的規劃啦
這門課呢總共有十個作業
那公告的日期呢我都已經寫在投影片上
那每一個作業呢如果沒有特別說明預設
他的截止日期就是在兩週後
那這些作業呢 有好幾個是需要寫程式 甚至是訓練模型的
那有同學就會問說 那要訓練模型 我需要準備什麼東西呢
我需要買自己的GPU嗎 你什麼都不用準備
那在執行程式訓練模型的部分 我們都會用CodeLab或者是Cargo
那你不知道CodeLab或Cargo是什麼也沒有關係
總之你只要記得 你什麼都不用準備
這邊我稍微估射了一下作業的難度
在這個作業裡面如果打一個三角形就是送分給你
所以等一下作業1還有下週講的作業2
基本上就是送分給你
這個開局就先送大家20分
但是後面的作業會逐漸的有一些難度
如果兩個三角形就是代表說
假設你不在意分數的話
這個作業也可能可以非常快完成
但是假設你想要拿到滿分
你還是需要花一些時間自己努力的
那三個三角形代表說這個作業是需要訓練模型的
所以你至少需要好幾個小時才能完成
但我要再強調一次
痛苦是比較出來的
好幾個小時已經算是非常快了
過去2015年我剛開機器學習這門課的時候
有好幾個作業呢
他的訓練時間大概是比如說三天
我就跟同學講說這個作業就是要訓練三天
所以今天假設離作業的截止日期不到三天
你唯一能做的事情就是放棄這樣子
因為你已經不可能把模型訓練出來了
但今天訓練模型最多就是幾個小時
你在前一晚作業deadline的前一晚再趕
也許還來得及
好所以有關這門課的份量呢
我這邊給一個註解啦
因為有十個作業
幾乎每週都會公告一個作業
所以就通識來看
就假設你把這門課當作一個通識
因為畢竟這門課的名字裡有導論這兩個字
它不會是一個太難的課程
但是如果把它當作通識來看
它可以是一個非常充實的通識
當然如果把它看作是選修課
那它可能是一個比較輕鬆的負擔沒有那麼重的選修課
那跟大家講一下作業可能的負擔給大家參考
那有關上課內容規劃的部分
這個我們下一節再講
好,那這邊大家常常會問的一個問題就是
這門課能不能夠用人工智慧
比如說ChangeBT來寫作業呢?
答案就是可以
這個是深層式AI導論這門課
當然應該可以用深層式AI來寫作業
但是同時老師也要用人工智慧來改作業
到時候我們的作業基本上能夠用大型語言模型改的
我們都會用大型語言模型來批改
這邊特別感謝NTK的達芬奇達哥團隊
提供給我們達芬奇的平臺
提供給我們算力跟提供給我們平臺
讓我們可以透過達芬奇的平臺來批改作業
就算他們知道說我們這一堂課可能會有超過一千人選修
他們也願意無條件的大力支持
所以在此特別感謝NTK的達哥團隊
好那這個3月15號的時候呢
MTK的團隊會來跟大家分享
他們是怎麼使用生成式AI
他們對生成式AI在業界有什麼樣的看法
那5月24號的時候
MTK自己也有開發大型語言模型
所以技術團隊會來跟大家分享
他們開發大型語言模型的心路歷程
Ver Más Videos Relacionados
5.0 / 5 (0 votes)