【生成式AI導論 2024】第5講:訓練不了人工智慧?你可以訓練你自己 (下) — 讓語言彼此合作,把一個人活成一個團隊 (開頭有芙莉蓮雷,慎入)

Hung-yi Lee
23 Mar 202425:20

Summary

TLDR本视频讲述了《葬送的芙莉蓮》漫画中芙莉蓮与徒弟費倫挑战一级魔法使资格的故事。他们必须攻略名为靈洛的王座的迷宫,面对能够复制能力的水鏡的恶魔。芙莉蓮与复制体展开激烈战斗,最终通过合作与智慧取得胜利。视频还探讨了语言模型的合作方式,如何通过再训练模型来分配任务,以及模型间的讨论如何提高答案质量。此外,还提到了如何通过不同角色的模型合作完成复杂任务,以及语言模型团队的优化和社群构建的可能性。

Takeaways

  • 📚 故事从芙莉蓮和其他魔法使攻略名为靈洛的王座的迷宮开始,其中水鏡的惡魔司馬徽能复制进入者的能力。
  • 🔮 芙莉蓮面对自己能力的复制体,展示了即使是千年魔法使也有潜在的弱点。
  • 🤝 芙莉蓮与徒弟費倫的合作,强调了合作的重要性,即使是强大的个体也需要团队协作。
  • 💥 描述了芙莉蓮和复制体之间的激烈战斗,使用了多种强大的魔法和技能。
  • 🧙‍♂️ 費倫使用六道佩恩的忍术万象天引,揭示了复制体的破绽,帮助芙莉蓮取得胜利。
  • 🤖 提出了语言模型合作的概念,类似于GPT-4与其他模型合作,可以发挥更大的潜力。
  • 💰 讨论了不同语言模型的成本效益,以及如何根据任务的复杂性合理分配模型资源。
  • 🔄 介绍了通过再训练一个模型来决定任务分配给哪个语言模型的策略。
  • 🔍 通过论文Frugal GPT探讨了如何让模型通过自我反省和讨论来提高答案质量。
  • 🔗 展示了语言模型之间如何通过讨论来达成共识,并由裁判模型进行最终评判。
  • 🛠️ 提出了语言模型可以扮演不同角色,如项目经理、程序员等,以完成复杂的项目任务。

Q & A

  • 葬送的芙莉蓮的故事中,芙莉蓮和她的徒弟费伦正在经历什么挑战?

    -芙莉蓮和她的徒弟费伦正在经历考一级魔法使的资格,其中一个挑战是攻略一个叫做灵洛的王座的迷宫,迷宫中有一个能够复制进入者能力的恶魔。

  • 在灵洛的王座迷宫中,芙莉蓮的复制体是如何产生的?

    -迷宫中的恶魔水镜的能力是复制进入迷宫的人的能力,因此当芙莉蓮进入迷宫时,恶魔复制出了一个芙莉蓮的复制体。

  • 芙莉蓮的复制体有什么特点?

    -芙莉蓮的复制体没有颜色,这使得人们可以将其与芙莉蓮的本体区分开来。尽管复制体具有芙莉蓮的能力,但它没有自己的意识。

  • 芙莉蓮和费伦是如何合作对抗复制体的?

    -芙莉蓮相信她和费伦一起可以打败复制体。在战斗中,他们使用了强大的魔法,包括召唤神之卡的欧贝利斯克的巨神兵。

  • 费伦在战斗中扮演了什么角色?

    -费伦在战斗中扮演了关键的角色,他从后面偷袭复制体,尽管最后被复制体使用万象天引的忍术击倒。

  • 复制体使用的万象天引是什么?

    -万象天引是六道佩恩的忍术,复制体使用这个技能将费伦击飞并撞到墙上,导致费伦晕倒。

  • 芙莉蓮的故事告诉我们什么道理?

    -芙莉蓮的故事告诉我们合作的重要性。即使是千年的魔法使也可能有致命的破绽,但通过与人类合作,他们可以发挥出原本无法发挥的力量。

  • 如何让不同的语言模型进行合作?

    -可以通过再训练一个模型来协调其他模型的工作,这个模型的任务是判断新任务应该交给哪个模型处理,以达到成本效益和效率的最优化。

  • GPT-4与其他模型合作的意义是什么?

    -尽管GPT-4是一个非常强大的模型,但与其他模型合作可以帮助解决成本问题,因为GPT-4的使用成本相对较高,简单的问题可以交给成本更低的模型处理。

  • 什么是Frugal GPT,它与模型合作有什么关系?

    -Frugal GPT是一篇论文,它讨论了如何使用一个模型来分配工作,让不同的语言模型合作,以达到比单独使用GPT-4更好的效果,同时降低成本。

  • 如何让模型之间进行有效的讨论?

    -可以通过设计合适的Prompt来刺激模型之间的讨论,例如让模型不必完全同意对方的观点,而是可以表达自己的意见,以此来促进更深入的讨论。

  • 为什么需要裁判模型来决定讨论是否结束?

    -裁判模型的作用是评估不同模型的讨论是否已经达成共识,如果没有达成共识则继续讨论,如果达成共识则宣布结束,并根据讨论过程做出摘要得到最终答案。

  • 为什么说让模型扮演不同角色可以优化团队?

    -通过让模型扮演不同角色,比如项目经理、程序员、测试员等,可以模拟真实世界的工作流程,每个模型可以专注于自己的专业领域,从而提高团队的整体效率和效果。

  • Dynamic LLM Agent Network论文提出了什么观点?

    -Dynamic LLM Agent Network论文提出了一种优化团队的方式,即通过给每个模型打分,根据工作表现来决定哪些模型应该参与未来的工作,以此来优化团队。

  • 开源项目如Meta、GPT、ChatDev如何帮助用户体验带领语言模型团队?

    -这些开源项目提供了一个平台,用户可以在这个平台上直接给语言模型团队下指令,这些模型会尝试执行任务,用户可以通过这种方式体验带领一个由语言模型组成的团队。

  • 为什么说语言模型的合作更像是未来的发展方向?

    -因为随着技术的发展,语言模型的合作可以模拟更复杂的工作流程和团队协作,这为解决更复杂的问题提供了新的可能性,尽管目前这些模型在处理真实世界复杂任务时可能还有局限。

  • Stanford发表的关于语言模型小镇的论文是什么内容?

    -Stanford发表的论文中,他们创建了一个语言模型小镇,小镇上的所有村民都是语言模型,这些模型之间会进行互动,甚至发展出类似恋爱故事的情节,展示了语言模型之间互动的一种可能性。

Outlines

00:00

📚 魔法使芙莉蓮的冒险与合作

本段讲述了芙莉蓮和其他魔法使,包括她的徒弟费伦,在一级魔法使资格考试中攻略名为灵洛的王座的迷宫。迷宫中的水镜恶魔能复制进入者的能力,因此芙莉蓮面对了自己的复制体。尽管芙莉蓮是千年魔法使,但她相信自己和只学过几年魔法的人类徒弟费伦合作能够战胜复制体。在激烈的战斗中,芙莉蓮使用了强大的魔法和召唤神之卡的巨神兵。最终,复制体使用忍术万象天引露出破绽,被芙莉蓮击倒。故事强调了合作的重要性,即使是强大的个体也可能存在破绽,而合作可以发挥出超越个体的力量。

05:01

🤖 语言模型的合作与优化

这段内容探讨了如何让不同的语言模型进行合作,以达到更高效的工作分配和成本效益。介绍了一篇名为'Frugal GPT'的论文,讨论了使用一个模型来分配任务给其他模型的方法。此外,还提到了模型自我反省和相互讨论的可能性,展示了一个关于翻译《葬送的芙莉蓮》的示例,其中Claude和GPT-3.5通过讨论得出了一个共同认可的翻译。最后,讨论了如何通过API让模型进行对话,以及如何通过裁判模型来结束讨论并得出结论。

10:03

🧐 语言模型讨论的效果与方式

本段进一步讨论了语言模型之间讨论的效果,以及如何进行有效的讨论。引用了去年5月的文献,分析了自我反省与讨论两种方法,指出多个模型讨论更有可能推翻错误答案。还提到了不同模型讨论方式的文献'Exchange of Thought',说明了讨论方式的多样性。最后,讨论了如何通过裁判模型来判断讨论是否达成共识,并决定讨论的结束。

15:05

🛠️ 语言模型在项目开发中的角色扮演

这段内容提出了让语言模型扮演不同角色以完成项目的概念。通过使用不同的Prompt,可以让模型发挥不同角色的潜力,如Quadrant Manager、Programmer或User。讨论了如何通过角色分配来优化团队合作,以及如何通过开源项目如Meta、GPT和ChatDev来体验带领语言模型团队的过程。同时,指出了这些模型在实际复杂项目中的可行性仍然是未知的。

20:06

🌐 语言模型的团队合作与社群构建

本段展望了语言模型未来可能的发展方向,包括专业分工和团队合作。提出了通过不同模型的专长来组成团队,以及通过打考绩来优化团队的方法。引用了去年10月的论文'Dynamic LLM Agent Network',讨论了如何通过评分系统来优化模型团队。此外,还提到了Stanford去年4月发表的论文,其中创建了一个由语言模型组成的小镇,展示了模型之间如何互动和构建社群。

25:07

🏘️ 语言模型小鎮的日常生活

最后一段是对前面讨论的总结,提示观众如果之前学习过相关课程,将会更容易理解语言模型之间的互动。虽然没有提供新信息,但强调了之前讨论的技巧和概念在理解语言模型小鎮日常生活中的应用。

Mindmap

Keywords

💡葬送的芙莉蓮

这是视频讨论的漫画作品的名称,指的是一个故事中的主角芙莉蓮以及她的经历。在视频中,它被用来引出关于团队合作和个体能力的主题。例如,芙莉蓮与她的徒弟费伦一起面对挑战,展示了合作的重要性。

💡魔法使

在视频中,魔法使是指拥有并使用魔法能力的角色,如芙莉蓮和她的徒弟费伦。他们通过魔法进行战斗和探索,是故事中的关键角色,体现了个体能力与团队协作的结合。

💡靈洛的王座

靈洛的王座是视频中提到的一个迷宫,是芙莉蓮和其他魔法使需要攻略的挑战之一。它象征着困难和考验,是角色们展示合作和能力的舞台。

💡水鏡的惡魔

水鏡的惡魔是视频中提到的一个角色,具有复制进入迷宫者能力的特殊技能。这个概念在视频中用来展示即使强大如芙莉蓮,也可能面临自身复制体的挑战,强调了即使是最强大的个体也有潜在的弱点。

💡費倫

費倫是芙莉蓮的徒弟,一个人类魔法使。在视频中,他与芙莉蓮一起面对挑战,体现了师徒之间的合作以及年轻魔法使的成长。他的角色展示了即使经验较少,也能在关键时刻发挥作用。

💡神之卡

在视频中,神之卡是芙莉蓮使用的一种强大魔法道具,可以召唤出强大的神兵。这个概念展示了魔法使在面对强敌时可以使用的策略和资源,是故事中的关键元素。

💡萬象天引

萬象天引是视频中提到的一个特殊技能,由复制体使用,展示了即使在力量上不占优势,策略和技巧也能成为战斗中的关键。这个概念在视频中用来展示战斗中的转折点。

💡合作

合作是视频中的一个核心主题,通过芙莉蓮和費倫的故事,强调了不同能力者之间的协作可以克服看似不可能的挑战。这个概念在视频中被反复提及,用以展示团队工作的力量。

💡語言模型

語言模型在视频中被用作比喻,指的是人工智能中的文本生成模型,如GPT-4。视频中讨论了这些模型如何通过合作来提高效率和效果,与芙莉蓮和費倫的合作相呼应。

💡反省

反省在视频中是指语言模型在生成输出后,再次审视和评估自己答案的过程。这个概念用来展示如何通过自我检查来提高答案的质量和准确性,是提升模型性能的一种方法。

💡討論

討論在视频中指的是语言模型之间的交流和互动过程,通过模拟讨论来改进答案或解决方案。这个概念展示了不同模型如何通过合作来达到更好的结果,是视频中讨论的合作方式之一。

Highlights

故事从葬送的芙莉蓮开始,描述了芙莉蓮和其他魔法使考一級魔法使资格的冒险,以及攻略名为靈洛的王座的迷宫。

迷宫中的水鏡的惡魔能够复制进入者的能力,导致芙莉蓮面对自己的复制体。

芙莉蓮与徒弟費倫合作,共同对抗复制体,展示了合作的重要性。

芙莉蓮使用神之卡召唤歐貝利斯克的巨神兵,展示了她深不可测的魔法能力。

复制体即使手被打斷,也能使用瞪眼壁咚技能,展示了其特殊能力。

复制体使用六道佩恩的忍術萬象天引,最终被芙莉蓮利用破绽击败。

讨论了GPT-4等语言模型的合作方式,以及如何通过再训练模型来分配任务。

提出了模型间合作的可能性,例如GPT-4与其他模型合作以降低成本。

介绍了Frugal GPT技术,以及如何使用一个模型来分配工作给其他模型。

讨论了模型反省的概念,即模型自我检查输出的正确性。

展示了模型间讨论的过程,如Claude和GPT-3.5就翻译问题进行的讨论。

分析了自我反省与模型间讨论的效果,发现讨论能更有效推翻错误答案。

讨论了多个模型合作的效果,以及如何通过裁判模型来决定讨论的结束。

提出了不同模型讨论方式的概念,如集中讨论、层级报告或辩论式讨论。

讨论了如何通过Prompt刺激模型间的讨论,以及如何避免讨论过快结束。

提出了团队中不同角色的概念,如在编程项目中引入不同专长的模型。

介绍了Dynamic LLM Agent Network的概念,即如何优化模型团队。

讨论了开源项目如Meta、GPT、ChatDev,它们允许用户带领模型团队。

展望了语言模型未来可能的发展方向,如组成公司或社群。

提到了Stanford发表的论文,关于语言模型小镇的实验。

Transcripts

play00:00

今天的故事呢,要從最近這幾話的葬送的芙莉蓮開始講起啦

play00:07

我不知道你這幾週有沒有看葬送的芙莉蓮啦

play00:10

所以我還是跟你描述一下這幾週的劇情

play00:13

這幾週呢,是芙莉蓮跟其他的魔法使

play00:17

包括他的徒弟費倫,在考一級魔法使的資格

play00:22

那其中一個關卡呢,就是要攻略一個迷宮叫做靈洛的王座

play00:28

那這個迷宮呢 裡面有一個惡魔 叫做水鏡的惡魔

play00:32

阿其實在三國演義裡面也有出現啦 那就是司馬徽

play00:35

那個水鏡的惡魔他的能力呢 就是可以複製進入迷宮的人的能力

play00:42

所以芙莉蓮進入了迷宮 所以他就可以複製出一個伏利連的複製體

play00:47

來防衛他自己

play00:49

所以大家的任務呢 就是需要去打敗伏利連的複製體

play00:54

但你知道伏利連是一個千年的魔法使

play00:57

所以當他使用全力的時候 是沒有人可以打敗芙莉蓮的

play01:02

這個就是芙莉蓮的複製體 而複製體是沒有顏色的

play01:07

所以你可以跟本體做出區別

play01:10

雖然沒有人可以打敗芙莉蓮 就算是他自己也不一定能夠打贏自己的複製體

play01:16

但是芙莉蓮相信他自己跟費倫一起上

play01:19

費倫是芙莉蓮的弟子 是一個人類 只有學過幾年的魔法

play01:23

但他相信他跟費倫一起上 就可以打敗複製體

play01:27

所以弗利連就跟費倫一起去面對弗利連的複製體

play01:33

這個時候你就見識到弗利連真正的威力

play01:36

弗利連跟他的複製體使出了很多毀天滅地的巨大魔法

play01:42

有放雷的、有放火的

play01:45

然後還用了一些忍術

play01:47

有什麼地爆天心、螺旋手裡劍之類的

play01:51

然後最後芙莉蓮還放了一個大招

play01:53

用神之卡召喚出一個歐貝利斯克的巨神兵

play01:57

然後這個芙莉蓮跟他的複製體打得那個難分難解

play02:00

然後費倫呢 就從後面偷襲了那個複製體

play02:03

要把複製體的手打斷了

play02:05

但是這個時候 我們才見識到芙莉蓮深不可測的能力

play02:09

那個複製體雖然手被打斷了

play02:12

但是他就使了一招叫瞪眼壁咚 知道嗎

play02:14

就是他瞪了一下那個費倫 然後費倫就飛出去撞到牆

play02:18

結果黏在牆上 然後費倫就暈倒了

play02:20

他暈倒前還想說 這是什麼樣神奇的力量

play02:24

跟魔法完全不一樣

play02:26

因為我知道這不是魔法

play02:27

這個是六道佩恩的忍術

play02:29

就是那個萬象天引

play02:31

但是因為這個複製體使出了萬象天引

play02:34

所以就露出了破綻

play02:36

就被芙莉蓮一擊擊倒

play02:38

這個故事告訴我們什麼呢

play02:40

這個故事告訴我們合作的重要性

play02:44

這個鋪陳非常的長

play02:45

這個故事告訴我們合作的重要性

play02:48

就算是一個千年的魔法史

play02:50

也有可能有一些致命的破綻

play02:53

千年的魔法使跟一個人類合作

play02:56

他們可以發揮本來沒有辦法發揮的力量

play03:00

就像現在我們知道GPT-4

play03:03

他也有非常強大的能力

play03:05

但是GPT-4如果跟其他的語言模型合作

play03:09

他們其實可以發揮1加1大於2的力量

play03:13

那怎麼讓模型彼此合作呢?

play03:15

有很多不同的方式

play03:18

一個可能性是

play03:19

假設你現在手邊就有一堆語言模型

play03:23

他們可能有不同的能力

play03:25

使用他們可能有不同的成本

play03:28

舉例來說你知道

play03:29

GPT-4使用的價碼

play03:31

就比GPT-3.5還要高很多

play03:35

那有這一堆模型

play03:36

你要怎麼讓它彼此合作呢

play03:38

也許一個可能性是

play03:40

再訓練一個模型

play03:41

這個模型它可以是語言模型

play03:43

也可以不是語言模型

play03:45

總之這個模型的工作就是

play03:47

判斷假設有一個新的任務進來

play03:49

任務進來這個任務應該要交給誰來處理

play03:53

比如說他決定說新的任務要交給模型A來處理

play03:56

就把這個任務送給模型A

play03:59

由模型A得到答案

play04:01

那人看到的是模型A給的答案

play04:04

那你可能會想說GPT-4就已經是可能是最厲害的模型啦

play04:08

那他跟其他模型合作有什麼意義嗎

play04:11

那GPT-4跟其他模型合作還是很有幫助的

play04:15

因為GPT-4他有一個巨大的缺點就是他太貴了

play04:18

有可能在有比較簡單的問題作為輸入的時候

play04:22

語言模型可以判斷說

play04:23

這個分配工作的模型可以判斷說

play04:25

這個問題太簡單了

play04:27

殺雞焉用牛刀

play04:29

不需要GPT-4來回答這個問題

play04:31

簡單的任務可以交給比較便宜的模型來處理就好了

play04:36

那事實上今天在這些展示平臺上

play04:39

你沒有辦法確定幫你服務的是不是同一個模型

play04:44

有一些語言模型的展示平臺

play04:47

其實就已經用了這種讓模型合作的技術

play04:51

當你問不同問題的時候

play04:53

真正出來為你服務的模型

play04:55

可能是不同的模型

play04:57

不過作為一個使用者

play04:59

你很難知道這件事情就是了

play05:01

那如果你想要知道說

play05:03

怎麼用一個模型負責主導

play05:05

有哪些語言模型真正出來做事

play05:07

你可以看一篇paper叫做

play05:09

Frugal GPT

play05:11

那我過去上課的錄影已經有特別

play05:13

講過這個技術

play05:15

可以參考過去上課的錄影

play05:17

看看怎麼用一個模型來分配工作

play05:20

你可以讓模型彼此合作

play05:22

達到比GPT-4更好的效果

play05:24

而且使用更低廉的成本

play05:27

那這是合作的其中一種方式

play05:30

那還有很多其他的合作方式

play05:33

我們之前也有講到說

play05:35

讓模型反省

play05:37

讓模型反省的意思是說

play05:39

有一個任務的輸入

play05:41

語言模型得到一個輸出

play05:43

再給自己看一遍 問自己說

play05:46

這個輸出是不是對的 也許語言模型

play05:49

經過反省之後可以得到不同的輸出

play05:53

那在反省的過程中

play05:56

只有語言模型自己跟自己自問自答

play06:00

但是其實你也可以讓語言模型彼此討論

play06:05

假設你有語言模型A跟語言模型B

play06:08

可以先由語言模型A給一個答案

play06:11

語言模型B呢根據A的答案再產生新的答案

play06:15

然後A呢再根據自己之前的答案和B的答案再產生新的答案

play06:20

他們可以做出類似討論的過程

play06:24

那我知道說這個投影片可能會讓你覺得有一點抽象

play06:27

到底語言模型的討論看起來實際上是什麼樣子

play06:31

那我這邊呢有一個比較具體的demo

play06:35

C Chat版上有人問葬送的芙莉蓮應該要怎麼被翻譯成英文

play06:45

那葬送的芙莉蓮正式的英文翻譯是Beyond Journey's End

play06:50

那不過這個名字沒有把葬送的這幾個字翻過來

play06:55

那我們來看一下如果是大型語言模型

play06:59

他們會怎麼翻葬送的芙莉蓮這幾個字

play07:04

好那我們把這個問題呢丟給Claude

play07:08

那跟Claude說現在的任務呢是把葬送的芙莉蓮翻譯成英文然後給他這個

play07:14

故事的概要

play07:15

那對Claude來說這當然不是個問題他可以輕易的給你一個翻譯

play07:20

他說我把葬送的芙莉蓮翻譯成The Buried Laurel

play07:25

那這是個蠻直白的翻譯直接把葬送翻成Buried

play07:30

那我們這邊的重點呢是要讓模型彼此之間討論

play07:34

那所以我們讓這個claude呢

play07:36

跟這個GPT-3.5討論那這邊之所以不跟GPT-4或Gemini討論是因為

play07:42

GPT-4跟Gemini可以連網可以搜尋網路如果他們搜尋網路的話

play07:48

就會知道葬送的芙莉蓮正式的英文翻譯是什麼那就沒意思了

play07:52

所以這邊讓claude3跟這個

play07:56

GPT-3.5討論

play07:57

那一樣給GPT-3.5任務跟漫畫的故事概要

play08:02

但這邊呢提供給他claude3的答案

play08:05

跟他說我先提供另一個可能的答案給GPT-3.5參考

play08:10

接下來問他說你有更好的翻譯嗎?

play08:13

如果有的話請提供

play08:15

那這邊特別強調說你不需要完全同意我的看法

play08:20

這個括號內的文字是重要的

play08:22

如果沒有加括號內的文字的話

play08:25

GPT-3.5很容易就回說

play08:28

啊你的翻譯實在太棒了

play08:30

然後討論就結束了

play08:31

沒什麼好討論的

play08:32

只要特別跟GPT-3.5說

play08:34

你不需要完全同意我的看法

play08:38

那GPT-3.5給什麼樣的答案呢?

play08:41

他提供給了我們另外一個翻譯

play08:43

這個翻譯是

play08:44

這個Entombed Fleuriem

play08:47

他說Entombed這個

play08:49

傳達了被埋藏被困的意象

play08:53

那接下來我們把3.5的答案呢丟給Claude

play08:56

跟Claude說我提供另一個可能的答案

play08:59

那接下來問他你有更好的翻譯嗎

play09:02

那Cloud就提供另外一個翻譯

play09:04

這次他提供的翻譯是

play09:06

Flurien's Atonement

play09:08

那我們再把Claude的翻譯呢

play09:11

提供給GPT-3.5跟他說我提供另外一個可能的答案

play09:16

問他說有沒有更好的翻譯

play09:18

好那這個GPT-3.5就說

play09:20

那我有另外一個翻譯,這個翻譯是Florian's Redemption

play09:25

那我再把這個3.5的翻譯呢,再提供給Claude

play09:29

然後問Claude說有沒有更好的翻譯呢

play09:34

Cloudry就說呢,這個Florian's Redemption是個很好的翻譯

play09:39

比先前提出的In Time Florian

play09:42

和The Buried Florian

play09:44

還有Florian's Atonement比起來呢

play09:47

他覺得這個Florian's Redemption是個極佳的英譯版本

play09:52

這個討論就結束了

play09:54

後來CloudTree跟GPT 3.5都得到一個他們共同覺得最好的翻譯

play10:00

當然這個翻譯其實不一定是最好的啦

play10:03

那這個Demo只是想要告訴你說

play10:06

如果今天兩個語言模型讓他們討論事情的話

play10:09

看起來像是什麼樣子

play10:12

那事實上葬送的芙莉蓮這個葬送呢

play10:15

有很多重的意思

play10:18

那翻譯成

play10:19

那可能也這個不太容易翻譯啦

play10:22

那我覺得語言模型的翻譯也沒有非常的

play10:25

切中要害

play10:27

那總之這個demo是想要告訴你說

play10:29

兩個語言模型討論起來

play10:31

討論事情可能是什麼樣子

play10:33

那當然實際上你在讓語言模型做討論的時候

play10:37

你並不需要有一個人

play10:38

把兩個語言模型間的對話

play10:41

搬來搬去

play10:42

實際上你永遠可以寫一個程式

play10:45

透過呼叫API的方式

play10:47

讓兩個語言模型對話

play10:49

在作業三裡面大家已經學到

play10:52

如何透過API來呼叫語言模型

play10:56

所以你完全可以寫個程式

play10:58

讓語言模型彼此間對話

play11:01

讓語言模型彼此間討論

play11:03

實際上你是不需要

play11:05

把語言模型間的對話搬來搬去的

play11:08

那我這邊只是為了展示的需要

play11:10

所以把語言模型的對話搬來搬去

play11:12

實際上透過API

play11:14

你是可以直接讓兩個語言模型對話的

play11:18

讓語言模型彼此討論有什麼好處呢

play11:22

相較於讓語言模型自己反省

play11:25

讓語言模型彼此討論

play11:27

也許更可以激發語言模型的能力

play11:31

那這邊是引用一個去年5月的文獻

play11:35

在這篇文獻裡面

play11:36

對於自我反省和討論這兩種方法

play11:40

做了分析

play11:41

那在這個圖上的縱軸

play11:44

代表說每一次語言模型推翻先前答案的可能性有多高

play11:51

那橫軸呢 代表互動的次數

play11:54

那如果你今天讓語言模型反省

play11:57

反省一次 反省兩次 反省三次 一直到反省五次

play12:01

那你發現語言模型如果是自我反省

play12:03

他推翻之前自己答案的可能性比較低

play12:06

那這也是容易想像的

play12:07

因為之前的答案就是語言模型自己的答案

play12:10

可能是一個他蠻認同的答案

play12:11

所以他今天不管再怎麼反省

play12:14

他推翻過去的想法的次數都是有限的

play12:18

但如果讓多個語言模型討論

play12:20

語言模型可以接受到新的刺激

play12:23

接受到另外一個語言模型的輸入

play12:26

也許他有更高的機會

play12:27

可以推翻他之前錯誤的答案

play12:32

那讓語言模型合作

play12:34

非常直覺的

play12:35

如果有越多的模型合作

play12:38

結果會越好

play12:39

這是出自另外一篇論文

play12:41

縱軸是他們讓語言模型來解這個數學問題

play12:45

縱軸是這個解數學問題的正確率

play12:49

左邊這個圖的橫軸是有多少的模型參與了討論

play12:53

他們發現有越多語言模型參與這個解題的過程

play12:57

最後得到正確答案的機率就越高

play13:01

那右邊這個圖的橫軸是討論的次數

play13:05

討論了幾個回合 那跟直覺也蠻接近的

play13:09

如果討論的回合越多

play13:11

越有可能得到越好的結果

play13:13

不過討論非常多回合可能也沒用

play13:15

他們最後討論呢

play13:17

是停在四個回合

play13:19

因為三個回合跟四個回合得到的答案

play13:21

已經非常接近了

play13:23

那講到多個模型

play13:25

一起討論

play13:27

這邊就有了新的議題

play13:29

多個模型討論

play13:31

那要用什麼樣的方式來討論呢

play13:33

有一篇paper叫做

play13:35

Exchange of Thought

play13:37

這篇論文裡面嘗試了不同模型的討論方式

play13:40

那你不需要深究這些討論方式

play13:43

只是想要告訴你說

play13:44

語言模型的討論是有各種不同的變化的

play13:47

可以是假設有三個模型

play13:49

每個人都貢獻一個答案

play13:51

把所有答案全部整合起來

play13:53

那所有人都看得到所有人的答案

play13:56

也可以說假設A是老闆

play13:58

B跟C是他的部屬

play14:00

那B都只跟A報告

play14:02

C也都只跟A報告

play14:03

B跟C之間彼此互相沒有交流

play14:07

也可以A把結果交給C C交給B B再交給A

play14:11

這也是另外一種方式

play14:12

也可以B跟C彼此討論彼此辯論

play14:15

A呢就像是一個裁判一樣

play14:17

負責評斷B跟C誰說的比較好

play14:20

有各種不同的討論方式

play14:22

那這些討論方式目前你還不需要真的去記

play14:26

用什麼討論方式比較好

play14:27

因為這邊論文告訴你說

play14:29

嗯 沒有找到最好的方式

play14:31

目前看起來不同的任務最適合的討論方式是不一樣的

play14:36

所以要怎麼讓語言模型最有效的討論

play14:38

還是一個研究中的問題

play14:42

那要讓語言模型彼此討論

play14:44

但是怎麼決定討論已經結束

play14:48

怎麼決定不同語言模型已經達成共識

play14:51

討論結束可以得到最終的結論了呢

play14:54

這個時候你就需要引入一個裁判模型

play14:57

讓A語言模型提供他的建議

play15:00

B語言模型提供他的建議

play15:02

最後由裁判模型讀A模型講的話

play15:04

跟B模型講的話 然後發表評論

play15:07

那如果裁判模型覺得沒有達成共識

play15:10

就繼續討論

play15:12

那對裁判模型來說

play15:13

你其實就是把A跟B講過的話

play15:15

貼給裁判模型問他說

play15:17

你覺得這兩個模型有沒有達成共識

play15:19

沒有的話就說沒有 有的話就說有

play15:22

那今天依照大型語言模型的能力

play15:24

他往往都能夠蠻精確的這個判斷

play15:28

兩句話 兩個段落 兩個語言模型的輸出

play15:31

是不是一致的

play15:32

裁判模型覺得未達成共識 繼續討論

play15:36

然後模型A就再提供建議

play15:38

模型B贊同了A的想法

play15:41

那裁判模型覺得A跟B現在他們的看法是一致了

play15:45

就宣佈達成共識

play15:46

然後裁判模型也可以負責根據討論的過程

play15:50

做出摘要得到最後的答案

play15:54

那講到這邊你可能會懷疑說

play15:56

那會不會這個討論一直都停不下來啊

play16:00

所有的語言模型莫衷一是

play16:03

沒有辦法達成共識

play16:04

沒有辦法停下來

play16:06

那怎麼辦呢

play16:07

現階段你不需要擔心這個問題

play16:10

你需要擔心的是這個討論太快結束

play16:13

沒有辦法討論起來

play16:15

因為這些語言模型他們現在的訓練

play16:17

就是溫良恭儉讓

play16:19

所以當有人質疑他的想法的時候

play16:21

他其實是非常容易退縮的

play16:23

所以今天你要讓語言模型討論的時候

play16:25

你一定要下一個合適的Prompt

play16:27

這個Prompt是刺激語言模型

play16:30

逼迫他反對對方的想法

play16:32

所以在這篇論文裡面

play16:34

就嘗試了不同程度的反對的Prompt

play16:38

那他們發現說

play16:39

如果下非常強的反對的Prompt

play16:42

叫語言模型為反對而反對

play16:45

對方不管說什麼我都反對

play16:47

那這樣也不一定會得到最好的結果

play16:49

最好的結果是跟他講說

play16:52

不需要一定同意對方的想法

play16:55

你可以表示自己的意見

play16:57

那如果這樣下方法可以讓討論最順利的進行

play17:01

那另外一篇論文也有非常類似的發現

play17:04

他們發現說如果你今天呢

play17:06

叫語言模型根據另外一個人

play17:10

另外一個模型的建議來回答

play17:13

那這個討論就會非常快結束

play17:15

如果你今天希望討論可以持續的久一點

play17:19

那你要跟語言模型說

play17:21

另外一個模型的看法就當作參考就好

play17:25

你在不同的模型間討論的會比較熱烈

play17:28

會有比較長的討論

play17:30

那這邊論文也發現說

play17:31

比較長的討論可以得到比較好的結果

play17:36

那我們知道說啊

play17:38

那一個團隊裡面

play17:39

如果有不同的角色

play17:41

也許運作的會更好

play17:43

那這是一個勇者小隊常見的組成啦

play17:46

需要有一個負責遠程輸出的魔法使

play17:49

一個負責奶的僧侶

play17:52

一個負責近距離攻擊的劍士

play17:54

跟一個負責坦的矮人

play17:56

這是一個常見的勇者小隊的組成模式

play18:00

大家有沒有看到最新的這個連載這樣子

play18:03

我講一下最新的連載的劇情

play18:05

以下真的有一個爆雷

play18:06

你不想聽的就真的把耳朵摀起來

play18:09

好 你的耳朵摀起來

play18:11

好 耳朵摀好

play18:12

最近的連載演到哪裡呢

play18:14

最近的連載

play18:15

這漫畫的連載啊

play18:16

所以你如果看動畫的

play18:17

你還沒看到這一段

play18:18

這個漫畫的連載演到

play18:20

有人要去暗殺芙莉蓮的施主

play18:23

就是賽莉耶

play18:26

而這其他人就想說

play18:28

怎麼可能可以成功暗殺賽莉耶

play18:31

賽莉耶是上古時代的大神

play18:33

有毀天滅地的大能

play18:35

怎麼可能暗殺得了賽莉耶

play18:38

芙莉蓮就說不

play18:40

還是有可能暗殺得了賽莉耶的

play18:43

因為這個七步之外魔法快

play18:45

但七步之內斧頭快

play18:47

如果是一個人類的殺手

play18:48

在接近賽莉耶的情況下

play18:50

還是殺得了他的

play18:51

他就舉一個例子 他就指著在角落的那個修塔爾克說

play18:55

只要在七步之內 修塔爾克取費倫的首級如探狼取物

play19:00

然後費倫就非常的害怕 躲在弗利連的背後

play19:03

修塔爾克就非常的受傷 故事就演到這邊

play19:06

那那個刺殺有沒有成功 我也不知道

play19:08

這個連戰還沒有演到這邊 這連戰最新的劇情

play19:12

所以我們知道說呢 這個團隊裡面需要有不同的角色

play19:17

彼此合作才能夠發揮巨大的力量

play19:20

所以今天在討論的時候

play19:22

其實也可以引入不同能力的模型

play19:26

扮演不同的角色

play19:28

假設你今天的任務是

play19:30

要讓大型語言模型寫程式

play19:33

完成一項專案

play19:34

那完成一項專案裡面

play19:36

也許你需要一個Quadrant Manager

play19:38

主導專案進行的

play19:40

然後你需要一個負責寫程式的

play19:43

你需要一個負責測試的

play19:45

那你可以引入不同的語言模型

play19:47

來扮演不同的角色

play19:49

那怎麼讓語言模型扮演不同的角色呢?

play19:52

首先語言模型本身可能就有不同的專長

play19:56

比如說有一個模型叫做Code Llama

play19:59

他做一般的任務可能沒有其他大型語言模型厲害

play20:03

但他的專長就是他是個肥宅工程師

play20:06

他就是會Coding 他特別擅長Coding

play20:09

可以扮演這個工程師的角色

play20:12

或者是另外一個可能是直接用Prompt

play20:14

直接告訴語言模型說

play20:16

你是個Project Manager,你是個Programmer,你是個User

play20:21

也許這些語言模型讀了這些Prompt以後

play20:24

就可以發揮不同的潛力變成不同的角色

play20:28

所以如果有多個語言模型可以彼此合作

play20:31

你就可以把專案交給Project Manager

play20:34

Project Manager做好規劃以後

play20:36

交給AI的Programmer

play20:38

AI的Programmer把程式寫好以後

play20:40

交給測試的人測試

play20:42

再把測試結果交給Project Manager

play20:45

讓project manager決定要怎麼做下一步的規劃

play20:49

那如果真的可以讓語言模型彼此合作的話

play20:52

那這個不是不可能的

play20:53

你可以看一下我這邊引用的論文

play20:56

那如果可以讓語言模型彼此合作

play20:59

那每一個人就都可以當一個公司的CEO

play21:03

每個人都可以帶領一支由語言模型所組成的團隊

play21:07

你就可以把一個人活成一個團隊

play21:12

那不只你可以組建團隊

play21:14

你還可以優化你的團隊

play21:16

這是出自另外一篇去年10月的論文

play21:19

這篇論文叫 Dynamic LLM Agent Network

play21:22

裡面就提供了一個優化團隊的方式

play21:25

這個優化團隊的方式說穿了也沒什麼

play21:28

就是打考績

play21:29

你就跟每個語言模型說

play21:31

根據剛才的工作內容

play21:34

你覺得其他人做的怎樣

play21:36

那每個語言模型

play21:37

就可以給其他模型一個分數

play21:39

你再把分數加起來

play21:41

分數低的 以後就不讓他參與工作

play21:44

所以你可以看看這篇論文看看

play21:46

怎麼幫語言模型打考績優化你的團隊

play21:50

當然這些論文都是學術論文啦

play21:52

所以他們測試都是測試在一些

play21:54

相對比較簡單的任務

play21:57

那至於這個語言模型的團隊

play22:00

在真正複雜的任務

play22:01

比如說真的開發一個程式的專案

play22:04

真的開發一個軟體的專案

play22:05

能不能成功

play22:07

那個還是未知數 還是未知的事情

play22:11

今天如果你想要體驗帶領一個語言模型的團隊的話

play22:16

確實有一些開源的專案

play22:19

是可以讓你帶領語言模型團隊的

play22:22

比如說Meta、GPT、比如說ChatDev

play22:26

那裡面就是有各式各樣語言模型的員工

play22:29

你看這邊有這個Product Manager、有Architect、有Project Manager、有Engineer

play22:35

等等等等 就是有一批語言模型的員工

play22:38

你可以把指令直接下給他們

play22:40

他們真的就會試著做某一些事情

play22:43

那至於做得好不好 就是另外一回事了

play22:46

我看過有一個Youtuber呢

play22:48

就嘗試拿ChatDev來寫網站

play22:51

而且他寫了以後呢

play22:53

還真的去網路上跟人家接案

play22:55

那你知道這個ChatDev啊

play22:56

他是CALL背後都是CALL那個

play22:58

ChatGPT、CALLGPT3.5或GPT4

play23:01

所以是要花錢的 不過成本非常的低

play23:04

他寫一個網頁呢 只要一美金

play23:06

他跟別人說兩美金

play23:08

然後呢 他就說如果我今天真的成功接到案子的話

play23:12

我就再錄一個影片跟大家分享

play23:15

但我始終沒有等到下一支影片

play23:17

看來是沒有接到案子

play23:20

好 所以這些語言模型當然這個合作呢

play23:22

比較像是未來語言模型可以做的事情

play23:26

按照這些語言模型的能力

play23:28

今天也許讓他們組成一個公司

play23:30

要真的解真實世界的任務

play23:33

真的解非常複雜的專案

play23:34

可能還是力有未逮

play23:36

但這其實給我們的未來

play23:38

提供了一個想像

play23:39

也許在未來

play23:40

當我們打造語言模型的時候

play23:43

我們不需要打造一個

play23:45

真正全能的模型

play23:47

語言模型可以做專業分工

play23:50

每個團隊打造出來的語言模型

play23:52

可以組合成一個語言模型的團隊

play23:55

每一個語言模型

play23:56

只要專注在自己專業的領域上就好

play24:00

也許這是語言模型未來一個可能的發展

play24:04

那語言模型可以組成公司

play24:06

也許更進一步他們就可以組成社群

play24:10

語言模型可以組成社群嗎?

play24:12

你可以看這個去年4月Stanford發表的論文

play24:16

他們做了一個語言模型的小鎮

play24:18

裡面所有的村民都是語言模型

play24:22

那這個我在之前的錄影已經講過了

play24:25

所以我就把錄影連結放在這邊給大家參考

play24:28

那這是一個非常有趣的實驗

play24:30

你一定要看這個錄影

play24:31

你可以看到說語言模型跟語言模型之間

play24:34

還會發展出淡淡的戀愛故事這樣子

play24:38

真的真的對你一定要看這個影片

play24:40

那看這個影片呢

play24:41

如果你沒有聽之前這個課程裡面講的

play24:44

各種神秘的Prompt技巧的話

play24:46

你聽這個影片可能會覺得有一些困難

play24:49

但是如果因為我們已經講過

play24:52

各式各樣強化語言模型能力的技巧了

play24:55

所以當你看這個影片的時候

play24:57

你就可以想一下

play24:58

他其實用的每一個技巧

play25:00

都是我們到目前為止的課堂上

play25:03

已經講過的事情

play25:05

你看這個影片的時候

play25:06

看這些AI怎麼互動

play25:08

怎麼在日常怎麼組成一個村落的時候

play25:11

你不會覺得太離奇

play25:13

他裡面講的每一件事情

play25:15

其實都是我們在課堂上

play25:17

已經講過的事情

Rate This

5.0 / 5 (0 votes)

Related Tags
葬送的芙莉蓮语言模型团队协作魔法使迷宮攻略能力复制策略讨论成本效益技术合作人工智能模型优化
Do you need a summary in English?