OpenAI o1 智商120,怎么跟它玩?| o1 使用教程

檀东东·Tango
28 Sept 202415:42

Summary

TLDR这段视频讲述了最新发布的o1大模型的强大推理能力及其在解决复杂问题中的表现。通过烧绳子问题展示了o1在推理速度和准确性上的优势,且o1具备强大的系统2思考模式,类似于人类的慢思考。视频还讨论了o1在分析、优化、创作和总结等多个领域的出色表现,并指出只有行业专家才能提出有深度的问题,从而最大化o1的价值。最后,视频展望了o1未来的发展潜力及其应用场景。

Takeaways

  • 🚀 o1的发布标志着AI发展进入新阶段,开启了第二种缩放定律,为AI技术指明了新方向。
  • 🧠 o1在科学、代码和数学等复杂任务上展现出强大的推理能力,能够解决以往AI难以处理的问题。
  • ⏱️ o1能在极短时间内(15秒)解决烧绳子等复杂问题,其思考过程类似于人类的系统2思考方式。
  • 📈 o1的数学能力显著增强,能够稳定解答高考数学选择题,甚至填空题,显示了其推理和计算能力。
  • 💡 o1能够理解并回答即使包含错别字的问题,减少了对精确提示词的需求。
  • 🔍 o1能够进行深入的分析和推理,帮助用户解答实际问题,如分析城市经济状况。
  • 📝 o1在优化改良方面表现出色,能够对已有内容进行深度分析并提出改进建议。
  • 🎨 o1在范式创作方面能力强大,能够根据特定模型创作出高质量的内容。
  • 📊 o1的总结归纳能力超群,能够总结出提问模型如CLEAR模型,帮助用户更有效地提问。
  • 🌟 o1的潜力巨大,尤其对研究者和行业专家来说,能够提出深刻具体的问题,发挥o1的最大价值。

Q & A

  • O1模型是在什么时候发布的?

    -O1模型是在9月13号发布的。

  • 云栖大会上关于O1模型的讨论持续了多长时间?

    -云栖大会上关于O1模型的讨论持续了53分钟,超过一半的时间都在讨论O1。

  • O1模型开启了哪种新的缩放定律?

    -O1模型开启了第二种缩放定律,即Scaling law。

  • O1模型擅长解决哪些方面的问题?

    -O1模型擅长解决科学、代码、数学方面的复杂任务和难题。

  • O1模型在解决烧绳子问题时的表现如何?

    -O1模型可以轻松解决烧绳子问题,并且能够详细描述出解题的步骤和思考过程。

  • O1模型的推理能力有多强?

    -O1模型的推理能力非常强,能够快速准确地解决复杂问题,并且其推理过程类似于人类的系统2思考过程。

  • O1模型在数学能力方面的表现如何?

    -O1模型在数学能力方面表现非常出色,能够稳定地解答高考数学选择题,并且能够解答填空题。

  • O1模型的智商被测试为多少?

    -O1模型的智商被测试为120,远超普通人水平。

  • O1模型能够轻松解答哪四类难题?

    -O1模型能够轻松解答分析推理问题、优化改良问题、范式创作问题和总结归纳问题。

  • O1模型在广告文案创作方面的表现如何?

    -O1模型在广告文案创作方面表现出色,能够根据3M模型快速创作出满足不同需求的广告文案。

  • O1模型提出的提问模型是什么?

    -O1模型提出的提问模型是CLEAR模型,包括提供问题的背景信息(C)、说明任何相关的限制条件或特殊要求(L)、表达问题表述要清晰具体(E)、告知你已经尝试过的解决方案或者思路避免重复(A)、详细说明您对答案的输出要求(R)。

Outlines

00:00

💡 O1开启新缩放定律,推理能力突破

本段主要介绍了O1模型的发布及其强大的推理能力。作者通过'烧绳子'的经典推理题展示了O1的优越表现,O1能在15秒内准确解决这一复杂问题,表现出类似人类系统2思维的推理过程。此外,O1在数学和代码等复杂任务中的表现也超越了以往的GPT-4o和Claude 3.5,证明了其推理者阶段的强大能力。O1的问答系统更加智能,甚至无需提示词即可准确理解问题并提供正确答案。

05:00

📈 打印店反映城市经济冷暖

作者举了一个实际案例,说明为什么与打印店老板交谈能反映城市经济状况。O1分析指出,打印业务量、服务需求类型和客户多样性是经济状况的三大指标。当城市经济活跃时,建筑业的增长、标书打印的频繁以及行业的多样化需求都会增加,反映出经济健康。O1的分析逻辑清晰且结构化,展现了其强大的推理能力。

10:01

🛠 O1优化提纲:从80分到95分

O1通过分析和优化用户提供的提纲,展示了其卓越的改进能力。针对现代汽车国际化发展提纲,O1指出了内容和结构上的不足,包括缺乏宏观环境分析、竞争对手分析不充分、文化差异等问题,并给出了具体的改进建议。最终,O1不仅提出了结构更优化的新提纲,还展示了如何通过智能修改提升内容质量。

15:02

📢 3M广告模型创作:引导用户消费

O1展示了在广告文案创作中的出色能力。根据3M广告模型,O1为投影仪撰写了满足不同需求的广告文案,从吸引更多用户到鼓励用户多次使用及消费更昂贵的产品,O1在短时间内生成了高质量的广告文案。通过修正不符合预期的部分,O1展示了其快速生成高效内容的能力,尤其是在more users、use more和more expensive的3M模型下的应用。

📝 CLEAR提问模型:高效提问新方法

O1总结了一个帮助用户更好向它提问的模型——CLEAR模型。该模型包括五个步骤:背景信息、限制条件、问题表述、尝试过的方法和答案要求。这一模型旨在帮助用户提出更清晰、具体的问题,以便O1能够更有效地回应复杂问题。该模型展现了O1在总结归纳和创新思维上的强大能力,为用户提供了一种更高效的提问方式。

📊 O1的强大潜力:面向专家的工具

最后,作者总结了O1的主要优势,特别是它在复杂推理、优化、创作和总结归纳方面的表现。O1的能力不仅仅适用于普通用户,更适合研究者和行业专家,因为他们可以提出更加深刻和专业的问题,从而发挥O1的最大价值。作者认为,O1的完整版有潜力通过多模态、5G和机器人技术直接替代某些专业领域的工作。

Mindmap

Keywords

💡o1

o1是视频中讨论的一个人工智能模型,它在9月13日发布,并在云栖大会上被广泛讨论。o1代表了AI发展的第二阶段,即'推理者',意味着它具备了更强的推理能力。视频中提到o1擅长解决科学、代码、数学方面的复杂任务和难题,并且它的推理过程类似于人类的系统2思考过程。

💡系统2思考

系统2思考是心理学术语,指的是需要集中注意力进行推理、计算和决策的慢思考方式。视频中提到o1的推理过程很像人类的系统2思考,能够进行逻辑推理、构建想法和制定计划等复杂任务。

💡缩放定律(Scaling law)

缩放定律在视频中被提及为o1开启的第二种定律,指明了新的技术路线。缩放定律通常是指随着模型规模的增长,其性能也会相应提升。在视频中,o1的缩放定律可能指的是其性能随着模型规模的增大而显著提高。

💡推理能力

推理能力是视频中反复强调的o1的一个核心能力。它指的是模型能够进行逻辑推理和解决问题的能力。视频中通过烧绳子问题来展示o1的推理能力,o1能够快速准确地找到解决问题的方法。

💡智商(IQ)

智商是衡量智力的一个指标,在视频中提到o1的智商高达120,远超普通人水平。智商的提及是为了强调o1在处理复杂问题时的高效率和准确性。

💡思维链(Chain of Thought, COT)

思维链是视频中提到的一个概念,指的是在提出问题时,要求模型一步步思考,以获得更好的答案。o1不需要用户明确提示,因为它自己就会逐步推理解决问题。

💡范式创作

范式创作是指按照一定的模式或框架进行创作。视频中提到o1能够根据给定的范式,如3M模型,创作出高质量的广告文案。这展示了o1在内容创作方面的应用潜力。

💡3M模型

3M模型是广告领域的一种模型,代表'more users'、'use more'和'more expensive',用于吸引更多客户、增加客户使用量和提高产品价格。视频中通过o1创作广告文案的例子,展示了它如何应用3M模型。

💡CLEAR模型

CLEAR模型是视频中o1自己总结的提问模型,包含'context'、'limitations'、'expression'、'attempt'和'requirements'五个步骤,旨在帮助用户更有效地向o1提问。这个模型体现了o1在总结归纳方面的能力。

💡多模态

多模态是指能够处理和理解多种类型信息(如文本、声音、图像等)的能力。视频中提到,o1的完整版加上多模态能力,可能会有更广泛的应用,如替代医生看病做手术。

💡Preview版本

Preview版本指的是o1目前还不是最终版本,而是预览版。这表明o1还有进一步发展和完善的空间,未来可能会有更多的功能和更强的能力。

Highlights

o1在9月13日发布,6天后的云栖大会上被重点讨论,显示了其重要性。

o1开启了第二种缩放定律,指明了新的技术路线。

o1擅长解决科学、代码、数学方面的复杂任务和难题。

o1具有更强的推理能力,能够解决烧绳子问题。

o1的思考过程类似于人类的系统2思考。

o1在数学能力上超越了之前的模型,如GPT4o。

o1能理解复杂问题,即使问题中有错字。

o1能够轻松解答分析推理问题。

o1在优化改良方面表现出色,能够改进已有的提纲或文章。

o1在范式创作方面能够创作出高质量的内容。

o1在总结归纳方面的能力超过人类水平。

o1能够自我总结提问模型,如CLEAR模型。

o1的智商高达120,远超普通人水平。

o1能够理解并应用3M模型来创作广告文案。

o1能够帮助用户优化文章中的无效表述。

o1能够根据4有模型取标题,提高视频内容的吸引力。

o1的使用次数限制为每周50次,适合解决复杂问题。

o1的真正利好群体是研究者和行业专家。

o1的完整版本加上多模态、5G、机器人技术,有潜力替代医生进行看病和手术。

Transcripts

play00:00

o1很强

play00:01

有多强

play00:02

这么说吧

play00:03

o1是9月13号发布的

play00:04

6天之后的云栖大会

play00:06

第一场论坛

play00:07

就是这四位大佬分享的

play00:08

通往AGI的大模型发展之路

play00:11

Kimi的创始人杨植麟也在

play00:12

全程53分钟

play00:13

超过一半的时间都在讨论o1

play00:16

o1开启了第二种缩放定律Scaling law

play00:19

指明了新的技术路线

play00:20

这还只是Preview预览版本

play00:22

那具体强在哪

play00:23

官方的介绍是

play00:25

o1擅长解决科学 代码 数学方面的

play00:27

复杂任务和难题

play00:29

因为o1有更强的推理能力

play00:31

我测下来 确实强

play00:33

还是先拿烧绳子的问题举例

play00:35

烧一根质地不均匀的绳子

play00:36

从头烧到尾需要一个小时

play00:38

那现在有若干条相同的绳子

play00:40

问怎么计时75分钟

play00:42

你可以暂停思考一下

play00:44

或者考考你身边的朋友

play00:45

这个问题有点难的

play00:47

之前GPT4o 和 Claude 3.5 sonnet都死活答不对

play00:51

现在o1可以轻松搞定

play00:53

我们看一下o1的答案

play00:54

第0分钟

play00:55

点燃第一根绳子的两端

play00:57

和第二根绳子的一端

play00:58

第30分钟

play01:00

第一根绳子烧完了

play01:01

立即点燃第二根绳子的另一端

play01:04

第45分钟第二根绳子烧完了

play01:06

立即点燃第三根绳子的两端

play01:08

第75分钟第三根绳子烧完

play01:11

计时完成

play01:12

答案很完美

play01:13

我们再解剖一下o1的思考过程

play01:15

这个更有意义

play01:16

整个过程他一共思考了15秒

play01:19

不知道你身边的朋友

play01:20

能不能在15秒内想出答案

play01:22

O1先想的是怎么测量45分钟

play01:25

然后尝试不同组合来实现75分钟

play01:27

他想了一个路子

play01:28

最终耗时105分钟

play01:30

不对

play01:30

不对那就再想

play01:32

思考如何利用这些绳子来准确测量15分钟

play01:35

在3个点点燃一根绳子

play01:37

或者同时从两端点燃两根绳子

play01:39

似乎都不太行得通

play01:41

你看他在思考推理不同的方法

play01:43

行不通就换路子

play01:45

这个跟我们人脑思考是一样的

play01:47

然后他继续思考

play01:48

关键是搞定

play01:49

计时45分钟

play01:50

然后他找到了正确的方法了

play01:52

最后他还加了一步评估的步骤

play01:54

就是再验算一遍

play01:56

发现确实是对的

play01:57

然后再把答案提交给我

play01:59

这一切在15秒内就完成了

play02:01

15秒我这个脑子肯定想不出来

play02:03

这道题

play02:04

o1 mini也答对了

play02:06

不过是另一种组合方式

play02:07

这几位大佬在聊o1的时候

play02:09

说的最多的一个词就是

play02:10

系统2思考

play02:12

人脑呢有两种思考方式

play02:14

一种是无意识的快速思考

play02:16

不费脑力

play02:17

比如说看到蛇就跑

play02:18

听到声音就回头

play02:20

那这类快思考就是系统1思考

play02:22

还有一类是费脑力的

play02:23

需要集中注意力进行推理计算

play02:26

做出选择等等

play02:27

这个就是慢思考

play02:28

就是系统2思考

play02:30

只有缓慢的系统2思考

play02:32

才能进行逻辑推理

play02:34

构建想法

play02:34

制定计划等等

play02:36

O1的推理过程

play02:37

就很像人类的系统2思考过程

play02:40

现在的o1就达到了

play02:41

Sam Altman说的AI发展的第二阶段

play02:44

推理者

play02:45

这阶段o1的数学能力也的确是更强了

play02:48

之前我用GPT4o测试高考数学题

play02:51

选择题能答对

play02:52

但是不稳定

play02:53

同样还是这道选择题

play02:54

不管我问几次

play02:56

o1都能答对

play02:57

有时候都懒得调用慢思考的过程

play02:59

填空题

play03:00

GPT4o答不对

play03:01

但是o1能答对

play03:02

这题答案1/2

play03:04

对的

play03:05

o1现在聪明到你跟他沟通

play03:07

可以不用纠结什么提示词prompt

play03:09

我以前就说过

play03:10

聪明的AI不需要你去记什么提示词

play03:12

你直接问

play03:13

他是能理解你的问题的

play03:15

就算你问题里面错字连篇

play03:17

o1都知道你是什么意思

play03:19

现在你甚至都不用考虑思维链

play03:22

COT的技巧了

play03:23

你肯定在很多博主的视频里面听到过思维链

play03:26

就是问题后面加一句

play03:27

请一步步思考

play03:29

就能得到更好的答案

play03:30

现在o1基本上不需要了

play03:32

他自己就在慢慢的一步一步的思考解决问题

play03:35

有人测过o1的智商

play03:37

已经高达120

play03:38

远超普通人水平

play03:39

对于我们来说

play03:40

现在最大的问题

play03:41

是怎么问出真正值得o1

play03:43

去推理研究的好问题

play03:45

我使用两周之后

play03:46

我发现

play03:47

现在o1能够轻松地帮我们解答4类难题

play03:50

第一类问题还是分析推理的问题

play03:53

前面烧绳子是为了测试而测试

play03:55

正常人才不关心这个

play03:57

我再举个实际的案例

play03:58

前几天我去楼下打印店

play04:00

里面有个搞拆迁工程的包工头老板

play04:02

来做标书

play04:03

他跟打印店的老板吐槽

play04:05

说他从来没有这么穷过

play04:06

以前账上的现金至少有500万

play04:08

现在呢垫了2,000多万了

play04:10

欠了一屁股债

play04:11

感慨现在生意难做

play04:13

然后我就突然想到

play04:14

打印店的老板

play04:15

应该是最能感知到

play04:16

一个城市的经济冷暖

play04:18

然后我就把这个问题抛给o1

play04:21

在中国各个城市都有很多图文打印店

play04:23

这些门店提供日常的打印 复印 扫描

play04:26

设计图纸打印

play04:27

标书装订等服务

play04:29

为什么有人说

play04:30

想要了解一个城市的经济好不好

play04:33

和图文打印店的老板聊聊就知道

play04:35

他思考了5秒钟就给出了推理答案

play04:37

我们来看一下翻译之后的中文的答案

play04:40

当一个城市的经济蓬勃发展的时候

play04:42

会有更多的建筑与开发项目

play04:45

意味着建筑师和工程师

play04:47

需要定期打印图纸

play04:48

然后有更多的招投标

play04:50

这些标书文件需要专业的打印和装订

play04:53

也会有更多的企业运营活动

play04:55

需要打印更多的营销材料和报告

play04:57

跟打印店的老板聊天

play04:59

你就能了解到

play05:00

第一个是业务量

play05:01

打印业务多

play05:02

说明经济活动多

play05:03

第二个是服务需求类型

play05:05

打印设计图纸多

play05:07

说明建筑业在增长

play05:08

打印标书多

play05:09

说明竞争活跃

play05:11

第三个是客户多样性

play05:13

不同行业的客户增加

play05:14

反映出经济的健康和多样化

play05:16

这都说明

play05:17

打印店的老板

play05:18

对城市的经济脉动有着一手的洞察

play05:20

厉害吧

play05:21

有结构有逻辑的推理

play05:23

o1的推理分析真的很强

play05:25

你有什么需要分析的问题或者策略

play05:27

你都可以问问o1

play05:30

第二类问题优化改良

play05:33

之前GPT4o或者Claude 3.5给你的答案

play05:35

你肯能想优化

play05:36

但好像又没有能力优化

play05:38

没关系

play05:39

现在有个智商120的大哥在身边

play05:41

问o1就行了

play05:43

之前我让GPT4o给我列了一份

play05:44

韩国现代汽车进军国外发展的提纲

play05:48

这份提纲我感觉已经很好了

play05:49

如果我还想更好

play05:51

那把GPT4o的答案发给o1

play05:54

让更聪明的o1来改

play05:55

我说你帮我查一下

play05:57

不管是内容上还是结构上

play05:59

这份提纲还有什么不足之处

play06:00

以及如何改进

play06:02

o1足足思考了31秒

play06:05

这是他的思考过程

play06:06

他会识别不足之处

play06:07

包括内容和结构

play06:09

他也会找需要改进的地方

play06:11

后面呢会提出建议

play06:12

我们直接看具体的改进建议

play06:14

先看内容上的不足和改进

play06:16

缺少宏观环境分析

play06:18

缺少对现代汽车国际化过程中

play06:20

所处的宏观环境分析

play06:21

这个没毛病

play06:23

然后是竞争对手分析不充分

play06:25

缺乏横向比较

play06:26

说的没错

play06:27

还有文化差异与本土化策略欠缺

play06:30

还有

play06:31

没有充分体现现代汽车在数字化转型

play06:33

新能源技术等新兴领域的战略布局

play06:36

说的对

play06:37

后面还有对于供应链管理

play06:38

和全球化采购策略的讨论不够深入

play06:41

最后还有增加具体的案例研究

play06:43

成功的案例失败的案例都要有

play06:46

每一项不足

play06:46

o1都提出了改进建议

play06:48

真的非常专业

play06:50

然后是结构上的不足

play06:51

上来就说

play06:52

章节安排逻辑需要优化

play06:54

比如之前的国际化战略

play06:55

放在市场分析后面

play06:57

可能导致战略与实践脱节

play07:00

应该将国际化战略的关键要素提前

play07:03

还有层次划分不够细致

play07:05

要细化内容

play07:06

例如在研发与创新下面

play07:08

细分为技术研发投入合作研发

play07:11

创新成果应用等等

play07:13

这里还有一些其他的结构优化

play07:14

够专业吧

play07:15

最后o1直接给出了一个

play07:17

优化改良之后的提纲

play07:18

你看啊

play07:19

第二章先谈战略

play07:21

再谈实践

play07:22

然后第五章增加了竞争对手的分析

play07:24

第九章案例研究

play07:26

有成功案例

play07:27

也有失败案例

play07:28

我们可以看到

play07:29

这份提纲的优化是非常明显的

play07:31

那你说为什么不直接让o1生成提纲呢

play07:33

就是为了防止他偷懒

play07:35

让他改良GPT4o的提纲

play07:37

是有明显起点的

play07:38

能够从80分提到95分

play07:40

或者也可以让o1先出提纲

play07:42

然后再单开窗口

play07:43

再让他改良也行

play07:45

反正就是这个思路

play07:46

因为能超过他的只有他自己

play07:49

我还把得到头条的一篇文章全文

play07:51

复制发给他

play07:52

对于里面经常出现的一些表述

play07:53

我听腻了

play07:54

我让他帮我找出那些对于信息传递

play07:56

没有意义的表述

play07:58

这次他思考的更久

play07:59

74秒

play08:00

找出了不少合理的点

play08:02

我经常就听到一些表述

play08:03

换句话说

play08:04

也就是说

play08:05

就像我们经常说的

play08:06

引用XXX说的话

play08:08

几乎每篇文章都有我听腻了都

play08:10

每次听到换句话说

play08:12

我都得想想之前是咋说的

play08:14

反倒分散我的注意力

play08:16

其实大可不必

play08:17

建议每次发稿之前

play08:18

先让o1审一遍

play08:20

这两个例子

play08:21

就是让o1来解决优化改良的问题

play08:23

这个活儿需要更深的推理

play08:25

更高的智力

play08:26

所以目前只有他能做

play08:27

短的提纲

play08:28

长的文章都能搞定

play08:29

我不会写代码

play08:30

但是我相信代码优化肯定也行

play08:33

o1一周呢

play08:34

现在只能使用50次

play08:36

组合策略就是

play08:37

让o1这个大哥抓提纲框架

play08:39

然后让GPT4o这个能干的小弟

play08:41

去补充细节

play08:42

完美

play08:43

第三类问题范式创作

play08:46

官方宣传片里面

play08:47

要求o1按照固定格式写诗

play08:49

写的很好

play08:50

我也试了一下啊

play08:51

写一篇赞美丹尼尔卡尼曼的中文诗歌

play08:54

一共四句

play08:55

我希望四句诗的第一二三四个字

play08:58

分别是领导傻逼四个字

play09:00

每一句的字数可以不同

play09:02

但是要押韵

play09:03

你看他的答案

play09:04

领悟人心深似海

play09:06

导引思维破迷霭

play09:08

傻笑背后藏智慧

play09:09

逼近真理展风采

play09:11

首先肯定一下 很切题

play09:13

丹尼尔卡尼曼

play09:14

是获得诺贝尔经济学奖的心理学家

play09:17

所以领悟人心深似海没毛病

play09:19

然后导引思维破迷霭

play09:21

他的思考快与慢那本书

play09:23

让全世界了解到了系统1系统2

play09:25

这两种思维方式

play09:26

唯一的缺点就是做成了藏头诗

play09:29

不太符合我的要求

play09:30

我后面让他改

play09:31

他还改的不好

play09:32

但这个还挺有意思的

play09:34

算是一首比较成功的打油诗吧

play09:36

就是图一乐啊

play09:37

但是我们还是得干点真活

play09:39

接下来这个例子就很绝了

play09:40

让o1写广告

play09:42

在广告文案的创作领域

play09:43

有一个3M模型

play09:45

more users希望有更多的客户

play09:47

比如说

play09:47

连续6年国货洗发水销售份额第一

play09:50

use more是希望客户用的更多

play09:53

比如说两粒一起吃才更好

play09:54

每天一斤奶

play09:55

强壮中国人

play09:56

more expensive希望客户花更多的钱购买

play10:00

比如说

play10:00

不是所有牛奶都叫特仑苏

play10:02

只为高端而生

play10:03

有些广告是组合在一起的

play10:05

比如说某个防晒乳的广告

play10:07

儿童配方

play10:08

妈妈也爱用

play10:09

这个就是

play10:09

同时达到了more users和use more的效果

play10:12

我说现在给我写4条投影仪的广告文案

play10:15

前三条分别满足

play10:17

more users use more和more expensive

play10:19

最后一条要同时满足3M模型

play10:22

他只思考了12秒就给出了答案

play10:24

连续三年销量领先

play10:26

百万用户的共同选择

play10:27

这个是more users

play10:28

吸引更多的客户

play10:30

白天办公夜晚观影

play10:31

一台投影仪满足您的多重需求

play10:33

这个是use more

play10:34

鼓励客户更多使用

play10:36

顶级配置

play10:37

奢华享受

play10:38

只为追求极致的您

play10:40

这是more expensive

play10:41

鼓励客户花更多钱购买

play10:43

第四条

play10:44

专业品质全家共享

play10:46

提升生活品味的高端之选

play10:49

这条满足了more users和more expensive

play10:51

但是并没有很好地展现use more

play10:54

我就让它重写第4条

play10:56

又花了14秒

play10:57

写出来了

play10:58

高端投影仪

play10:59

这是more expensive

play11:01

全家共享

play11:02

这是more users

play11:03

工作娱乐全覆盖

play11:05

这是use more

play11:06

让生活更加精彩

play11:08

我必须说O1的表现很精彩啊

play11:10

3M模型好用吧

play11:12

你再听到刘亦菲说

play11:13

上午咖啡下午茶

play11:15

你就知道这是use more

play11:18

还有个例子

play11:18

让他根据4有模型取标题

play11:21

就是让观众看到标题之后觉得

play11:23

有关系 有好处 有意思 有期待

play11:25

让他给我取标题

play11:26

视频内容就是讲解Open AI o1模型的

play11:29

这几个标题取得真的是有模有样

play11:32

对于不同视频内容的侧重点都有覆盖

play11:34

真的可以

play11:35

所以对于范式创作这一类的问题

play11:37

o1是可以非常好的胜任的

play11:40

只要你能给出具体的范式

play11:41

他就能创作出高质量的内容

play11:44

你也可以把这个范式理解为模型

play11:46

这个也是我以前说的使用技巧

play11:47

就是用你脑子里专业的小模型

play11:50

来推动o1这个聪明的大模型

play11:52

小模型推动大模型

play11:54

现在更好用了

play11:56

第四类问题总结归纳

play11:58

这方面

play11:58

o1上升到了一个新的高度

play12:01

绝对超过人类的水平

play12:02

看到这你肯定会发现了一个问题啊

play12:04

就是o1现在有更强的推理能力

play12:06

能解决更复杂的问题

play12:08

但是这也要求我们能够提出更加

play12:10

细致具体的问题

play12:11

不能过于宽泛

play12:13

那我就干脆让o1自己总结一个提问模型

play12:16

让我们用户能够更好地向o1提问

play12:18

我额外的要求是

play12:20

这个模型的各个步骤的首字母

play12:22

最好也能组成一个有意义的新单词

play12:25

类似于STAR模型

play12:26

situation task action result

play12:28

首字母就组成了star

play12:29

简单好记

play12:31

他思考了39秒

play12:33

看到答案的那一刻

play12:34

我惊呆了

play12:35

他这个模型就叫prompt模型

play12:37

真的太会了

play12:38

P provide context提供问题的背景信息

play12:41

R request明确提出您的请求

play12:44

O outline specifics概述问题的具体细节

play12:48

M mention attempts

play12:49

说清楚尝试过的方法或解决方案

play12:51

避免重复

play12:52

P preferences告知您对答案的输出偏好

play12:56

T timeframe明确时间限制

play12:59

就最后一个T不太合理

play13:00

前面的PROMP都非常合理

play13:03

我们再来看一下它的思考过程

play13:05

它有尝试组合成

play13:07

smart

play13:08

prompt

play13:09

theory

play13:09

deep

play13:10

focus

play13:11

clear

play13:12

askme

play13:13

guide

play13:13

adapt

play13:14

trace

play13:15

help

play13:16

等等不同的单词

play13:17

这些词都是跟提问有关的词

play13:20

最后试了一圈

play13:21

他可能觉得prompt更贴切

play13:22

就选了prompt

play13:23

你看这个就是系统2思考

play13:25

而且远超人类大脑

play13:28

我反馈说prompt模型非常棒

play13:30

但是最后一个timeframe时间限制

play13:32

和提问技巧似乎关联不大

play13:34

能否再想一个新的模型

play13:36

他这次还尝试了

play13:38

fine quest detail brief

play13:40

最后给出了一个CLEAR模型

play13:42

C context背景

play13:44

提供问题的背景信息

play13:46

L imitations限制条件

play13:48

说明任何相关的限制条件或特殊要求

play13:51

E expression

play13:53

表达问题 表述要清晰具体

play13:56

A attempt尝试过的方法

play13:58

告知你已经尝试过的解决方案或者思路

play14:00

避免重复

play14:01

R requirements 要求

play14:03

详细说明您对答案的输出要求

play14:06

同志们这个CLEAR模型非常棒啊

play14:08

我强烈建议你就用这个CLEAR模型

play14:10

向现在的o1提问

play14:12

这样你肯定能获得更高质量的答案

play14:14

CLEAR模型收藏好

play14:16

这个可是o1一共花了89秒

play14:18

总结归纳出来的模型

play14:20

你我花一天估计都搞不出来

play14:22

o1的总结归纳能力

play14:23

已经不是简单的总结归纳了

play14:25

里面还有无尽的创意和发散

play14:27

太强了真的

play14:29

因为一周只能问50个问题

play14:31

肯定不详尽

play14:32

我也不会写代码

play14:33

所以这块没法测

play14:34

但是不用想也不用测

play14:36

肯定非常强

play14:37

有代码需求的人闭眼冲就是了

play14:39

数学问题绝大部分人也用不上

play14:41

所以呢我暂时就总结出

play14:43

o1在这4类问题上的出色表现

play14:45

我的整体看法是

play14:47

o1真的超级强

play14:48

我们普通用户能用

play14:50

参考o1给的CLEAR模型

play14:52

就能用的更好

play14:53

一周给50次

play14:55

我觉得也够用了

play14:56

确实能帮助我们解决更复杂的难题

play14:59

但是我觉得o1真正利好的群体

play15:01

不是我们普通用户

play15:02

是研究者

play15:03

是行业专家

play15:04

因为只有研究者或者说行业专家

play15:07

他们才能问出深刻具体的问题

play15:09

比如说前面的例子

play15:10

你脑子里要是没有3M模型

play15:12

没有4有模型

play15:13

你就很难让o1快速产出高质量的文案

play15:16

一定是懂行的专业人士

play15:18

才能发挥o1的最大价值

play15:21

更何况现在o1还是Preview版本

play15:23

还不是完整版本

play15:24

可以想象啊

play15:25

完整版加多模态加5G加机器人

play15:28

大概率就可以直接替代医生

play15:30

看病做手术了

play15:31

相比之下

play15:32

我更希望你能用好

play15:33

GPT4o的高级语音

play15:34

和未来的视觉能力

play15:36

放个预告

play15:37

下个视频

play15:37

我们聊聊最新推送的高级语音包

play15:39

谢谢你的时间

play15:40

下个视频再见

Rate This

5.0 / 5 (0 votes)

関連タグ
人工智能推理能力技术创新云栖大会杨植麟大模型系统2思考数学解题优化改良范式创作
英語で要約が必要ですか?