【人工智能】万字综述大语言模型代理 Agent | 研究背景 | 通用框架 | 控制、感知、行动 | 应用场景 | 代理社会 | 前瞻问题

最佳拍档

17 Sept 202329:00

Summary

TLDR本期视频探讨了基于大语言模型的智能代理（Agent）的发展历程、核心能力和应用前景。从18世纪智慧鹦鹉的概念到现代人工智能的发展，智能代理已经从单一任务执行者演变为具有自主性、反应性、积极性和社交能力的实体。复旦大学的研究团队通过一篇综述论文，详细梳理了智能代理的背景、构成、应用场景以及社会属性，展望了智能代理在未来可能带来的挑战和机遇。

Takeaways

📚 论文概述：复旦大学自然语言处理团队发表86页综述论文，涵盖600多篇参考文献，全面梳理大模型Agent的发展现状。
🌟 研究背景：从18世纪哲学家德尼·狄德罗的智慧鹦鹉概念到艾伦图灵的图灵测试，探讨了智能代理的历史和哲学根源。
🤖 Agent定义：在人工智能领域，Agent指的是具有自主性、反应性、积极性和社交能力特征的智能实体。
📈 发展阶段：将NLP到AGI的发展分为五个级别，目前大语言模型处于第二级，即具有互联网规模的文本输入和输出。
🛠️ 智能代理框架：由控制端（Brain）、感知端（Perception）和行动端（Action）三部分组成，强调智能代理的认知、感知和行动能力。
🧠 控制端能力：包括自然语言交互、知识存储、记忆、推理规划和迁移泛化性等五个方面。
👀 感知端发展：从文本输入拓展到多模态感知，包括视觉、听觉等，提升智能代理对环境的理解。
🏃‍♂️ 行动端功能：除了文本输出，还包括工具使用和具身行动，使代理能够适应和影响环境。
🏢 应用场景：介绍了单代理、多代理和人机交互三种范式，以及代理在任务导向、创新导向和生命周期导向的应用。
🌐 社会属性：探讨了代理社会的构建，包括代理个体的内在人格特征和群体行为，以及环境对代理行为的影响。
🔮 未来展望：讨论了智能代理研究的挑战、机遇以及对社会的潜在影响，包括安全性评估和对社会福祉的考量。

Q & A

论文中提到的智能代理Agent的研究背景是什么？
-论文介绍了智能代理的研究背景，早在18世纪哲学家德尼·狄德罗提出了智慧鹦鹉的概念，意味着如果一只鹦鹉能回答所有问题，那么这只鹦鹉就是有思想的生物。1950年代，艾伦·图灵将智能的概念扩展到了人工实体，并提出了图灵测试。这些人工智能实体通常被称为代理（Agent）。
智能代理Agent在中文中有哪些译名？
-在中文中，Agent这个词的中文译名有智能体、行为体、代理或者智能代理。
大语言模型对智能代理的发展有哪些影响？
-大语言模型的出现为智能代理的进一步发展带来了希望，增强模型的固有能力，如知识记忆、长期规划、有效泛化和高效互动等，是推动智能代理进一步发展的关键因素。
智能代理的三个基本组成部分是什么？
-智能代理的框架由三个部分组成，分别是控制端（Brain）、感知端（Perception）和行动端（Action）。
控制端Brain在智能代理中承担哪些功能？
-控制端通常由大语言模型构成，是智能代理的核心，它不仅可以存储记忆和知识，还承担着信息处理、决策等不可或缺的功能，可以呈现推理和计划的过程，并且很好地应对未知任务，反映出智能代理的泛化性和迁移性。
感知端在智能代理中的作用是什么？
-感知端可以将智能代理的感知空间从纯文本拓展到包括文本、视觉和听觉等多模态领域，使代理能够更有效地从周围环境中获取与利用信息。
行动端Action在智能代理中的功能包括哪些？
-行动端除了常规的文本输出，还可以赋予代理具身能力、使用工具的能力，让它能够更好地适应环境变化，通过反馈与环境交互，甚至能够塑造、影响环境。
论文中提到的智能代理的社会性属性有哪些？
-智能代理的社会性属性包括代理个体内在的人格特征，如认知、情感和性格，以及代理与代理之间形成的群体行为，如合作、冲突和从众等。
智能代理在实际应用中的设计原则有哪些？
-智能代理的设计原则包括帮助用户从日常任务中解脱出来，减轻工作压力，提高任务解决效率；不再需要用户提出显式的低级指令，能够自主分析规划解决问题；解放用户的双手后，尝试解放大脑，发挥潜能，完成创新性的探索性工作。
论文中提到的代理社会的潜在风险有哪些？
-代理社会的潜在风险包括有害的社会现象、刻板印象和偏见、隐私安全问题以及过度依赖与成瘾性等。
如何理解智能代理与大语言模型的关系？
-智能代理的构建依赖于大语言模型，后者在语言理解、决策制定以及泛化能力等方面展现出强大的潜力。同时，智能代理的进展也为大语言模型提出了更高的要求，两者相互促进共同发展。
论文中提到的智能代理的未来发展有哪些挑战？
-智能代理的未来发展面临的挑战包括如何确保其安全性、避免对真实世界带来危害、处理失业风险和对人类福祉的影响，以及如何协调单个代理，克服团体迷思和个体认知偏差等。