网站内链建设,wordpress 绑定多个域名,合肥建设网网站,汕头seo排名公司作者#xff1a;黄兆康 周锐楷 张 海 郝天永在数字化浪潮席卷全球的今天#xff0c;人工智能领域正不断突破边界。当单个智能体的能力逐渐触达瓶颈#xff0c;多智能体协同恰似一把 “智能密钥”#xff0c;解开了更复杂任务的解决密码。尤其是大语言模型加持下的…作者黄兆康 周锐楷 张 海 郝天永在数字化浪潮席卷全球的今天人工智能领域正不断突破边界。当单个智能体的能力逐渐触达瓶颈多智能体协同恰似一把 “智能密钥”解开了更复杂任务的解决密码。尤其是大语言模型加持下的多智能体协同架构已悄然在各行业掀起变革它究竟蕴藏着怎样惊人的力量多智能体协同multi-agent collaboration作为人工智能artificial intelligence, AI领域的核心研究方向通过多个智能体之间的信息交互与策略协调实现复杂任务的完成。随着大语言模型large language model, LLM的发展多个LLM促成的多智能体协同架构在教育、金融、软件开发等领域展现出巨大的应用潜力。多智能体协同的由来多智能体协同是AI领域的一个重要研究方向其发展经历了从单智能体到多智能体协同的过程。智能体是指能够感知环境并采取行动以实现特定目标的AI系统。多智能体协同通常指的是多个智能体之间通过信息交互与策略协调实现复杂任务[1]。AI多智能体的起源可追溯至AI研究的早期探索。早期单智能体的研究占据主导地位主要关注个体智能体在特定环境下的行为决策能力。20世纪中叶随着计算机科学的兴起科学家开始尝试模拟人类智能行为早期的分布式系统与分布式AIdistributed AI, DAI研究为多智能体协同的诞生埋下了种子[2]。21世纪初分布式系统理论和博弈论在理论层面为 AI 多智能体的发展提供了重要支撑。分布式系统理论让多个智能体能够在不同的物理位置或计算节点上进行信息交互与资源共享博弈论为智能体之间的策略制定和利益协调提供了数学框架使它们在协作与竞争场景中能够做出更合理的决策这些理论为多智能体协同创造了条件[3]。然而随着实际应用场景复杂性的增加单智能体的局限性逐渐显现。为了更好地应对大规模、复杂、实时和有不确定信息的现实问题多智能体系统应运而生。在动态环境下多智能体系统需要具备自主性决策能力以应对环境变化带来的各种挑战。此外智能体之间的交流、任务分配及冲突解决机制也是多智能体系统发展的关键环节。智能体之间通过有效的交流实现信息共享合理分配任务以提高系统整体效率同时解决可能出现的冲突从而实现协同工作完成复杂任务。多智能体协同的发展现状在最新研究中以GPT-4、Claude等为代表的LLM在文本生成、简单逻辑推理等任务中展现出接近人类的能力其丰富的知识储备与高效学习能力涵盖从历史人文到科学技术、从日常生活常识到专业领域知识等多个层面为多智能体协同提供了理想载体。与此同时多智能体协同通过模拟人类协作的认知机制将复杂任务分解为子任务网络在跨领域知识整合、多步骤推理等复杂任务中表现出色为缓解LLM的幻觉问题和优化自回归过程提供了新路径[1]。多智能体协同的特性目前学术界尚未对多智能体协同的特性形成统一定义描述[4]。综合现有研究视角我们将其特性概括为以下3个核心维度自主性、适应性与群体交互性。多智能体协同的特性自主性 智能体能够解决给定的子问题自主地推理和规划并选择适当的策略并以特定的方式影响环境。在具备自主决策能力的同时能依据系统目标调整行为实现协同。这种特性既能保证个体灵活应对局部环境又能确保系统整体目标达成。适应性 多智能体系统能够感知环境中的各种变化如物理环境的改变、资源的变化、其他外部因素的干扰等并相应地调整智能体的行为和协同方式。群体交互性 多智能体协同中的群体交互性是指多个智能体通过信息传递、行为协调和策略互动共同完成复杂任务的特性其交互的主要关系包括①合作合作是LLM多智能体系统中最常见的协作类型。当智能体将其个体目标与共享的集体目标对齐时它们会共同努力实现互利的结果。在需要协作问题解决、集体决策和互补技能的任务中合作尤为重要。②竞争发生在智能体的个体目标与其他智能体的目标冲突或资源有限的情况下。竞争可以推动智能体发展更高级的推理能力和创造性问题解决能力增强系统的适应性。③协商在过程中既合作又竞争最后达成一致的结果。④层次智能体按照层次结构进行组织不同层次的智能体具有不同的职责和权限。多智能体协同的核心技术多智能体协同技术广泛应用于医疗、教学、智慧助手等领域其核心技术涵盖决策、编排、通信、学习等多个维度。其中协同决策技术和多智能体编排技术作为实现高效协作的基石直接决定了多智能体系统在复杂场景下的性能与可靠性。前者聚焦于个体决策的优化与群体策略的协调后者则致力于全局任务的规划与智能体行为的有序组织二者相辅相成是多智能体协同从理论走向实践的关键支撑。协同决策技术协同决策技术是多智能体协同的关键它使智能体能够根据自身目标和环境信息与其他智能体共同制定最优决策。博弈论是协同决策的重要理论基础它为智能体在竞争与合作场景下的决策提供了数学模型。在单个智能体中智能体通过与环境的交互根据获得的反馈信息迭代地优化整个解决问题的过程被称为马尔科夫决策过程一些独立的强化学习算法如 Q-learning在智能体所处环境满足马尔科夫性即智能体下一时刻的状态仅取决于当前状态和动作与历史状态无关。理想情况下当智能体尝试了足够多的行动后它将收敛到最优策略。马尔科夫决策过程拓展到多智能体系统被定义为马尔科夫博弈。对于马尔科夫博弈最终的任务是达到纳什均衡即每一个智能体都无法采取其他策略来获得更高的积累回报[6]。如何处理复杂的现实问题如何高效地处理大量的状态和智能体以及连续的策略空间已经成为目前多智能体学习研究的重要方向。多智能体协调方式主要包括①基于规则的协议预先为智能体设计一组规则或行为策略。当感知到特定情境时智能体按规则匹配执行相应动作。其优点是有效、一致性强但缺点是难以应对复杂任务。②基于角色的协议通过为每个智能体分配特定的角色或分工使智能体能够专注于其专业领域内的子任务。其优点是提高了系统的效率和结构但缺点是角色定义不明确可能导致冲突或威胁。③基于模型的协议在输入感知存在不确定性的环境中提供了决策制定的灵活性。智能体根据对环境的感知、共同目标和固有的不确定性做出概率性决策。其优点是在动态环境中表现出色但缺点是设计和部署复杂计算成本较高。多智能体编排技术多智能体编排侧重于对多个智能体的行为和任务进行整体的规划和安排以确保系统按照特定的流程和顺序运行实现高效的协作。根据编排方式可以分为集中式编排和分布式编排。集中式编排设置一个中央控制器或管理器专门负责对所有智能体的任务进行统一规划和调度。分布式编排存在一个中央控制器或管理器。根据编排需要可以静态编排和动态编排静态编排依赖于领域知识和预定义的规则来建立协作通道有利于保证任务的一致性动态编排通过管理智能体或自适应机制实时分配角色和定义协作通道复杂任务下表现更加出色。多智能体协同技术框架多智能体协同决策在动态环境下的复杂性急剧增加。尽管博弈论和强化学习为决策提供了理论支持但当智能体数量众多、目标多元且环境信息不确定时传统算法的计算复杂度呈指数级增长导致决策效率低下。不同的智能体其决策不仅受自身目标影响还需考虑其他智能体的行为和规则使得决策过程变得异常复杂。此外智能体之间的利益冲突也会阻碍全局最优决策的达成如何平衡个体利益与集体利益实现高效协同仍是一个开放性难题。目前许多研究者围绕多智能体协同机制展开了深入的研究。本文选取部分具有代表性的多智能体协同框架进行讲述。CAMEL2023[7]由沙特阿卜杜拉国王科技大学提出引入多个智能体每个智能体专注于特定的任务或知识领域通过通信和协作来完成复杂的任务。这些智能体可以动态地调整其行为和策略以适应不同的任务需求。实验结果表明CAMEL框架在多个任务上的表现显著优于单智能体方法特别是在需要多步骤推理的复杂任务中。AutoGen2023[8]由美国微软推出帮助开发者创建基于LLM的智能应用。它允许开发者构建可协作、可交互的智能体系统通过将复杂任务分解为多个子任务并分配给不同的智能体来完成。AutoGen的两个核心概念为可对话智能体和对话编程。在AutoGen中可对话智能体是一个具有特定角色的实体它可以传递消息向其他可对话智能体发送和接收信息它可以根据发送和接收的消息维护其内部上下文并且可以配置功能。对话编程负责控制响应所采取的行动和发生的顺序开发人员可以通过自然语言和计算机代码定义智能体的交互行为极大地简化了复杂应用的开发过程。Chain-of-AgentsCoA2024[8]由美国谷歌研究团队提出面向长上下文任务的多智能体LLM协作框架。其创新点在于引入由多个工作智能体和一个管理智能体组成的链式推理机制这些工作智能体按照顺序逐段读取长文档片段并通过自然语言依次传递关键信息最后由管理智能体整合工作智能体的知识产生答案。该方法通过让每个智能体关注短上下文并逐步聚合信息缓解了LLM在超长文本中“中段遗失”信息的难题。COPPER2024[3]由中国人民大学提出旨在通过自我反思机制增强多智能体LLM系统的协同能力。COPPER为每个LLM智能体引入一个共享的反思器模块在智能体完成一步推理后由反思器生成关于该步骤的反思反馈并据此自动调整下轮推理的提示。反思器通过反事实近端策略优化强化学习机制进行微调优化。一方面设计了“反事实奖励”来度量单个智能体反思对全局的贡献缓解多智能体协作中的信用分配问题 另一方面训练一个所有智能体共用的反思模型使其能结合各智能体的角色差异生成定制化的反思建议同时降低计算开销并提高训练稳定性 。多智能体协同应用框架MetaGPT2024[10]由中国深度赋智Deep Wisdom公司与瑞士IDSIA实验室合作提出是一套面向复杂任务的多智能体LLM元编程框架。MetaGPT的核心是将人类在完成特定任务时遵循的标准化作业流程转化为提示词中的编码信息将大型任务按照软件工程范式拆解为模块化的子任务并分配给扮演不同专业角色的多个智能体协作完成。在代码生成等协同软件工程基准上MetaGPT生成的解决方案比先前纯对话驱动的多智能体系统更加连贯稳定展示了利用多智能体分工合作来执行复杂任务的潜力。多智能体协同的应用实践多智能体协同与LLM的深度融合正通过整合现有模型资源为医疗、教育和服务等领域带来颠覆性变革。智能助手领域多智能体的协同给智能助手领域带来极大的变革。用户无须关注底层复杂的算法实现、通信协议与部署细节只需通过应用程序编程接口application programming interface, API或可视化界面就能快速定制智能体协作流程实现特定任务目标。扣子Coze是字节跳动推出的零代码AI应用开发平台平台上拥有海量AI智能体图文、音视频生成等各个领域全覆盖创建了多种类型的聊天机器人、智能体、AI应用和插件并将其部署在社交平台和即时聊天应用程序中类似的平台还有百度的文心智能体平台、科大讯飞的星辰Agent、智谱华章科技的智谱清言等。医疗诊断领域在医疗诊断领域多智能体协同架构融入LLM技术MedAgents特别关注零样本医学推理即在不针对特定任务的训练数据的情况下如何利用LLM的通用知识进行推理同时将复杂的医学问题分解为多个子问题并分配给不同的LLM进行处理[6]MDAgents 旨在解决LLM在复杂医疗决策任务中的应用难题。它借鉴现实医疗决策流程根据任务复杂性自动为 LLM团队分配协作结构模拟从个体临床医生到协作团队的分层诊断过程。在10项基准测试中有7项取得最佳性能显著优于先前的单智能体方法展示了其在处理复杂医疗任务时的高效性和准确性[12]。在实际的应用中以商汤医疗LLM“大医”作为智慧医院建设“中枢大脑”智能调度覆盖医学文本、放射影像、病理图像等多种数据模态的专用模型辅助医生完成跨科室、跨模态的复杂诊断推理[13]。教育辅导领域SimClass是一个多智能体课堂模拟框架旨在创造一个融合AI和真实用户的互动学习环境。SimClass不仅包括传统的教学智能体如教师和助教还引入了多个模拟学生的智能体例如“课堂小丑”活跃课堂气氛、“思考者”善于深度思考、“笔记达人”热心记录笔记和“好奇宝宝”经常提问这些角色通过LLM和特定的系统提示实现还包括一个核心管理者智能体负责观察、决策和控制确保虚拟课堂的自然流畅[13]。在实际的应用中科大讯飞推出的AI学习机搭载了多智能体协同与LLM星火大模型。知识图谱构建智能体基于LLM对学科知识进行深度解构生成可视化知识网络学习规划智能体通过分析学生日常练习、考试数据结合LLM的个性化学习策略为学生定制专属学习路径答疑解惑智能体运用LLM实时解析学生提问。其他领域多智能体即服务融合了多智能体系统与云计算领域“即服务”的理念将多个具备感知、决策、交互能力的智能体及其协同逻辑封装为可按需调用的服务。在智慧城市管理领域新加坡的“智慧国家 2025”计划运用多智能体即服务模式在智能交通调度领域我国上海的城市交通大脑“通达”大模型采用多智能体即服务架构思想“通达”大模型担任“专家顾问”为管理人员提供专业知识服务辅助交通组织管理担当算法基石和中央大脑。多智能体即服务的创新理念具备广泛的适配性通过多智能体的协同服务给各个领域注入新活力。多智能体的未来在科技浪潮的持续推动下多智能体系统正迎来前所未有的发展契机其应用边界不断向外拓展深刻影响着众多前沿领域。从工业制造到虚拟世界构建多智能体系统的创新应用为行业变革注入强劲动力也勾勒出充满无限可能的未来图景。然而多智能体系统的发展并非一帆风顺仍面临诸多挑战与困难。在现实场景的使用中智能体之间的高效通信与信息交互需要以通信技术作为基础与此同时大规模的多智能体系统需要巨大的计算资源和存储能力当前硬件水平难以满足大规模复杂智能体场景的需求大规模多智能体系统的可行性仍待进一步的探究。5G/6G网络与工业5.0随着5G网络的全面普及和6G技术的深入研发工业5.0正逐步成为未来制造业转型升级的核心方向。工业5.0强调智能化与可持续发展旨在打造高度协同、自适应的生产体系。而多智能体系统凭借其自主决策、高效协作的特性恰好成为推动工业5.0落地的关键技术支撑。在多智能体系统运行过程中智能体之间的高效通信与信息交互是实现生产流程优化的基础。基于LLM的语义通信框架LLM enabled semantic communication system, LLM-SC借助LLM对文本语义信息进行深度建模创新性地构建了兼顾语义理解与技术实现的通信范式。这意味着在工业生产场景中不同智能体如生产设备、管理系统、物流机器人等能够基于语义层面准确理解彼此指令避免因信息模糊导致的生产延误或错误[4]。用于视觉传输的LLM驱动语义通信系统LLM-driven semantic communication system for visual transmission, LaMoSC进一步突破了传统语义通信的局限。传统系统常因知识库有限、泛化能力不足难以适应复杂多变的工业环境LaMoSC通过融合文本、图像、传感器数据等多模态信息让智能体具备更强的环境感知与处理能力[15]。元宇宙内容构建元宇宙作为虚拟世界的未来发展方向需要强大的内容构建能力。在开放世界的元宇宙世界里以往的非玩家角色non-player character, NPC行为模式固定与玩家互动缺乏真实感。而引入多智能体协同技术后NPC可作为独立智能体拥有各自的目标、偏好和决策逻辑。它们能根据玩家行为、环境变化实时做出反应。阿里巴巴认知计算实验室与伦敦大学学院计算机系合作推出的多智能体协作网络BiCNet展现出多智能体协同的潜力。其以游戏“星际争霸1”中的微观战斗场景作为测试环境任务是协调多个智能体作为一个团队来打败敌人在实验中智能体衍生出“攻击和逃跑策略”“掩护进攻”“火力集中”等具有人类思维的智能协作策略为元宇宙的内容构建的可行性提供了强有力支持。总结与展望多智能体协同通过协同决策、编排优化技术提升多个智能体在复杂任务中的协作效率来解决传统单智能体系统难以应对动态环境、应用局限性等问题。同时本文系统梳理了多智能体协同技术的理论进展与实践突破其涵盖医疗、教育、智能助手等领域中的具体应用场景。然而当下该技术仍处于新兴发展阶段如何将多智能体协同技术真正高效运用到各个领域当中仍是学术界与产业界有待深入探讨和解决的重要课题。展望未来多智能体协同技术的发展前景广阔将进一步推动各行业的智能化升级为社会生产生活带来更多创新与变革。黄兆康硕士研究生周锐楷硕士研究生郝天永教授华南师范大学计算机学院CCF广州广州 510631。haoty126.com张海教授琶洲实验室黄埔西北大学数学学院西安 720127。zhanghainwu.edu.cnHuang Zhaokang, Master Degree Candidate; Zhou Ruikai, Master Degree Candidate; Hao Tianyong, Professor: School of Computer Science, South China Normal University, CCF Guangzhou, Guangzhou 510631.Zhang Hai: Professor, Pazhou Lab (Huangpu), School of Mathematics, Northwest University, Xi’an 720127.[1]Tran K-T, Dao D, Nguyen M-D, et al. Multi-agent collaboration mechanisms: A survey of LLMs. arXiv preprint arXiv: 2501.06322, 2025.[2]Huhns M N. Distributed artificial intelligence. London: Pitman Publishing, 1987.[3]De La Fuente N, Noguer i Alonso M, Casadellà G. Game theory and multi-agent reinforcement learning: Advanced topics. arXiv preprint arXiv: 2412.20523, 2024.[4]Bo X H, Zhang Z Y, Dai Q Y, et al. Reflective multi-agent collaboration based on large language models. Advances in Neural Information Processing Systems, 2024, 37: 138595-138631.[5]Wang Z Y, Zou L, Wei S Y, et al. Large language model enabled semantic communication systems. arXiv preprint arXiv: 2407.14112, 2024.[6]Liang J X, Miao H T, L Kai, et al. A review of multi-agent reinforcement learning algorithms. Electronics, 2025, 14(4): 820.[7]Li G, Hammoud H, Itani H, et al. CAMEL: Communicative agents for “mind” exploration of large-scale language model society// Advances in Neural Information Processing Systems. 2023.[8]Wu Q Y, Bansal G, Zhang J Y, et al. Autogen: Enabling next-gen LLM applications via multi-agent conversation. arXiv preprint arXiv: 2308.08155, 2023.[9]Zhang Y S, Sun R X, Chen Y F, et al. Chain of agents: Large language models collaborating on long-context tasks. arXiv preprint arXiv: 2406.02818, 2024.[10]Hong S R, Zhuge M C, Chen J Q. MetaGPT: Meta programming for multi-agent collaborative framework. arXiv preprint arXiv: 2308.00352, 2023.[11]Tang X R, Zou A, Zhang Z S, et al. Medagents: Large language models as collaborators for zero-shot medical reasoning// Findings of the Association for Computational Linguistics. 2024: 599–621.[12]Kim Y, Park C, Jeong H, et al. MDagents: An adaptive collaboration of LLMs for medical decision-making. arXiv preprint arXiv: 2404.15155, 2024.[13]Chang Q, Yan Z N, Zhou M, et al. Mining multi-center heterogeneous medical data with distributed synthetic learning. Nature Communications, 2023, 14(1): 5510.[14]Zhang Z Y, Zhang-Li D, Yu J F, et al. Simulating classroom education with LLM-empowered agents. arXiv preprint arXiv: 2406.19226, 2024.[15]Wang Z Y, Li Z, Wei S Y, et al. Large-language-model enabled semantic communication systems. arXiv preprint arXiv: 2407.14112, 2024.[16]Zhao Y R, Yue Y, Hou S L, et al. LaMoSC: Large language model-driven semantic communication system for visual transmission. IEEE Transactions on Cognitive Communications and Networking, 2024, 10(6): 2005-2018.