北京康迪建设监理咨询有限公司网站赣县城乡规划建设局网站-兰州市网站建设公司-Seo优化

北京康迪建设监理咨询有限公司网站,赣县城乡规划建设局网站,WordPress文章开启评论,女生做seo网站推广2025年12月15日#xff0c;来自斯坦福、复旦、牛津等顶级团队联合发布题为《Memory in the Age of AI Agents》的论文#xff0c;这篇论文首次为混乱的AI智能体记忆领域建立了统一的理论框架#xff0c;将碎片化的研究成果整合进一套完整的分类体系。在论文出现之前#x…2025年12月15日来自斯坦福、复旦、牛津等顶级团队联合发布题为《Memory in the Age of AI Agents》的论文这篇论文首次为混乱的AI智能体记忆领域建立了统一的理论框架将碎片化的研究成果整合进一套完整的分类体系。在论文出现之前AI记忆系统的概念一直处于混乱状态。开发者们习惯用短期记忆和长期记忆来分类这套来自心理学的术语看似直观实则模糊不清。什么算短期保存一小时算短还是长向量数据库里存了三年的用户画像算短期还是长期当OpenAI推出带记忆功能的ChatGPT、亚马逊发布Agentic AI基础设施、各路创业公司推出Mem0、Letta、Zep等框架时每家对记忆的定义都不尽相同技术选型像是在黑暗中摸索。这篇新论文的价值在于它跳出了传统的时间维度分类提出了一套更加本质的三维坐标系形式Forms、功能Functions、动态Dynamics。这三个维度就像是给记忆系统拍了一张三维CT从存储载体、认知角色、生命周期三个正交的视角完整地刻画了一个记忆系统的全貌。论文讲是什么这本12万字电子书教你怎么做。核心价值揭秘大厂在Agent记忆的实际做法最火的框架不一定最适合你有些创新其实是祖传手艺一句话总结有了理论坐标还需要实战路径。点击二维码免费下载01形式维度从怎么存看大厂的技术选择论文的第一个维度形式回答的是一个最基础的问题记忆以什么形式存在是写在纸上Token级、刻在脑子里参数级还是藏在潜意识潜空间Token级记忆透明但需要精细管理Token级记忆就像是用笔记本记录信息每一条都清清楚楚、可读可改。论文指出这类记忆的特点是符号化、可寻址、透明适合需要高度可解释性和频繁更新的场景。产业界的PPIO团队在《一文看懂Agent的9种记忆系统》中总结的经验完美诠释了Token级记忆的设计哲学。PPIO将记忆分为聊天历史、用户画像、知识图谱等9种类型每种都以结构化的方式存储在外部数据库中。这9种模式其实是Token级记忆在不同拓扑结构下的具体实现聊天历史是扁平的1D流式存储知识图谱是2D的平面拓扑而分层知识库则是3D的层次结构。同时Letta原名MemGPT框架也映射了此类型的记忆。Letta的核心创新是引入了虚拟内存分页机制——这个词听起来像操作系统概念实际上是Token级记忆管理的一次重大突破。Letta将记忆分为核心记忆Core Memory和召回存储Recall Storage前者是必须时刻保持在上下文窗口中的关键信息后者则是可以按需调取的历史记录。这种设计既保证了关键信息的即时可用性又通过外部存储突破了上下文长度限制。论文在讨论Token级记忆时提到这类记忆的优势在于透明和可控但挑战在于检索质量和规模扩展。Zep团队最近推出的Graphiti项目用知识图谱的方式组织记忆通过实体关系的显式建模来提升检索的精准度。这是对论文所说Token级记忆依赖检索质量问题的一次工程化解决。参数级记忆深度理解的代价如果说Token级记忆是记在本子上那么参数级记忆就是学进脑子里。论文将其定义为通过训练或微调将信息直接编码到模型权重中这类记忆的特点是抽象、泛化但更新缓慢。Google DeepMind的ReMem框架是参数级记忆的典型代表。ReMem通过强化学习优化记忆保留策略将智能体的历史经验蒸馏到模型的权重参数中。这种做法的好处是智能体在处理新任务时不再需要频繁检索外部记忆库知识已经内化为本能。但正如论文警告的那样参数级记忆面临灾难性遗忘的风险——学习新知识可能覆盖旧知识。ReMem的解决方案是采用增量学习和经验回放机制这在电子书中有详细的技术剖析。另一个精彩案例来自OpenAI Build Hour的实录。OpenAI的工程师展示了如何将企业的专有知识通过微调烙印到模型中同时保持外部知识库用于快速更新的事实性信息。这种参数级Token级的混合架构恰好对应了论文提出的外部参数记忆概念——通过LoRA适配器等技术在不动模型主体的情况下添加专项能力。潜空间记忆多模态时代的新宠论文的第三种形式潜空间记忆相对陌生它指的是将信息编码到模型的隐藏状态或KV缓存中以一种人类不可读但机器高效的方式存在。这类记忆的优势是密度高、延迟低特别适合多模态场景和边缘计算。和此内容呼应MIRIXModular Multimodal Architecture是2024年学术界的一个重磅成果它将文本、图像、视频、音频等多模态信息统一编码到一个潜在表示空间中。论文在讨论潜空间记忆时提到的三种子类型——生成型、重用型、转换型——在MIRIX中都有完整体现生成型用于从潜空间重建多模态内容重用型通过缓存中间表示加速推理转换型实现跨模态信息的融合与压缩。论文为MIRIX提供了理论定位这是潜空间记忆在多模态智能体中的最佳实践案例。此外A-MEM采用Zettelkasten卡片盒笔记法的思想构建自组织的笔记网络。虽然表面上看它用的是Token级存储每条笔记都是文本但论文的视角重新理解了它的本质A-MEM通过神经网络学习笔记之间的关联这些关联权重存储在潜空间中构成了一种混合记忆——显性知识用Token存储隐性关联用潜空间编码。02功能维度从为什么存看认知角色如果说形式回答的是物理结构问题那么功能回答的就是认知目的问题。论文的第二个维度将记忆分为事实记忆、经验记忆、工作记忆这套分类法与电子书采用的心理学分类情节、语义、程序记忆形成了有趣的互补。两套分类法的对话普林斯顿大学经典论文《语言智能体的认知架构》的思路用心理学术语定义记忆类型。这种分类的好处是直观——“情节记忆就是发生了什么”“语义记忆就是知道什么”“程序记忆就是会做什么”。但在实际系统设计中这些边界往往模糊。一次成功的销售案例既是情节记录了当时的对话也是程序提炼出销售话术还是语义总结出客户偏好规律。论文提出的功能分类则更加面向系统设计事实记忆用于保持一致性智能体知道什么经验记忆用于自我改进智能体学会什么工作记忆用于当前任务智能体在想什么。这三者的边界更清晰也更便于工程实现。论文的事实记忆大致对应电子书的语义记忆部分情节记忆“经验记忆对应情节记忆程序记忆”“工作记忆则是心理学中的短期记忆”。但论文的分类更强调功能目的这让技术选型有了明确的指引。亚马逊的实践功能导向的架构设计亚马逊在Agentic AI基础设施上的实践经验。亚马逊的架构设计清晰地体现了功能分类的思想他们用Amazon Bedrock Knowledge Base存储事实记忆产品信息、用户资料用Agent的执行轨迹数据库积累经验记忆哪些策略成功了、哪些失败了用会话上下文管理工作记忆当前任务的临时状态。更精彩的是亚马逊总结的检索-增强-处理-提取-更新五步循环这个流程在论文的动态维度中得到了理论升华。论文将记忆的生命周期分为形成、演化、检索三个阶段而亚马逊的五步流程恰好是这三个阶段在工程上的精细化展开检索对应论文的Retrieval提取对应Formation更新对应Evolution。微软的探索从记忆到能力Microsoft AI Memory技术展示了另一种思路。微软在Copilot中大量使用参数级记忆目标是让记忆转化为能力。比如Copilot不是记录用户每次都要求生成带注释的代码而是直接微调模型让它天生就会写注释。这种做法减少了运行时的检索开销提升了响应速度但代价是失去了可解释性——你无法追溯为什么Copilot会这样回答。论文在讨论经验记忆时专门提到了技能型记忆——将重复的操作序列抽象为可复用的技能单元。微软的做法是将这种抽象直接内化到模型参数中而电子书中介绍的Letta框架则采用了另一种方案将常用操作封装为工具函数Tool Functions存储在外部代码库中。两种方案各有优劣论文的框架帮助我们理解前者是参数级的经验记忆后者是Token级的经验记忆。选择哪种取决于你更看重性能还是透明度。03动态维度从怎么变看全生命周期论文的第三个维度动态探讨记忆的形成、演化、检索全过程。这是最具实操价值的部分因为它直接关系到系统的实现细节。记忆形成五种技术路径论文总结了五种记忆形成方法语义摘要、知识蒸馏、结构化构建、潜空间表征、参数内化。电子书中几乎每个案例都能对号入座。PPIO的实践属于结构化构建——将对话流、用户画像、知识图谱等信息显式地组织成数据结构。Google Cloud的上下文工程方法则是语义摘要的典型应用——他们强调在每次对话后生成简洁的摘要避免上下文窗口被无用信息占满。Google DeepMind的ReMem框架展示了知识蒸馏和参数内化的组合拳先用强化学习从大量轨迹数据中提取策略规律再通过持续训练将这些规律固化到模型权重中。论文称这种方法能够实现跨任务的知识迁移ReMem的实验结果恰好验证了这一点——在电子书记录的测试中经过记忆优化的智能体在新任务上的表现明显优于baseline。记忆演化整合、更新、遗忘论文特别强调遗忘的重要性——一个好的记忆系统不仅要会记还要会忘。目前的开源框架中只有少数几个如MemoryScope、Letta实现了遗忘机制。MemoryScope是阿里巴巴达摩院开源的框架它采用四层仿生记忆架构模拟人类的感觉记忆、工作记忆、短期记忆、长期记忆。其中最精妙的设计是巩固机制当短期记忆中的某条信息被反复调用就会升级到长期记忆反之长时间未被访问的长期记忆会降级到短期记忆最终被遗忘。这种动态调整策略与论文提到的基于访问频率的遗忘算法不谋而合。Letta的遗忘机制则更加直接——当外部召回存储的数据量超过阈值时自动归档最旧的记录。但论文指出简单的时间衰减可能导致重要但不常用的信息被误删更好的方案是结合时间、频率、重要性三个因素。电子书在第四章的横评中提到这正是Letta未来的改进方向。记忆检索不只是向量搜索在检索环节论文批判了当前过度依赖向量相似度搜索的现状呼吁探索更多元的检索策略。电子书中介绍的几个框架恰好代表了不同的探索方向。Mem0是最简单的向量检索适合快速上手Zep的Graphiti项目引入了知识图谱支持多跳关系查询Cognee更进一步将向量、图谱、全文检索三种方式结合形成混合检索。电子书在第四章的选型建议中指出如果你的应用场景涉及复杂推理比如找出所有在北京工作过的、懂Python的、对区块链感兴趣的用户Cognee和Zep是更好的选择如果只是简单的语义匹配比如找出和当前对话主题相关的历史记录Mem0足够了。论文提到的查询构建环节也很关键。Google Cloud最佳实践中有一个细节值得注意他们不是直接用用户的原始问题去检索而是先让LLM生成检索意图——一个结构化的查询对象包含关键词、时间范围、相关实体等信息。这种做法显著提升了检索精准度尤其是在多轮对话场景中。04技术选型理论指导下的决策树第一步确定记忆形式。如果你的应用需要高度透明、可审计比如医疗、法律场景选择Token级记忆推荐使用Mem0、Zep或Letta。如果你追求极致性能、能接受黑盒比如游戏AI、推荐系统考虑参数级记忆可以参考电子书中Google DeepMind的ReMem方案。如果你在做多模态应用或边缘部署潜空间记忆是未来趋势MIRIX架构是很好的学术参考。第二步明确功能需求。如果主要是存储用户资料、产品信息等静态知识重点投入事实记忆的建设用好向量数据库和知识图谱。如果希望智能体能从失败中学习、不断优化策略经验记忆是关键电子书第三章介绍的A-MEM和ReMem都是可以借鉴的方向。如果你的任务涉及复杂的多步骤推理工作记忆管理至关重要参考亚马逊的五步循环和Letta的虚拟内存机制。第三步选择具体框架。● 中文应用首选MemoryScope或MemoryBear它们是国内团队开发中文支持好文档齐全。● 复杂推理Cognee或Zep它们的知识图谱能力强支持多跳查询。● 长对话/代码助手Letta虚拟内存分页机制是业界独创已在真实产品中验证。● AWS生态Amazon Bedrock全托管、企业级安全电子书中有详细的集成教程。● 快速上手Mem0API最友好10行代码就能跑起来。大部分框架都集中在Token级记忆参数级和潜空间记忆的开源方案很少。论文中也提到——后两者的技术门槛更高、通用性较差往往需要针对特定任务定制05未来趋势从检索式到生成式记忆论文的最后一章展望了五大未来方向自动化记忆设计、强化学习集成、多模态记忆、多智能体记忆、可信记忆。有意思的是电子书在这些方向上都记录了先行者的探索。自动化记忆设计指的是让智能体自己决定记什么、忘什么、什么时候检索。论文认为这是未来的核心趋势因为随着智能体越来越复杂人工设计记忆策略已经不现实。强化学习集成是Google DeepMind的强项。未来的记忆系统应该是可学习的——不仅内容可以学习连记忆的架构和策略也应该通过学习不断优化。多模态记忆是MIRIX架构探索的方向。随着多模态大模型的普及记忆系统也必须支持多模态而潜空间记忆是最自然的解决方案。多智能体记忆在企业应用中尤为重要。Salesforce Agentforce展示了一个有趣的场景多个智能体协作处理客户请求它们需要共享部分记忆比如客户资料同时保持各自的私有记忆比如各自负责的任务状态。论文提出了分层共享记忆的概念这在电子书记录的实践中已经有了雏形。可信记忆涉及隐私、安全、可解释性。Google Cloud最佳实践中有一整节讲护栏机制——如何防止智能体记住敏感信息、如何检测记忆中的幻觉错误。论文强调随着记忆系统在高风险领域的应用可信性将成为刚需。这也是为什么Token级记忆透明、可审计在合规场景中不可替代。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

北京康迪建设监理咨询有限公司网站赣县城乡规划建设局网站

徐州市云龙区建设局网站总推荐榜总点击榜总排行榜

免费html网站制作成品微信小程序与微网站

唐山网站建设策划舆情信息在哪里找

三合一静态网站南山区网站建设

企业网站建设文章网站设计项目计划书

做电影网站需要注意什么wordpress做移动商城