Workflow
记忆熊
icon
搜索文档
Agent交卷时刻:企业如何跨越“一把手工程”信任关?|甲子引力
搜狐财经· 2025-12-17 21:21
文章核心观点 - AI Agent的价值正从技术能力转向真实的商业产出,必须深入业务、解决问题并交出可衡量的价值答卷 [2] - 2025年是推理AI Agent元年,能够自主规划与智能决策的AI Agent正成为企业的真实生产力,重点从“降本”转向“增效”,帮助企业迈向价值增长 [18] - 行业已从大模型的战争收敛到更上层应用的战争,开源模型显著降低了基础成本,使得AI Agent的爆发具备现实可行性 [25] AI Agent的价值共识与落地之困 - **价值定位**:企业应用AI Agent的核心价值不仅在于“降本增效”,更在于驱动规模化增长与营收提升,企业渴望的是真金白银的收益 [12][18] - **增效内涵**:“增效”具体体现在三个层面:1) 原有业务流程AI化与重构;2) 强化AI与现有数字化系统的集成,提升经营与决策效率;3) 激活企业的核心数据资产 [14][15] - **深层阻力**:企业落地AI Agent面临三大主要障碍:1) **信任问题**,涉及数据与应用安全性;2) **习惯问题**,改变固有工作流程需要大量推动与培训;3) **费用问题**,新的改革需要明确的预算与投入 [20][21] - **认知转变**:DeepSeek等模型的出现已经提升了企业决策者对AI的认知,当前的主要挑战在于企业是否在信任、习惯和费用方面做好了准备 [21] - **历史负担**:过往的数字化投入巨大(例如2000、3000万),但技术常处于从属地位,这构成了对当前AI应用的一定阻碍,企业主现在更希望AI能直接交付结果,重构生产力 [22][23] - **成本结构优化**:开源模型(如DeepSeek、蚂蚁百灵模型)的成熟,使得企业基于其进行精调的效果超过自研多年模型,且成本大幅降低,这是2025年成为Agent爆发元年的关键原因 [24][25] AI Agent如何真正“用起来” - **一把手工程**:企业AI数智化转型必须是一把手驱动的“一把手工程”,需要企业有决心打开业务流程,与AI公司合作共创,共同重塑价值生产链条 [26][27] - **全栈技术方案**:要真正解决客户问题,必须构建完整、全栈的技术系统,覆盖数据处理、模型训练、Agent架构设计及强化学习等技术,行业正朝此方向演进(如OpenAI的AgentKit,零一万物的Open AgentKit) [28][29][30] - **战略布局**:零一万物采用“一横多纵”战略:“一横”指打造以万智2.0为核心的企业级AI操作系统,将Agent研发门槛降至“零代码”;“多纵”指聚焦金融、政务、工业等重点行业,与灯塔客户共建场景化解决方案 [31] - **金融Agent第一性原理**:金融Agent的第一性原理是“风险可控下的价值创造”,AI必须创造可衡量的业务收益,同时严守安全、合规底线 [31][32] - **金融Agent核心特性**:金融行业对AI的核心诉求抽象为三大特性:1) **严谨性**:通过技术手段系统性压制幻觉,将其控制在业务可接受范围;2) **专业性**:要求模型与垂直领域专家判断及专业语言对齐;3) **遵从性**:对监管规则与合规红线的绝对遵守 [32][33][34] - **完整智能体构成**:真正的智能体如同完整的“人”,需要融合“大脑”(模型)、知识经验(高辨识数据)与工具(执行力),才能从助理(Copilot)跃迁为可用的“数字员工” [34] - **To B企业的价值交付**:深度原理为客户提供分层价值:**短期**解决繁琐复杂问题,缩短研发周期,提高人效比;**中期**提升整体研发管线成功率与鲁棒性,算“整体账”;**长期**提升研发创新的“斜率”,加速创新效率 [35] - **商业化闭环案例**:红熊AI通过研发开源的“记忆科学”(记忆熊)产品,让Agent拥有类人记忆能力,显著提升了业务指标:AI自助解决率大幅跃升至98.4%,通用幻觉率控制在0.2%,垂直环境下幻觉率可压缩至接近零 [36] - **未来智能体的关键能力**:实现人与智能体共创需要解决:1) **懂人**:在交互中理解人的指令;2) **懂事**:理解特定行业的Know-How;同时需具备自我学习能力、逻辑推理能力和多模态能力 [37][38][39]
大模型的“健忘症”有药了
虎嗅APP· 2025-12-01 21:21
大模型行业的“健忘症”瓶颈 - 行业一度陷入长上下文窗口的军备竞赛,从8k Token发展到追求百万乃至千万级窗口,期望模型能记住一切[3] - 但在实际商业场景中,如电商客服,即便接入顶流模型,对话超过十几轮后,AI仍会出现“健忘”,例如忘记用户的海鲜过敏史或早期提到的预算[4] - 技术原理上,Transformer架构的注意力机制在处理超长序列时存在严重衰减,导致“近因效应”,早期信息被后续对话稀释[5] - 为维持记忆,开发者需反复将历史对话打包重新输入模型,导致Token消耗快速增长,成本高昂[5] - 在多智能体复杂任务中,由于缺乏共享的长期记忆机制,不同AI智能体(如销售、客服、售后)之间信息割裂,导致决策冲突和服务混乱[6][7] - 当前技术框架下,企业投入大模型获得的智能体如同需要反复重申指令的“实习生”,存在成本高、易遗忘、协作割裂三大问题[7] “红熊AI”的解决方案:记忆熊 - 红熊AI于2024年11月开始研发,2025年11月正式对外发布“记忆熊”产品,旨在将“记忆”构建为可管理、可共享、可追溯的基础设施[10] - 其底层逻辑并非“记住更多”,而是“记住更有价值的信息”,借鉴人类记忆机制,将数据转化为信息、知识,最终形成可指导行为的记忆[11] - 系统模拟人类大脑记忆机制,构建分层记忆系统:“数字海马体”负责信息加工编码,“数字皮层”长期存储知识,“数字杏仁核”绑定情绪[14] - 具体包括:短期工作记忆(用于任务连接,通过情感倾向加权算法识别高优先级数据)、长期显性记忆(对应知识库)、以及隐性记忆(存储用户偏好、企业“暗知识”)[14] - 记忆由独立的“记忆模块”存储管理,而非固化于大模型参数中,系统通过记忆萃取引擎决定信息的保留、遗忘与调用时机[14] - 2025年11月30日,红熊AI将记忆熊产品完全开源[28] 记忆熊的核心技术优势与效果 - 构建记忆图谱,以结构化方式表达记忆内容,挖掘其相互关系,赋予AI联想与多跳推理能力,使信息更连贯、推理更准确[17] - 打通平台,让智能体共用同一套用户记忆,智能体群控记忆共享率达到99.99%,基本消除因记忆不同步导致的服务问题[17] - 通过记忆分层存储机制,压缩短期记忆为长期记忆摘要,使多轮对话累计的Token消耗降低90%,实现成本断崖式下降[17] - 使用动态语境校准和智能语义剪枝技术,将垂直场景的幻觉率压低到0.2%以下,端到端回应准确率达到99.6%[18] - 在复杂逻辑的多跳推理和时序记忆上表现领先,具备区分过去与现在的时间感[18] - 基于向量的非图谱版本,将搜索请求的中位响应时间(P50)控制在0.137秒;语音交互场景下应答延迟仅0.8秒,提升交互流畅度[18] 记忆的商业价值与行业影响 - 记忆的突破将重塑商业形态,使AI首次具备回答“我是谁”、“在与谁沟通”、“之前达成过什么共识”的能力,从而进入高信任度场景[21][22] - 记忆熊产品主线包括:隐性记忆显性化、记忆结构化处理、记忆场景化应用,旨在将交互沉淀为组织记忆[22] - 能够将企业依赖个人经验的“暗知识”(如金牌销售技巧、资深技工经验)结构化沉淀,转化为组织记忆,构筑企业护城河[22] - 通过“语义剪枝+记忆锚定+情境校准”机制,帮助大模型只保留与用户身份、历史行为及任务目标相关的核心记忆,解决内容越多成本越高、遗忘越快、幻觉越多的问题[22] - 将记忆变为组织资产,提升多智能体协同工作中的记忆共享率,是模型协同的关键[22] - 推动记忆从技术功能拓展为商业基础设施,标志AI从工具进入体系阶段[23] - 参数规模的竞争终将结束,记忆可能成为真正的操作系统级入口,AI的下一场竞争焦点是“谁更记得住”[25] - 记忆是通往通用人工智能(AGI)的必由之路,当前大模型在逻辑推理、长期规划和自我进化上的进步空间,根源在于缺乏稳定、连续且可塑的记忆系统[26]