Workflow
AI Agent(智能体)
icon
搜索文档
金融大模型步入“价值”攻坚战,如何跨越三道门槛?
第一财经· 2025-09-11 18:11
核心观点 - 2025年是中国金融业大模型规模化落地的关键年 AI技术正从概念验证深入业务核心 驱动金融服务智能化和普惠化 [1] - 金融机构从早期单纯强调"用起来"转向关注技术与业务协同的实际效益和成本控制 "有价值"成为行业共识 [2] - 金融大模型应用面临数据价值转化不足 安全性挑战和不确定性等门槛 需通过技术融合和体系建设解决 [4][5][6][7] AI应用现状与进展 - 金融智能体已具备感知 学习 行动 决策的代理能力 可培育专业水准的金融代理人 适用于市场分析 风险评估 投资顾问等领域 [2] - 行业正从人机协同L3阶段向L4阶段跨越 关键突破在于大模型使机器自主理解并响应用户需求 未来将向L5阶段发展 提供更拟人 有情感的高质量服务 [2] - 2025年是智能体元年 大型企业构建智能体平台 业务部门参与度从18%提升至74% [3] - 银行业AI大模型落地呈加速跑态势 工商银行新增100余个应用场景包括AI财富助理和投研智能助手 邮储银行开展230余项大模型场景建设 [3] - 马上消费发布零售金融大模型"天镜"并升级至3.0版本 应用于八大核心场景 智能客服年均服务超6500万次 [5] 战略与体系建设 - 金融机构将智能化作为最重要战略 倾向于从体系化角度考虑AI建设 希望利用1-2年时间窗口构建AI体系确保发挥大模型核心作用 [3] - 行业需要推动数据中台与AI平台深度融合 将AI技术系统应用于业务全流程 目前数据平台仅还原50%数据价值 大量业务规则和专家经验尚未充分挖掘 [5] 数据价值转化挑战 - 中国企业面临数据资源难以转化为自身资产的挑战 数据 技术与算法割裂无法协同支撑决策 [4] - 需通过洞察平台从大量"废弃数据"中识别高价值应用场景与客户真实需求 洞察平台可激活企业约70%的"沉睡数据" [4] - 计划将自动驾驶领域的强化学习经验与AI技术融合 在金融决策和风险控制领域实现突破 [4][5] 安全性与可信性挑战 - 必须高度重视金融模型的安全性与可信性 模型歧视 算法共振和隐私泄露等技术风险仍未彻底解决 [6] - 算法共振指不同机构采用相似程序算法逻辑导致市场预测趋同和交易策略一致 可能引发单边市场行为与剧烈波动 [6] - 隐私泄露问题缘于模型可解释性不足 对算法处理 数据挖掘及生成过程缺乏透明解释 制约监管合规能力和模型可靠应用 [6] - 金融决策要求极高精准性 微小偏差可能造成显著影响 需确保AI决策可信 已逐步形成标准方法 平台与工具 [6] 不确定性挑战 - AI引入带来不确定性挑战 部署前无法预知投资回报率或具体商业成效 要求机构有先期投入与探索意愿 [7] - 金融机构需在战略规划 组织架构设计和人才引进等方面持续创新与调整 [7]
2025年中国智能体(AlAgent)年度最佳实践应用榜单
头豹研究院· 2025-09-02 20:14
报告行业投资评级 - 报告未明确给出行业整体投资评级 但通过多维度榜单评选展示了AI Agent领域的优质企业和创新应用[2] 报告核心观点 - AI Agent行业通过平台化、混合商业模式和低迁移成本实现用户规模扩散 其中开发平台型产品占比60% 混合商业模式(B/C并行)占比50%[8][9][11] - 全球化发展以应用型Agent为主导(占比70%) 通过To B路径(占比70%)切入国际市场 电商和营销领域是最具潜力的突破口[16][17][20][23] - 实用性评价以To B模式为核心(占比70%) 覆盖金融、工业、制造等10余个行业场景 通用与多场景应用各占50%[26][27] - 创新性体现在应用型产品突破(占比60%) 多模态交互、数字员工等新兴领域集中涌现 且80%通过To B模式实现商业化[33][34][35] - 商业价值潜力由应用型产品主导(占比70%) 90%通过纯To B模式兑现 医疗、营销、多场景解决方案成为主要价值承载领域[39][40][41] 中国AI Agent榜单评审维度 - 评估体系涵盖技术创新性、市场潜力和应用价值三大维度 覆盖通用型、垂类及端侧Agent全类型产品[2] - 采用多维度深度分析框架 确保评选结果客观反映行业实际发展水平[2] 年度最受欢迎Agent榜单分析 - TOP10企业包括通义晓蜜、百度文库GenFlow、扣子COZE等 平台型产品占比60% 混合商业模式(B/C并行)占比50%[6][9][11] - 业务场景分布:客服(20%)、多场景(50%)、工作流(10%)、财务(10%) 通用场景与垂直场景分别占比50%[9] - 平台化基因降低用户迁移成本 开放生态形成规模效应 六成上榜企业提供可复用通用底座[10] 最具全球发展潜力Agent榜单分析 - TOP10企业包括Atlas AI、艾思科蓝AI科研工作台、MiniMax Agent等 应用型产品占比70%[14][17] - 商业模式分布:To B(70%)、To C(10%)、B/C混合(20%) 电商(20%)、营销(50%)、科研(10%)成为核心出海场景[18][20][23] - 应用型产品更符合海外即用即得需求 To B模式规避C端文化差异 电商营销领域依托中国现有优势实现突破[21][22][23] 最实用Agent榜单分析 - TOP10企业涵盖通义灵码、工业检修机器人、金融文档平台等 100%为应用型产品[25][27] - 行业覆盖:通用(50%)、金融(10%)、工业(10%)、制造(10%)、房地产(10%)、住宿餐饮(10%)[27] - 功能分布:多场景(50%)、代码(10%)、检修(10%)、运营(10%)、知识管理(10%)、智能客服(10%) 70%通过纯To B模式落地[27][28] 最具创新Agent榜单分析 - TOP10企业包括数字员工、多模态创作Agent、产业招商智能体等 应用型占比60% 开发平台型占比40%[31][34] - 创新场景集中于多模态短片创作(10%)、数字员工(10%)、智能问答(10%)、安全(10%)、国防(10%) 80%采用To B商业化路径[34][35] - 应用突破优先于平台搭建 安全、内容生成等前沿领域通过B端刚性需求实现价值验证[35] 最具商业价值潜力Agent榜单分析 - TOP10企业包括品牌智能体、具身智能机器人、大装置万象平台等 应用型占比70% 平台型占比20%[37][40] - 价值场景分布:多场景(60%)、客服(20%)、营销(20%) 医疗健康成为新兴价值领域[40] - 90%通过纯To B模式兑现价值 企业级采购注重可量化收益与合规要求 平台型产品通过生态捆绑扩大商业半径[41]
“AI智能体元年”开启 银行业掀起数字员工革命
中国经营报· 2025-08-20 21:36
行业趋势 - 2025年被视为AI智能体元年 银行业积极推进AI Agent研发[1] - 金融智能体成为解决大模型应用局限的有效路径 满足更高阶业务需求[1] - 智能体逐步成熟 能够高效处理事务性、操作性、流程化、标准化工作 有望成为银行数字员工[1] 应用场景 - 风险管理、网络运维、数据洞察等决策类场景成为银行探索智能体的优先领域[2] - 工商银行通过监督微调和强化学习 实现信贷风险多关联任务识别能力构建[2] - 邮储银行告警研判智能体基于运维知识库自动生成告警排查思维链 实现常见告警自动排查[3] - 上海银行智能问数平台采用多Agent架构 提供低门槛、高效智能的数据查询与分析服务[3] 技术发展 - 头部银行已实现"通用大模型+垂类模型+智能体"技术架构落地[3] - 证券业头部券商推出多款AI应用产品并投入实战场景[3] - 保险业着力推进智能理赔体系建设[3] - 未来两年将涌现更多金融垂类大模型及金融通用大模型[3] 行业挑战 - 模型幻觉问题在金融领域尤为突出 对严谨性和准确度要求更高[4] - 数据安全、算法歧视及模型同质化可能引发"羊群效应"等安全风险[4] - 数据的准确性与可靠性对金融决策至关重要 错误信息可能导致严重经济损失和法律风险[5] 解决方案 - 金融机构正构建"数字免疫系统" 通过大模型安全控制架构和多层次防御机制提升安全性[5] - 安全体系涵盖训练数据安全治理、安全评估基准、用户输入防御策略、投毒攻击预防等多方面[5]
拥抱 AGI 时代的中间层⼒量:AI 中间件的机遇与挑战
36氪· 2025-08-05 17:52
大模型发展趋势 - 模型能力持续跃迁 从文本生成到多模态理解与推理 语言能力显著增强 GPT-4在复杂问题处理和文本生成方面远超GPT-3[1] 多模态能力突破 GPT-4o支持文本、音频、图像和视频的任意组合输入输出[2] 推理能力深化 o1模型通过强化学习生成内部思维链 在编程和数学推理领域表现出色[2] 工具使用能力拓展 o3模型具备自主调用和整合外部工具的能力[2] - 其他领先模型展现强大能力 Google的Gemini模型在多模态推理和复杂编码方面表现出色 Anthropic的Claude Sonnet 4在编程和推理方面表现优异[3] - 模型生态日益开放 开源模型兴起 Meta发布LLaMA系列 国内外团队推出QWen、DeepSeek、Kimi、Mistral等高质量开源模型[4] 开源模型能力赶超 部分开源模型在特定任务上逼近或超越专有模型 如DeepSeek R1和Kimi K2在推理和代码生成方面表现突出[4] AI应用演进路径 - 应用形态变革 从聊天机器人到组织级智能体 分为五个层级 Level 1具备对话语言能力 如早期ChatGPT[5] Level 2具备人类水平问题解决能力 如DeepSeek R1[5] Level 3能够代表用户采取行动 如Manus、Claude Code[6] Level 4能够辅助发明和发现[6] Level 5能够执行整个组织工作[6] - AI Agent爆发式增长 通用Agent如Manus、Genspark、ChatGPT Agent 通过集成工具提供一站式服务[8] 专业Agent如Claude Code、Gemini CLI、Qwen Code等Coding Agent 以及Cursor、Trae、Kiro等AI Coding IDE 提升开发效率[9] - 通用Agent与垂直Agent并存互补 垂直Agent需要深度集成领域知识、专有数据和特定工具 如企业智能客服需精准理解产品手册和服务条款[10] 基础模型无法快速适应业务变化 垂直Agent成为必然选择[11] AI中间件机遇 - Agent研发提效 提供一站式研发框架 抽象封装底层LLM 支持ReAct模板 集成RAG、记忆库和外部工具插件[13] 引入无服务器架构作为运行时 弹性扩展且降低运维成本[14] 提供Agent评估框架 模拟环境验证决策和输出质量[14] - 上下文工程 提供上下文模板和编排工具 自动拼接最优提示组合[15] 结合模型注意力机制特点 对上下文进行缓存和裁剪优化 如保持Prompt前缀稳定利用KV-Cache提速[15] 实现上下文压缩策略 如对话摘要、索引引用和分层内存[18] - 记忆管理 提供短期和长期记忆功能 短期记忆如多轮对话内容和工具结果 长期记忆如用户偏好和业务知识库[19] 统一管理不同层次记忆 提供API读写外部数据 实现记忆压缩和更新策略[19] - 工具使用与扩展 建立标准化工具接入机制 如Model Context Protocol (MCP) 封装外部数据源或API[20] 提供工具聚合产品 按需调用行业常用工具[20] 引入工具调度优化算法 提升工具使用准确率[21] - 沙箱环境与安全 提供受控的沙箱运行环境 隔离代码执行和网络访问[22] 制定工具权限和调用限制 设置人工审批流程[22] 支持强化学习微调[23] - 多智能体协作 提供多Agent管理和编排功能 提升任务并行处理能力和专业性[24] 设计通信协议和共享内存 避免重复或冲突操作[24] - 多模态支持 集成图像识别、语音合成、OCR、视频理解等模块[25] 提供多模态数据处理管道 实现流式、多模态的人机交互[25] AI中间件挑战 - 复杂上下文构建与优化 管理不断膨胀的上下文 制定合理的组装策略[27] 实现上下文裁剪和压缩机制 平衡准确性和效率[28] - 持久记忆更新与利用 持续更新记忆并确保正确利用 如用户资料变化[29] 攻克记忆组织索引、演化和冲突消解难题[29] - RAG效果优化 提升检索质量和速度 避免错误信息误导[30] 支持大规模知识库的快速语义搜索[30] - Agent行为评估测试 缺乏成熟测试方法 输出具有概率性和多样性[31] 构建模拟环境或沙盒测试框架 判断决策对错[32] - 工具使用风险与管控 提供权限控制 设定工具权限边界[34] 记录详细日志供审计和追溯[35] 设置人类复核流程 确保符合法律规范[35] - 沙箱环境性能与成本权衡 部署沙箱带来性能开销和成本负担[37] 权衡任务执行方式 采用轻量隔离技术[37] 解决跨平台支持问题[38] 未来发展方向 - 短期使命 解决AI应用规模化的最后一公里问题 提供高层次抽象、自动化优化和托管平台[39] - 长期潜力 成为组织智能的神经中枢 连接模型、数据和业务系统[39] - 技术范式更替 从聊天机器人到组织级智能体 工程化与规模化落地成为核心挑战[40]
直击WAIC 2025丨对话云天励飞董事长陈宁:只有端、边、云协同,才能找到AI大规模落地最优解决方案
每日经济新闻· 2025-07-29 21:34
行业趋势 - AI Agent快速发展推动推理芯片重要性提升 [1] - 人工智能技术将在未来五年重新定义所有电子产品 包括可穿戴设备 手机 家用电器 电动汽车和人形机器人 [1] - 未来五到十年以推理芯片为核心的AI推理算力网络将无处不在 [1] - 全球人工智能正从训练时代进入以应用为导向的推理时代 [2] 技术演进 - 2012年开启的AI训练时代由英伟达GPGPU支撑 [1] - 2012年至2025年被视为AI从"出生"到"大学毕业"的训练阶段 [2] - 推理分为云侧推理和边缘侧推理两种类型 [2] - 推理时代需要各种规格的推理芯片 从终端到边缘侧再到云端大算力芯片 [2] 市场格局 - 云端推理用于探索新场景和实现价值闭环 [2] - 边缘终端计算在大规模复制时更具成本效益 [2] - 端 边 云协同分工是寻求最优性价比解决方案的关键 [2] 产品考量 - 芯片设计PPA核心概念包括性能 功耗和面积 [3] - 用户更关注芯片价值 使用成本可控性和购买成本竞争力 [3] - 算力是重要指标但需兼顾成本 适配性等多重因素 [3] - 云侧推理关注硬件采购成本和运营成本如电费 [4] - 边缘计算对硬件采购成本更敏感 注重场景结合的有效算力 [4] - 综合有效算力和硬件成本考量设备性价比是关键 [4] 公司战略 - 云天励飞宣布全面聚焦AI芯片业务 [1] - 公司围绕边缘计算 云端大模型推理和具身智能三大核心布局 [1] - 致力于打造国产算力"加速器" [1] - 正构建国产高性价比推理芯片技术和产品体系 [4]
Manus官网显示“在你所在地区不可用”,多个社交账号清空内容
第一财经· 2025-07-11 20:12
Manus平台近期动态 - Manus官网在中国地区显示为"不可用",此前提示为"中文版本开发中" [1] - 公司官方微博和小红书账号内容已清空 [1] - 微信视频号保留与阿里通义千问团队达成战略合作的信息 [1] - 海外社交平台X账号保持更新,最新动态为7月10日发布的旧金山徒步活动信息 [1] - 公司注册地显示为新加坡 [1] - 公司尚未对上述变动作出公开回应 [1] 战略合作进展 - ManusAI宣布与阿里通义千问团队达成战略合作 [1]
中国AI Agent新贵Manus大规模裁员,将总部迁至新加坡并百万年薪招聘|独家
钛媒体APP· 2025-07-08 17:13
公司动态 - Manus在四个月内将总部从中国迁至新加坡,并裁员中国区员工,保留40多名核心技术人员迁往新加坡,其余员工给予N+3或2N赔偿 [2] - 公司在新加坡注册主体"Butterfly Effect",由开曼群岛同名实体全资控股,位于新加坡桥北路附近 [2] - 公司在新加坡展开招聘,岗位包括AI工程师、数据科学家等,薪资为每月8000-16000美元(约人民币11万元/月) [2] - 公司计划在日本东京开设办事处,进军日本、东南亚等市场 [9] - 公司成立"北京红色蝴蝶科技有限公司",资产主体设立在Butterfly Effect (Hong Kong) Limited [4] 融资与估值 - Manus完成硅谷风投Benchmark领投的7500万美元(约5.4亿元)融资,估值达5亿美元(约36亿元) [3] - 2024年完成A轮融资,投资方包括腾讯、真格基金等机构 [4] - 新加坡AI领域2024年融资额同比增长45%,Tabcut迁至新加坡后获560万美元融资 [10] 产品与技术 - 核心产品为Monica.im,国内关联企业为北京蝴蝶效应科技有限公司,成立于2022年4月 [3] - 2025年3月发布AI Agent产品Manus,声称是全球首款通用型AI智能体产品,在GAIA基准测试中取得SOTA成绩 [4] - 产品采用邀请制注册,内测码在二手平台炒至10万元一个 [4] - 2024年5月开放注册,与微软合作上架Microsoft Store [5] - 中文版本正在开发中,目前无法使用 [10] 行业背景 - 中美AI竞争加剧,美国限制对中国AI、半导体等领域的投资,促使Manus等公司将总部迁至海外 [9] - 新加坡作为亚洲关键算力节点,具有地缘优势和人才优势 [10] - 类似案例包括HeyGen从深圳迁至洛杉矶,WIZ.AI和MainFunc等公司也将总部设在新加坡或美国 [9] 市场策略 - 公司将资金用于开拓美国、日本和中东市场 [3] - 公司代表称Manus代表下一个ChatGPT时刻,最终目标是让大模型比99%的人类更聪明 [7] - 公司讨论过将中国业务和国际业务完全分开的可能性 [3] 技术挑战 - 受限于英伟达AI芯片限制,智能体迭代升级进度被迫延缓 [3] - 公司需要多个大模型支撑,如ChatGPT、Gemini等,若设在中国境内会受到美国技术和算力限制 [10]
第四范式一季度总收入逾10亿元 未披露新业务板块收入
每日经济新闻· 2025-05-15 19:01
财务表现 - 第一季度总收入为10.77亿元,同比增长30.1% [1] - 毛利润4.44亿元,同比增长30.1%,毛利率为41.2% [1] - "先知AI平台"营收8.05亿元,同比增长60.5%,占总收入74.8% [1] - "SHIFT 智能解决方案"业务收入2.12亿元,同比下降14.9%,占总收入19.7% [1] - "式说AIGS服务"业务收入0.6亿元,占总收入5.6% [1] - 研发费用3.68亿元,同比增加5.7%,研发费用率34.2%,同比下降8个百分点 [1] 业务战略 - 成立范式集团,原第四范式业务成为核心子业务,未来将进入更多业务领域 [2] - 推出新业务板块Phancy,定位为电子产品提供基于AI Agent的软硬一体解决方案 [2] - 公司表示成立集团及新业务板块是为了多元化发展,并非转型消费电子领域 [2] - Phancy不直接打造自有品牌硬件产品,而是通过智能体模块在端侧提供AI Agent能力 [3] - 未来计划通过端侧AI模组赋能消费电子厂商,降低AI终端产品门槛和成本 [3] 业务表现未披露 - 第一季度业务表现中未披露消费电子业务板块Phancy的业绩数据 [3]
Manus开放注册,价格曾经炒到10万
21世纪经济报道· 2025-05-13 09:26
Manus平台开放注册 - Manus宣布向所有人开放注册 取消等待名单 用户每天可免费执行一项任务(300积分)并一次性获得1000积分奖励 [1] - 该平台此前曾出现价格炒至10万元且一码难求的情况 此次开放或为扩大用户基础 [1] 国产大模型与创新应用融合 - Manus与阿里通义千问达成战略合作 基于通义千问开源模型实现平台全部功能 技术团队已展开协作 [2] - 合作模式为"底层能力+上层应用" 阿里提供模型支撑 Manus通过场景反馈优化模型迭代 [2] - 分析师认为此次合作标志国产大模型与创新应用进入深度融合阶段 [2] AI智能体行业趋势 - 阿里合作意在借助Manus的流量优势抢占AI智能体赛道先机 [3] - 行业预测2025年将成为AI智能体爆发关键节点 科技巨头竞争将白热化 [3]
手机智能体“无障碍”通行,你做好“直播生活”的准备了吗
21世纪经济报道· 2025-03-20 10:25
AI智能体技术发展现状 - AI智能体已从实验室走向大众视野 具备感知环境 自主决策和执行任务的能力 与简单对话的聊天机器人有本质区别 [1] - 手机厂商自2023年起争相接入大模型 将语音助手升级为全能智能体管家 可实现"一句话点2000杯咖啡"等复杂操作 [2] - 实测6款主流AI手机显示 当前智能体虽未实现"全自动驾驶"理想形态 但已具备基础任务执行能力 [2] 无障碍功能的安全隐患 - 无障碍功能拥有系统最高权限 可获取屏幕所有信息并模拟用户操作 存在银行卡密码等敏感数据泄露风险 [3] - 黑灰产已开始滥用该功能实施信息窃取 315晚会曝光的数据黑产案件涉及20亿条精准用户画像 [3] - 除华为外 所有测试手机智能体均调用无障碍功能 荣耀用于点外卖 小米用于打车 三星在对话时自动开启 [4][5] 厂商合规管理问题 - 功能管理混乱:荣耀任务结束后自动关闭 小米持续开启 vivo输入法则全程开启无障碍权限 [7] - 权限管理分散:部分厂商原生智能体未出现在系统无障碍功能列表 如vivo和OPPO [8] - 授权机制缺失:仅小米会弹窗通知 荣耀和三星直接静默调用 vivo在特定场景才触发"一键识屏"提示 [9] 行业规模与监管建议 - 全球智能手机用户超40亿 中国约10亿 Counterpoint预测2027年AI手机渗透率达40% 出货量5.22亿部 [13] - 倡议加强权限管理 包括强制列入功能列表 单独弹窗风险提示 实时显示操作状态 提供快捷关闭开关等 [14]