多智能体协作
搜索文档
艾瑞咨询:2025年中国营销智能体研究报告
搜狐财经· 2025-11-04 22:11
新认知:AI营销发展背景 - 全球营销环境面临三大变化:平台投放规则迭代加速(如Meta年算法调整超15次)、隐私监管趋严(GDPR实施前两年罚款超2亿欧元)、企业数字营销投入增加(2025年数字渠道占比61.1%)[1][8][12] - 中国出海企业面临文化差异(70.4%企业提及)、渠道复杂、合规与跨境支付等核心痛点 [13][14] - 营销智能体通过多语种素材生成、合规审查、本地化运营等功能为出海企业提供解决方案,可提升广告投放ROI 10-20% [1][9][15] 新技术:营销智能体的技术演进 - 营销智能体定义为基于生成式AI或机器学习算法,能自动或半自动执行营销任务的产品,核心能力涵盖市场洞察、内容生成、投放优化、评估报告生成 [21][24][25] - 技术发展历经早期工具、程序化广告阶段,现进入智能体阶段,实现跨渠道调度与全链路自动化,未来将向多智能体协作及大模型赋能方向发展 [22][23][27] - 未来趋势是通过“创意+投放+分析”多智能体协作形成闭环,并利用大模型的跨语种理解、本地化创意生成及合规审查能力解决跨国营销难点 [27][28][31] 新格局:中国营销智能体产业生态 - 产业生态上游为国产(文心一言、DeepSeek)与国际(ChatGPT、Gemini)大模型,中游为工具链企业(钛动科技、火山引擎),下游聚焦跨境电商、品牌、游戏等出海场景 [1][20][32] - 跨境电商为核心驱动力,2024年Temu、TikTok Shop等平台GMV增长显著,电商、游戏、泛娱乐出海App是AI营销渗透率最高行业 [1][35] - 国际市场强调算法透明与隐私合规,中国市场依托庞大电商与短视频生态,在应用场景落地和商业闭环方面走在前列 [33][35] 新模式:商业模式与价值链分析 - 主流商业模式包括广告投放分成(按预算比例或效果收费)、平台订阅制(基础订阅+按使用量计费)、增值服务费(创意制作、培训咨询) [1] - 中国市场规模持续增长,预计2030年智能营销体营收突破千亿 [1] - SaaS公司在AI货币化方面形成较一致模式(如推行AI Credits),但多数公司表示AI对近财年报表无显著影响 [29][30] 新典范:企业标杆案例剖析 - Meta的Advantage+智能投放产品实现自动化购物与App广告全流程 [1][9][23] - 钛动科技的Navos营销AI Agent提供全链路市场分析与投放优化 [1] - 可口可乐与OpenAI合作推出“Create Real Magic”平台,活动互动量比传统活动提升3倍以上;IBM使用Adobe生成广告素材,广告参与度提升约26倍 [11]
达摩院推出多智能体框架ReasonMed,打造医学推理数据生成新范式
机器之心· 2025-11-03 12:04
缺乏有效性验证: 缺乏系统性实验来对比「详细解说诊断思维」与「直接给出结论」两种训练策略的优劣。 因此,我们亟需探索更科学的方法,为模型注入权威医学知识、扩展其知识边界,并生成更严谨、高质量的多步推理路径。针对上述挑战,ReasonMed 提 出一套完整的医疗推理数据生成解决方案: 多源知识的整合: 从四个权威医学问答基准(MedQA、MMLU、PubMedQA、MedMCQA)汇聚约 19.5 万医学问题,覆盖广泛的专业知识面。 多模型的数据构建: 通过引入多个专有模型,共同生成并验证医疗推理路径,多模型互补与交叉验证提升了知识覆盖与逻辑一致性,更好的构建规模化且 高质量的医学推理数据。 本文第一作者是阿里巴巴达摩院研究实习生孙雨,他的主要研究兴趣方向是Medical Reasoning LM。本文通讯作者是阿里巴巴达摩院资深专家徐挺洋博 士。 在人工智能领域,推理语言模型(RLM)虽然在数学与编程任务中已展现出色性能,但在像医学这样高度依赖专业知识的场景中,一个亟待回答的问题是: 复杂的多步推理会帮助模型提升医学问答能力吗?要回答这个问题,需要构建足够高质量的医学推理数据,当前医学推理数据的构建存在以下挑 ...
AI玩狼人杀战绩如何,今年的B站超级科学晚也追人工智能热点
新京报· 2025-11-01 17:03
10月31日,2025哔哩哔哩超级科学晚为8项基础科学研究颁奖,涉及数学、物理、机器人、医学、化 学、人工智能、生物、量子科技等领域,将基础科学研究的趣味性传递给公众。 基础研究需要通过科普活动实现破圈。"科学创新不光是有用,还(得)有很大兴趣。"中国科学院院士、 火山地质与第四纪地质学家、中国科学院地质与地球物理研究所研究员刘嘉麒在现场如此表示。 新京报贝壳财经讯(记者韦英姿)一局"狼人杀"结束,主持人现场提问:"7位玩家中有几位是AI玩家?"即 使是教授也没有完全回答正确,其实7位玩家都由AI驱动。这是2025哔哩哔哩超级科学晚(简称:B站超 级科学晚)有关人工智能领域的科学研究分享。 新京报贝壳财经记者现场了解到,该研究选择从"狼人杀"场景切入智能体训练研究是因为"狼人杀"游戏 涉及多智能体协作,例如足球、围棋等也是常见的多智能体协作场景。 前述8项基础研究中也有个别研究瞄准产业痛点问题。例如复刻"毒液"材料的研究《仿阿米巴虫磁性"毒 液"机器人》,其作者之一、来自郑州大学的张伟伟在现场表示,希望磁流体这一材料能够解决当前化 疗药物递送难题,破解静脉流速高、血管分支复杂、生物屏障阻隔三大难关,目前仅0. ...
0.1$一键Get神仙主页!让科研人不再熬夜秃头的Paper2Page来了
自动驾驶之心· 2025-10-26 00:03
核心产品介绍 - 推出AutoPage多智能体协作框架,旨在将学术论文PDF一键转化为高质量、交互式项目主页,解决研究者手动制作主页的低效问题 [1] - 产品功能包括自动解析论文章节结构与图表信息、智能生成叙事文本与模块化内容块、自动调整图像和排版、一键渲染支持动态交互的网页结构 [4] - 用户只需输入论文PDF,即可在15分钟内自动生成结构清晰、图文丰富的研究主页,成本低于0.1美元 [2][16] 技术方法与创新 - 采用多智能体分工协作管线,将任务拆解为“从粗到精”的三个步骤:叙事规划与结构设计、多模态内容生成、交互式页面渲染 [7][8][9] - 创新点在于通过“规划师”、“内容生成器”、“核查员”、“渲染工程师”等多个智能体分工协作,避免传统端到端生成导致的页面结构混乱和内容失真 [7] - 流程中设置多个人工校验点,允许用户随时介入修改结构或调整风格,增强协作的自然性 [10] 性能表现与优势 - 在超过1500个学术主页模板构建的评测基准PageBench上,AutoPage在内容保真度、视觉美感、布局合理性等指标上显著优于GPT-4o-mini和Gemini-2.5-Flash等基线模型 [13][16] - 端到端生成时间少于15分钟,成本低于0.1美元,大幅减少传统手工制作的时间开销 [16] - 真实用户盲评得分最高,被评价为“内容更连贯、视觉更吸睛” [16] 可用性与开源 - 所有代码已开源,项目提供论文链接、项目主页、代码库及Huggingface Space等多个访问渠道 [4][14] - 算法适配多种大模型API,用户可自由选择使用Qwen、Gemini或GPT的API,其中使用Gemini2.5 Flash的性价比最高 [14]
报告征集 | 中国金融智能体发展研究与厂商评估报告(2025)
艾瑞咨询· 2025-10-23 08:06
研究背景与市场驱动力 - 金融机构在政策与市场需求的双轮驱动下积极应用AI以寻求业务价值增长 [2] - 超过80%的金融机构领导者对智能体持高度关注态度 [2] - 约65%的金融IT领导者认为智能体突破了流程自动化机器人和虚拟助手的能力局限,能以更高效率处理复杂任务,实现自主能力的显著跃迁 [2] 金融机构对智能体厂商的能力期待 - 约63%的金融机构受访者关注智能体对金融业务价值的创造,而非单纯作为效率工具 [2] - 较高比例的金融机构受访者明确表示会重点关注智能体厂商的金融业务Know-How,以确保更好地适应金融业务和监管合规场景的需求 [2] - 金融机构IT领导者还关注多智能体协作、智能体开发平台的低/零代码支持、厂商产品的安全可靠性、易用性以及支持智能体的金融行业大模型等多方面能力 [2] 研究报告概述与方法论 - 研究报告全称为《中国金融智能体发展研究与厂商评估报告(2025)》,旨在通过系统化市场研究与体系化厂商评估,形成具备参考价值的报告,帮助金融机构客户和智能体厂商全面了解市场发展 [3] - 报告将分为前卷和后卷两个部分 [5] - 前卷将围绕行业发展、应用实践、客户需求、技术与产品能力等维度,对中国金融智能体发展的现状和趋势展开分析 [5] - 后卷将基于对金融智能体厂商的调研与评估,并综合金融机构客户意见,形成“iResearch Vendor Insight:中国金融智能体厂商竞争力象限(2025)” [5] - 研究将通过大量案例实证和数理实证,并运用企业调研和专家访谈等方式展开 [4] 厂商评估与参与价值 - 厂商评估将涵盖技术与产品能力、战略规划、生态建设、商业化能力与客户口碑等诸多维度 [5] - 入选竞争力象限的厂商可提升品牌知名度和行业影响力 [7] - 分析师会定期与艾瑞生态内的金融机构展开技术交流,并对入围象限的厂商进行优先推荐 [8] - 入围厂商将有机会受邀参加艾瑞在金融智能体领域的线上、线下活动,与业内甲方、行业专家、投资机构等进行深度交流 [10] 研究周期与传播渠道 - 研究报告的选题研究阶段为2025年9月10日,报告大纲阶段为2025年9月20日,报告发布为2025年12月 [13] - 厂商征集、企业访谈及市场调研的时间窗口为2025年9月29日至2025年11月20日 [13] - 报告将通过艾瑞网官网和艾瑞咨询公众号两个官方平台发布,并会有多家艾瑞链接的媒体渠道进行传播 [9]
报告征集 | 中国金融智能体发展研究与厂商评估报告(2025)
艾瑞咨询· 2025-10-16 08:07
研究背景与市场驱动力 - 金融机构在政策与市场需求双轮驱动下积极拥抱AI应用创新以寻求业务价值增长 [2] - 超过80%的金融机构领导者对智能体持高度关注态度 [2] - 约65%的金融IT领导者认为智能体突破了流程自动化机器人和虚拟助手的能力局限能以更高效率处理复杂任务并实现自主能力显著跃迁 [2] 金融机构客户核心需求 - 约63%的金融机构受访者关注智能体对金融业务价值的创造而非单纯效率工具 [2] - 较高比例金融机构受访者明确表示会重点关注智能体厂商的金融业务Know-How以确保更好适应金融业务和监管合规场景需求 [2] - 金融机构IT领导者还关注多智能体协作智能体开发平台的低零代码支持厂商产品的安全可靠性易用性以及支持智能体的金融行业大模型等多方面能力 [2] 研究报告概述与方法论 - 研究报告正式启动标题为《中国金融智能体发展研究与厂商评估报告(2025)》旨在通过系统化市场研究与体系化厂商评估形成具备参考价值的研究报告 [3] - 报告将通过大量案例实证和数理实证并运用企业调研和专家访谈等方式展开研究 [4] - 报告分为前卷和后卷两部分前卷围绕行业发展应用实践客户需求技术与产品能力等维度分析中国金融智能体发展现状和趋势后卷基于对厂商调研评估并综合金融机构客户意见形成竞争力象限直观呈现厂商市场竞争力 [5] 厂商参与价值 - 入选竞争力象限可提升厂商品牌知名度和行业影响力 [7] - 入围象限的厂商分析师会优先推荐给艾瑞生态内金融机构进行技术交流 [8] - 报告通过艾瑞网官网和艾瑞咨询公众号发布并有多家媒体渠道传播 [9] - 入围厂商有机会受邀参加艾瑞在金融智能体领域的线上线下活动与业内甲方行业专家投资机构等进行深度交流 [10] 研究时间安排 - 厂商征集企业访谈市场调研周期为2025年9月29日至2025年11月20日 [13] - 报告选题研究于2025年9月10日开始大纲于2025年9月20日确定报告于2025年12月发布 [13]
假期被玩坏了的奥特曼,正在玩弄全世界的算力
虎嗅· 2025-10-08 07:25
OpenAI业务数据与趋势 - OpenAI整体每月tokens消耗量合计约为1040万亿,其中API部分每月约260万亿,ChatGPT订阅部分每月约780万亿 [5] - 谷歌AI工厂的月均token消耗量已从5月的480万亿骤增至6月的980万亿,并肯定突破千万亿量级 [5] - OpenAI的ChatGPT拥有约8亿周活用户,每周消耗约180万亿tokens,人均每周使用约22.5万tokens [6] ChatGPT用户行为分析 - 平均每位ChatGPT用户每周大约执行20次典型推理任务,相当于每个工作日提出约四个重要问题 [6] - 用户token消耗存在结构性差异,少数中重度用户贡献了绝大部分消耗量 [7] 开发者生态与API增长 - 平台开发者人数相对2023年增长了2倍,而API消耗的token数量增加了20倍 [9] - 平均每位开发者消耗的token数量在两年间增长了10倍 [9] - OpenAI平台现有400万开发者,API调用量为每分钟60亿token [11] 新产品发布与技术演进 - GPT-5 Pro将开放API,适用于金融、法律、医疗保健等需要高准确性和深度推理的领域 [12] - GPT-5 Codex正式发布,其日使用量从8月以来增长了10倍以上 [12] - 智能体处理任务复杂度的摩尔定律预言其每7个月翻倍,多智能体协作将推理消耗放大至简单对话的15倍以上 [13] 算力基础设施与需求 - 公司在绑定英伟达10GW数据中心后,又与AMD约定了总计高达6GW的数据中心 [14] - 目标是将数据中心规模提升至2033年的250GW,并已开始营销强大10倍的GPT-6 [14] - 公司目标是今年底达到百万张GPU卡 [23] Sora 2视频模型算力需求 - Sora 2的峰值算力需求估算高达约72万张GB200 GPU [21] - 模型规模、采样步数、硬件效率及在AI社交短视频领域的野心是决定其算力需求的关键变量 [20] - AI视频生成的应用将从社交分享扩展到影视制作等专业领域,算力竞争将推向新量级 [22]
龙湖如何用Agent重塑地产与物业的运营方式?
虎嗅APP· 2025-09-29 08:19
核心观点 - Agent智能体技术在地产和物业行业实现深度应用,通过多场景数字员工提升决策效率、风险控制和运营自动化水平,重塑行业运营逻辑 [3][5][6] - 公司自2014年起投入超100亿元进行数字化转型,搭建近300个业务系统,为Agent落地奠定数据基础 [7] - 自研数字员工平台结合500多个垂直算法模型,实现多智能体协作,准确率稳定在80%左右,年挽回损失达数千万级 [6][15][23] 业务痛点与Agent解决方案 - 决策时效性问题:区域公司调价审批依赖人工分析需1-2周,错过市场窗口 [7] - 复杂度与风险问题:传统流程无法快速模拟调价对货值、利润率等多维度影响,导致凭经验"盲批" [7] - Agent价值:融合财务、市场、运营数据提供综合建议,持续学习优化,接近"认知复制" [8] 关键落地场景与成效 定调价智能Agent - 自动整合财务数据、历史销售数据、竞品价格和市场风向,模拟不同调价方案影响 [10] - 审批时间从1-2周缩短至1-2天,避免单项目数百万货值损失 [10][11] - 首个重点Agent针对高风险高影响场景,直接给出建议通过/不通过结论 [10] 停车场异常抬杆稽核 - 年处理2亿次抬杆记录,人工审核比例从100%降至17%,稽核效率提升83% [15] - 多模态大模型自动判别合理放行与异常逃费,年避免数千万损失 [15] - 已在400多个项目落地,不合规放行减少近90% [15] 合同审核Agent - 自动识别免租期、押金、违约条款等风险点,提示条款不符合企业规定 [20] - 针对商业地产招商合同复杂条款,避免后续运营风险 [17][20] - 替代人工逐条审核,提升审核效率与准确性 [17] 培训考试Agent - 基于SOP和制度规范自动生成题库、考试及阅卷分析 [16] - 新员工入职或转岗可快速完成学习考核,保证考试一致性和公平性 [16] - 新规章制度颁布后几天内生成多岗位题库,加速全员适应 [16] 技术实施与组织管理 技术门槛与解决方案 - 最大挑战为企业知识准备度,需清晰SOP和规则库支持Agent执行 [21] - 数据质量依赖统一数字化体系,提供统一口径高标准数据 [21] - 通过结构化方式输入制度、规范、合同模板等规则,训练Agent精准识别风险 [22] 多智能体协作 - 新员工入职流程涉及审批Agent、IT部门自动开通账号、人事Agent收集信息等多Agent协作 [24][25] - 通过接口打通实现跨部门自动化,形成虚拟员工团队 [25][26] - 异常时需业务负责人介入,大部分步骤无需人工干预 [25] 自研技术路线 - 大模型采用开源与付费服务结合,AI智能体平台以自研为主 [27] - 自研数字员工平台灵活适应复杂业务场景,避免通用模型个性化不足问题 [27] - 正在进行不动产行业大模型训练,强化业务专属性和精准性 [27] 组织推进策略 - 实行AI产品经理与业务专家"双角色团队"机制,按6:4分担责任 [28] - 通过培训、AI大赛、内部体验活动减少一线员工抵触心理 [29] - 为高管、中层、一线员工分层培训,设立AI战略委员会推动"人人会用AI" [30] 外部输出与未来规划 - 2023年起向外部客户提供Agent解决方案,面临确定性期望与模型不确定性冲突 [31] - 客户数字化基础参差不齐,需先补齐高质量结构化数据等基础条件 [32] - 未来1-2年深化企业内部管理、商业运营、智慧服务领域应用 [33] - 重点开发经营数据分析Agent、客服Agent和跨部门协作Agent,实现端到端任务自动化 [34] 常见实施误区 - 忽视数据和场景基础,将Agent视为万能工具 [35] - 缺乏耐心,期望一上线即100%准确 [36] - 忽视组织与规则建设,将Agent定位为替代而非增强工具 [37]
智能体崛起:运营商竞逐下一代数字入口
21世纪经济报道· 2025-09-25 20:18
行业发展趋势 - 行业进入智能体时代,发展潜力巨大,对未来充满期待 [1] - 从APP为中心转向以Agent为中心,预计到2030年Agent数量将超过传统APP,每个人都将拥有专属智能助手 [1] - 智能体技术演进已从规则驱动走入自主协同,迈向多智能体协作新纪元 [2][6] 运营商部署进展 - 中国电信打造了80多个行业大模型以及30多个行业智能体,赋能千行百业数字化转型 [3] - 中国联通启动国家人工智能应用中试基地(医疗领域)建设运营,并开源“元景万悟”智能体开发平台 [3] - 中国移动认为硅基和碳基融合创新趋势凸显,人和硅基生命体共生发展趋势加速,未来一个人可能由多个智能体服务 [3] 智能体应用场景 - 智能体应用可分为三类:业务方面(如通话时先与对方智能助理机器人对话约时间)、运维方面(实现“一句话完成配置”)、运行方面(实时动态配置网络设备) [5] - 未来各行业将出现两类智能体应用:一类是模仿人类经验学习“职业技能”(如自主操作手机APP、机械臂质检),实现降本增效;另一类是“超人专家”,能从复杂原始数据中找出规律,带来从0到1突破(如新药物分子设计) [1][5] - 从单点工具应用走向垂直行业深度融合和跨场景生态化协同 [6] 技术挑战与创新方向 - 智能体当前错误率较高,商用方面(如财务报表、生产排期)难以容忍 [7] - 多智能体协作存在三大“卡点”:任务分配与协调、结果一致性、通信开销导致的效率瓶颈 [7] - 互联互通和长难任务处理是技术创新主旋律,智能体完成任务长度约每7个月翻一番,但准确率仍需提升 [7] - 通信协议成为智能体与外界交互的“桥梁”,需统一协议(如MCP协议、A2A协议)实现信息交互标准化 [7][8] 生态支撑体系 - 多智能体协作需要三大支撑:技术架构支撑(多智能体协同架构)、通信协议支撑(统一协议标准化接口)、计算资源支撑(云计算动态资源) [8] - 开源技术和产品不断丰富,可信体系不断完善,多智能体协同应用持续推进 [6]
思必驰AI办公本X5系列:以多智能体协作与端侧大模型重塑办公效率
犀牛财经· 2025-09-24 17:52
行业整体趋势 - 2025年家电行业步入政策效应换挡与市场需求调整的关键周期,行业整体负增长已成共识 [1] - 2024年9-12月家电全渠道零售额同比增长23.8%,但2025年7-8月同比增幅大幅收窄至仅7% [4] - 2025年国补政策转向分批下达与限流管控,补贴力度与覆盖面收缩,拉动效应逐月递减 [1][4] 促销节奏与渠道表现 - 行业促销节奏紧密衔接,线下渠道聚焦国庆旺季冲刺,线上平台为双十一提前蓄力 [2] - 线上渠道在本次促销周期中市场表现有望优于线下,因去年线下受国补政策强力拉动形成高基数 [2] - TOP渠道为拉动客流可能通过自补方式加大优惠力度,甚至出现价格倒挂,而大连锁渠道依托规模效应预计成为下半年销售表现最优渠道之一 [2] 品类表现分析 - 冰箱、洗护、空调等传统大家电均将陷入明显负增长,产业走势呈洗护<空调<冰箱的梯度分化,冰箱负增长率可能突破-20% [6] - 2025年十一及双十一促销周期,冰箱线上销量同比-23.8%,销额同比-22.1%;线下销量同比-20.3%,销额同比-19.2% [7] - 空调行业陷入“保利润”与“抢份额”的矛盾,双十一期间全渠道销量预计同比下降8.0%,销额同比下降14.4% [8][9] - 冷柜市场表现持续疲弱,2025年双十一全渠道销量同比微增1.3%,销额同比增1.9%,受国补调整冲击相对可控 [7][9] - 洗护品类跌幅相对有限,双十一期间洗衣机全渠道销量同比-2.9%,销额同比-5.7%,热泵洗烘一体机等高端功能产品为重点发力方向 [8][9] 政策影响 - 2025年中央财政3000亿元消费品以旧换新超长期特别国债资金,已下达前三批共2310亿元,第四批690亿元预计10月落地 [13] - 对比2024年国补初期的强劲拉动,2025年政策刺激强度预计相对温和,双十一家电行业同比仍可能下滑 [13][14] 竞争格局与战略建议 - 冰箱市场竞争焦点预计集中在6-8K价格段,该价位区间成为下半年各品牌争夺主战场 [7] - 行业建议聚焦零售驱动加快库存去化、坚定提结构以高附加值产品对冲国补退坡、结合能效标准升级窗口加快新品迭代 [14] - 细分功能型产品更受市场青睐,绿色节能类产品市场认可度持续提高,溢价能力明显增强 [8]