Workflow
AI Agent
icon
搜索文档
在中国做AI难,做AI Agent容易
36氪· 2025-06-17 07:39
核心观点 - AI Agent在中国市场具有独特发展优势,相比基础大模型研发更易实现商业化落地 [1][9][16] - AI Agent从"数字助理"升级为"数字员工",实现从"回答问题"到"解决问题"的价值跃迁 [6][7] - 中国企业在AI Agent领域具备三大优势:应用场景丰富、数字基础设施完善、政策支持力度大 [10][13][14] AI Agent技术架构 - 感知模块:通过API/传感器接收数字/物理环境信息 [4] - 决策模块:基于知识库和推理能力规划行动路径 [4] - 行动模块:调用API/操作软件实现外部交互 [5] - 学习模块:通过任务执行持续优化知识库和决策模型 [5] 商业价值体现 - 实现业务流程自动化,半小时完成传统需半日的工作量 [2][3] - 商业模式从SaaS升级为RaaS(结果即服务),直接挂钩企业降本增效需求 [7][8] - 典型应用场景包括电商运营、医疗健康、交通管理等垂直领域 [14] 中国市场特点 - 训练GPT-4级大模型需数十亿至上百亿人民币成本,仅少数巨头可参与 [9] - 拥有全球最活跃的数字经济生态,为AI Agent提供复杂训练场景 [10] - 移动支付/物流网络/云服务等基础设施支持端到端任务闭环 [13] - 政府推动"人工智能+"行动,创造大量政策支持的市场需求 [14] 行业格局 - 互联网巨头通过Agent整合内部服务生态(如阿里"通义千问") [14] - 垂直领域创新企业分三类:深入实体(中科视语)、深耕行业(卓世科技)、平台赋能(斑头雁) [14][15] - 采用开源模型+场景微调的技术路径更符合中国企业特点 [11][12]
蚂蚁搭上稳定币的快车
华尔街见闻· 2025-06-16 21:03
公司动态 - 蚂蚁数科已启动申请香港稳定币牌照 并与监管进行多轮沟通[2] - 蚂蚁国际计划在新加坡和香港申请稳定币牌照 将在通道开启后提交申请[2] - 蚂蚁数科将香港列为全球总部 并完成监管沙箱先行先试[2] - 蚂蚁国际与德银合作 借助代币化技术和AI外汇技术提供跨境支付解决方案[5] - 蚂蚁国际旗下Antom和万里汇将参与拓展全球商户支付服务[5] 行业趋势 - 沃尔玛 亚马逊等巨头考虑发行自有稳定币[2] - 香港《稳定币条例》通过使稳定币从灰色资产转为合规金融工具[3] - 稳定币交易量达28万亿美元 超过Visa和Mastercard[4] - 渣打预测未来四年稳定币供应量将增长10倍 年吸纳4000亿美债[4] - 稳定币可能占外汇现货市场交易量的10%(目前约1%)[4] 技术特性 - 稳定币锚定法币(如美元 港币)保持1:1兑换率[3] - 相比传统加密货币 稳定币具备支付媒介 流通单位和金融工具多重功能[3] - 稳定币可实现跨国即时转账 大幅降低3-5天的传统银行结算时间[3] - 稳定币能激活16万亿美元的现实世界资产通证化(RWA)市场[5] 战略布局 - 蚂蚁国际将稳定币定位为全球资金流动基础设施[5] - 蚂蚁数科以香港为支点 推动稳定币在现实资产交易中的应用[5] - 通过稳定币布局链上债券 货币基金等业务 搭建传统与去中心化金融桥梁[5] - 稳定币将成为AI Agent经济中最基础的流通工具[6] - 蚂蚁计划构建支付到资产流通的全链条闭环生态[6]
字节打响Agent基建之战
华尔街见闻· 2025-06-16 20:56
字节跳动AI战略布局 - 公司正押注AI Agent作为新一代技术范式,试图通过换道超车实现技术突破 [1] - 火山引擎发布豆包大模型1.6系列,综合成本降低63%,支持256K上下文处理能力 [8][10] - 公司CEO梁汝波明确表态将长期投入AI技术研发,追求智能突破与产业应用结合 [1] AI Agent行业趋势 - AI Agent被视为继PC时代的Web、移动时代的APP后的下一代技术主体 [1][5] - IDC预测2025年将成为中国Agent落地元年,图像/视频类大模型调用量将显著增长 [6] - Agent技术将重构互联网入口格局,传统超级App可能面临边缘化风险 [3] 字节技术产品进展 - 豆包1.6系列包含三个版本,其中thinking模型在GPQA测评集达81.5分,达到国际第一梯队水平 [8][9] - 视频生成模型Seedance 1.0 pro价格低至3.67元/5秒视频,性能登顶全球榜单 [10] - 实时语音模型全量开放,AI云原生服务新增MCP、PromptPilot等工具链 [10][11] 云计算市场竞争格局 - 火山引擎在大模型调用量市场占比46.4%,但整体云计算市场尚未进入第一梯队 [4] - 公司通过价格战策略将大模型成本降至"厘时代",日均tokens调用量达16.4万亿 [13][14] - 2024年火山引擎收入增速三位数,目标规模超百亿并实现翻倍 [16] 行业生态与挑战 - 公司发起V-START加速器计划,扶持AI初创企业弥补B端生态短板 [17] - Agent落地面临基础设施成本、多平台验证等瓶颈 [17] - 竞争对手包括阿里/腾讯等全栈布局大厂及智谱AI等创新公司 [18]
Anthropic 详述如何构建多智能体研究系统:最适合 3 类场景
投资实习所· 2025-06-16 19:51
多智能体系统核心观点 - 多智能体系统最适合三类场景:高价值并行任务、超出单上下文窗口的信息处理、需要操作多个复杂工具的情况 [1][5] - 多智能体系统通过并行工作实现高效信息压缩,子智能体同步探索问题不同侧面后浓缩关键信息传递给主智能体 [3] - 内部测试显示多智能体系统在广度优先查询中表现突出,Claude Opus 4为主智能体的系统比单智能体版本性能提升90.2% [4] - 多智能体系统通过合理分配计算资源解决问题,token用量单独解释80%的性能差异 [4] - 实际运行中多智能体系统消耗token量是普通聊天的15倍,需匹配任务价值与性能提升 [5] 多智能体系统优势 - 研究工作具有不可预测性,AI Agent能根据进展灵活调整方向,传统线性处理无法胜任 [3] - 信息检索的核心在于从海量数据中提炼洞察,子智能体通过并行工作实现高效压缩 [3] - 当智能水平达到阈值后,多智能体系统成为扩展能力的必由之路,智能体群体能实现远超个体的成就 [3] - 最新Claude模型显著提升token使用效率,Claude Sonnet 4的性能增益超过在Claude Sonnet 3.7上双倍token预算的效果 [4] 研究架构设计 - 系统采用协调器-工作者模式,首席智能体协调流程并委托给并行操作的专门子智能体 [6] - 与传统RAG静态检索不同,采用多步骤动态搜索:持续发现信息、适应新发现、分析结果形成高质量答案 [8] - 主智能体规划方法后将方案存入Memory,创建承担具体研究任务的子智能体独立执行网络搜索 [11] - 主智能体综合结果决定是否深化研究,必要时创建新子智能体或调整策略 [11] - 信息收集完成后传递给CitationAgent处理文档和研究报告,确保每个主张都有准确引用来源 [11] 工程挑战与解决方案 - 早期智能体常出现创建过多子智能体、无止境搜索、过度更新互相干扰等问题 [13] - 提示策略聚焦启发式规则而非僵化条款,编码专家工作模式到提示中并设置防护栏防止失控 [13] - 构建能够从错误位置恢复的系统,利用模型智能优雅处理问题 [16] - 添加完整的生产跟踪功能诊断智能体失败原因,监控决策模式和交互结构保护用户隐私 [19] - 采用彩虹部署逐步将流量从旧版本转移到新版本,避免中断正在运行的智能体 [19] 性能优化策略 - 主智能体并行启动3-5个子智能体,子智能体并行使用3个或以上工具,将复杂查询研究时间缩短高达90% [17] - 教会协调者如何授权,明确具体目标、输出格式、工具指南和任务边界避免重复工作 [17] - 根据查询复杂度调整工作量,将工作量分级规则嵌入提示词 [17] - 工具设计和选择至关重要,为智能体提供明确启发式方法匹配工具使用与用户意图 [17] - 先广后深策略:鼓励智能体先从简短宽泛查询开始,评估可用内容后逐步缩小范围 [17] 评估方法 - 传统评估假设系统遵循固定路径,多智能体可能通过不同有效路径达成目标 [14] - 需要灵活评估方法判断结果正确性及过程合理性,而非检查是否遵循预先规定步骤 [14] - 采用LLM评估器按标准打分(事实准确性、引用准确性等),与人类判断最一致 [18] - 人工评估补缺发现自动化评估遗漏的边缘情况,如非常规查询的幻觉答案等 [18] - 对修改持久状态的智能体进行最终状态评估而非逐轮分析 [22] 应用场景与价值 - 前五类用途包括:跨专业领域开发软件系统(10%)、专业技术内容开发优化(8%)、业务增长与营收战略制定(8%)等 [21] - 用户反馈帮助找到未曾考虑的商业机会,解决复杂医疗保健方案,节省数天工作时间 [20] - 通过精心工程设计、全面测试、注重细节的提示和工具设计实现大规模可靠运行 [20]
我收到俩BP,一份是Manus(另一份也是)
虎嗅APP· 2025-06-16 18:30
公司概况 - Manus是一家中国AI Agent初创企业,自3月初上线以来因处理复杂任务的惊艳表现成为继DeepSeek之后最热门的AI公司[1] - 公司已完成由Benchmark领投的7500万美元融资(约5.4亿人民币),估值达5亿美元(约36亿人民币)[1] - 近期传闻接近完成数亿元人民币融资,由某地国资领投,投前估值37亿人民币,但公司高层否认此消息[2] 产品与技术 - Manus采用多代理架构模拟人类工作流(Plan-Do-Check-Act),成本为同类产品的十分之一[6] - 产品定位为"手脑并用",名称源自MIT校训Mens et Manus,核心价值在于实现从"我告诉AI做什么"到"AI能够自己完成任务"的转变[6] - 在GAIA基准测试中性能超越OpenAI同类产品,依赖动态调用GPT-4、Claude等国际大模型并整合开源工具链[7] - 6月初推出文本转视频生成功能,进入由OpenAI、阿里和腾讯等巨头参与的新兴市场[3] 市场定位与竞争 - AI Agent市场预计2035年达到2168亿美元,2024-2035年CAGR为40.15%[5] - 公司认为目前处于AI Agent的L3初级阶段(有条件的完全自动驾驶),领先于行业普遍所处的L2阶段[6] - 面向海外市场强调与巨头的差异化定位,面向国内市场则打造全球唯一形象[10] - 谷歌工程师常驻Manus团队协助与Gemini模型融合,微软CEO纳德拉已与团队面对面交流并推进合作[11] 商业模式与发展 - AI Agent将通过三层重构颠覆企业服务:交互层、逻辑层和价值层,预计到2027年40%的企业服务将由AI Agent组合交付[5] - 商业模式继承APP的规模化分发能力,通过大模型实现服务动态进化、收益与价值实时匹配等三大突破[6] - 传闻公司ARR已接近1亿美元,达到SaaS公司规模化运营标志性收入水平[17] - 计划今年开源部分模型,特别是推理(postering)部分,推动AI应用落地[15] 行业观点 - AI Agent市场处于早期阶段,大模型已完成搭台任务,为AI Agent能力进阶提供基础[5] - 随着AI应用标志性案例出现,"套壳"在AI界逐渐变成"褒义词",关键在于商业化能力和产品体验[8] - 创始人叙事能力被视为关键竞争优势,Benchmark合伙人强调构建企业叙事能力的重要性[16] - AI Agent正改变人机交互模式,从需要人类作为中介转向AI智能体直接执行任务[5]
在中国做AI难,做AI Agent容易
混沌学园· 2025-06-16 18:15
AI Agent 的核心价值与架构 - AI Agent 从被动工具升级为能自主理解目标、规划步骤、调用工具并完成任务的智能体,实现从"数字助理"到"数字员工"的进化 [8][10] - 典型架构包含四大模块:感知模块(通过API/传感器接收信息)、决策模块(基于知识库规划行动)、行动模块(调用API执行任务)、学习与记忆模块(优化知识库形成长期记忆) [12][13][14][15] AI Agent 的商业逻辑 - 商业价值从"信息服务"(如ChatGPT)跃迁至"流程自动化",核心能力是打通数字系统隔阂,完成实际工作流 [16][17] - 商业模式更接近RaaS(结果即服务),直接交付降本增效的成果,与企业核心利益挂钩 [18][19] 中国AI产业的差异化优势 - 基础大模型研发面临三大挑战:训练成本高达数十亿至百亿人民币、核心技术/人才差距、高端芯片供应链风险 [21][22] - AI Agent领域具备独特优势:海量复杂应用场景(如电商/工业数字化)、应用驱动创新的技术路径(快速微调开源模型)、完善数字基础设施(支付/物流/API生态)、政策支持"人工智能+"行动 [24][25][26][27] 中国AI Agent市场格局 - 互联网巨头(阿里/腾讯/百度/字节)将Agent作为串联生态的"神经网络",例如阿里"通义千问"整合电商/金融/物流业务 [27] - 垂直领域创新企业分三类:深入实体(如中科视语的交通解决方案)、深耕行业(如卓世科技的医疗AI家庭医生)、平台赋能(如斑头雁的低代码开发平台) [29][30] 行业发展趋势 - 中国AI Agent产业走务实路径,基础层研发挑战与应用层机遇并存,建议资源投向应用领域优化业务流程 [31] - 赛道呈现百花齐放态势,互联网巨头与垂直创新企业共同推动场景落地 [27][28]
我收到俩BP,一份是Manus(另一份也是)
投中网· 2025-06-16 16:57
公司估值与融资 - 公司4月完成7500万美元融资,估值达5亿美元(约36亿人民币),由Benchmark领投[1] - 近期接近完成新一轮人民币融资,由某地国资领投,金额达数亿元,投前估值37亿人民币[1] - 公司半年内估值翻5倍,成为继DeepSeek之后最热门的中国人工智能初创企业[1] 产品与技术 - 公司产品能处理复杂任务,推出文本转视频生成功能,进入由OpenAI、阿里和腾讯等巨头参与的新兴市场[3] - 产品采用多代理架构模拟人类工作流(Plan-Do-Check-Act),成本为同类产品的十分之一[7] - 产品在GAIA基准测试中性能超越OpenAI同类产品,依赖动态调用GPT-4、Claude等国际大模型[7] - 产品核心功能可在3小时内通过开源技术复刻,被评价为工程能力的胜利而非科学突破[9] 市场与行业 - AI Agent市场预计2035年达到2168亿美金,对应24-35年CAGR为40.15%[5] - AI Agent正通过三层重构颠覆企业服务,预计到2027年40%的企业服务将由AI Agent组合交付[6] - 公司认为大模型已完成搭台任务,为AI Agent能力进阶提供了有力基础[5] - 公司定位为通用模型,未来可能整合市面上多种Agent、Compute use能力[17] 商业模式与商业化 - AI Agent继承APP的规模化分发能力,通过大模型实现服务动态进化、收益与价值实时匹配等突破[6] - 公司ARR已接近1亿美元,标志着进入规模化运营阶段[19] - 公司面临从"单一爆款"进化为"生态型平台"的更大命题[19] 公司战略与定位 - 公司在海外立差异化定位人设,在国内打造全球唯一形象[11] - 公司六大核心能力包括自主操作能力、任务规划与执行、多源信息整合等[13] - 公司更擅长持续优化叙事,吸引投资人关注创始人的叙事能力和智识真诚[18] 产品发展历程 - 公司3月初仅限邀请用户上线,早期邀请码稀缺,二手平台价格炒至5-10万元[3] - 目前已开放公众注册,但中文版本仍在开发中[3] - 公司成立仅三年,推出产品仅三个月,但已获得市场高度关注[17]
【公告全知道】谷子经济+算力+军工+多模态AI+国产芯片!这家公司设立合资企业主要生产军工消音材料
财联社· 2025-06-15 21:59
公司动态 - 公司与上海博物馆等IP合作开发系列文创产品 设立合资企业主要生产军工消音材料 涉及谷子经济 算力 军工 多模态AI 国产芯片领域 [1] - 公司产品已集成抗量子密码算法和量子随机数芯片 涉及军工 量子科技 云计算 数字货币 区块链 AI智能体 芯片 华为鸿蒙领域 [1] - 公司豪掷近60亿元押注光通信赛道 涉及机器人 新能源汽车 光模块领域 [1] 行业热点 - 军工行业与消音材料 量子科技 云计算 数字货币 区块链等技术结合 呈现多元化发展趋势 [1] - 光通信赛道获近60亿元投资 显示行业在机器人 新能源汽车等领域的应用潜力 [1] - 文创产品开发与博物馆IP合作 体现谷子经济与科技融合的新模式 [1]
AI投研应用系列之二:从大模型到智能体,扣子Coze在金融投研中的应用
太平洋证券· 2025-06-15 14:51
根据研报内容,总结如下: 量化模型与构建方式 1. 模型名称:报告解读智能体;模型构建思路:利用Coze平台构建能够自动解读金融报告的智能体,通过插件获取报告内容并调用大模型进行分析[28];模型具体构建过程:在智能体编辑页面输入描述语句生成提示词,新建工作流编辑任务流程,使用文件读取插件提取文档内容及公式结构,配置大语言模型节点定义输出逻辑与格式规范[28][30];模型评价:能够准确解读报告内容并呈现重要公式,提升报告分析效率[31] 2. 模型名称:财务数据分析智能体;模型构建思路:构建能够从网页或插件获取财务数据并用大模型进行分析的智能体[35];模型具体构建过程:通过代码处理节点拼接网页URL,信息爬取节点实时获取财报数据,输入DeepSeek大模型节点进行综合分析[38],或通过新浪财经插件获取数据后输入大模型分析[45][47];模型评价:能够从多个维度生成财务分析和投资建议[39][48] 3. 模型名称:研报总结智能体;模型构建思路:构建能够爬取多篇策略研报并用大模型进行分析总结的智能体[52];模型具体构建过程:使用插件爬取html代码,循环节点处理多条内容,大模型节点提取相关内容并写入飞书多维表格[52][55],添加代码节点将JSON字符串转换为JavaScript对象[69];模型评价:实现用自然语言从html代码中提取内容,节省编写代码的工作[69] 量化因子与构建方式 1. 因子名称:财务分析因子;因子构建思路:从财务数据中提取关键指标作为因子[35];因子具体构建过程:通过爬取或插件获取归母净利润、营业总收入、营业成本、净利润、扣非净利润、股东权益合计、商誉、经营现金流量净额、基本每股收益、每股净资产、每股现金流、净资产收益率、总资产报酬率、毛利率等指标[36] 2. 因子名称:研报分析因子;因子构建思路:从策略研报中提取关键信息作为因子[52];因子具体构建过程:通过爬取获取报告标题、内容、机构名称和链接等信息[55],用大模型提取相关内容并分析总结[52] 模型的回测效果 1. 报告解读智能体,能够准确解读量化领域英文文献并呈现重要公式[31] 2. 财务数据分析智能体,能够从盈利能力、偿债能力、运营能力等维度生成分析[39][48] 3. 研报总结智能体,能够从多篇策略研报中提取关键信息并生成总结[52][60] 因子的回测效果 1. 财务分析因子,包含14个关键财务指标[36] 2. 研报分析因子,包含标题、内容、机构名称和链接等关键信息[55]
当AI来填报高考志愿 ,你听谁的?
上海证券报· 2025-06-14 18:56
通用大模型精调技术 - 阿里夸克基于通义千问发布国内首个高考志愿填报专用大模型,通过"精调"解决严肃场景下的AI幻觉问题[1][3] - 模型采用"高维约束+智能推理+人机协作"决策系统,邀请数百位专家参与监督机制构建[3][4] - 团队蒸馏数万条专家决策数据形成推理链,在最终结果环节增加历史数据校对确保信息真实性[4] 垂类模型训练要素 - 搭建覆盖全国2900多所高校、1600个本科专业的实时更新知识库,所有推理数据需交叉验证[3] - 针对用户认知局限设置12个信息采集点和隐形逻辑条件,调试模型与专家判断的逻辑一致性[4] - 算力投入提升至此前100倍以应对用户高峰,显著增加训练成本[4] Agent产品商业化进展 - 夸克去年服务3000万考生及家长,50%用户来自三线以下城市,今年升级为专家级建议的Agent形式[6] - 行业进入Agent元年,字节跳动推出"扣子空间",百度发布心响App,昆仑万维上线天工超级智能体[7] - 全球AI Agent市场规模预计从2024年51亿美元增至2030年471亿美元,年复合增长率44.8%[7] 行业竞争格局 - 大模型技术红利窗口期缩短,厂商需在几天内跟进OpenAI等巨头的新模型[6] - 天风证券认为Agent赛道更考验产品力而非基础模型的工程能力[7] - 阿里开源WebAgent,字节、百度等厂商加速本土化场景布局[7]