Workflow
AGI
icon
搜索文档
AIAgent深度(二):2025Agent元年,AI从L2向L3发展
东吴证券· 2025-05-04 23:05
核心观点 - 2025年是Agent元年,AI正从L2向L3进化,由技术成熟、标杆产品出现、MCP协议普及和市场需求驱动 [2] - Agent重要性在于深度自动化、通往AGI和重塑互联网入口,预计2025年下半年开启入口级通用Agent竞争 [2] - Agent竞争格局是“巨头环伺,新锐突破”,大厂主导通用Agent,垂直领域有创新机会但面临通用Agent威胁 [2] - 投资建议是重视2025年Agent投资窗口,长期配置平台巨头,关注垂直领域领跑者 [2] 为什么说2025年是Agent元年 AI从L2向L3进化 - AI从L2(推理者)向L3(Agent)进化,代表从“思考”走向“行动” [6] - L1是聊天机器人,L2是推理者,L3是智能体,具备记忆、规划、工具使用和行为记忆四大核心能力 [6][7] 驱动力 - 技术成熟度达到临界点,强大的多模态基础模型和成熟的强化学习训练方法已就绪 [2][9] - 行业领导者推动,标杆产品验证,如OpenAI、Google等发布关键产品,RE - Bench测试显示顶尖Agent在特定任务上效率匹敌人类专家 [2][18][20] - MCP协议普及,解决Agent与外部世界交互的碎片化和高成本问题,促进互联互通 [2][22] - 市场需求驱动,2023年是“模型竞赛年”,2024年是“应用探索年”,2025年市场需要AI落地解决复杂业务问题,Agent契合需求 [2][39][40] 定义 - 同时具备对话、推理、长记忆和工具调用四项能力才能称之为Agent,工具调用是核心区分要素 [43] - Agent智能程度有层次和梯度,关于Agent定义存在诸多问题待明确 [46] Agent为何重要 深度自动化 - Agent能理解模糊指令,自主规划并执行复杂认知型任务,打通端到端工作流,实现认知自动化 [49] - 带来指数级效率提升,形成人机协作新范式,让人类聚焦高价值活动,赋能创新 [53] - 解放人类生产力与创造力,将人类从重复性劳动中解放出来 [55] 通往AGI和具身智能 - Agent是通往AGI和具身智能的关键环节,从L3到L4存在鸿沟,目前“只读”型Agent有PMF,未来向“读写”型进化 [56][57][59] 重塑互联网流量入口格局 - 对传统搜索引擎形成挑战,改变信息获取方式,将搜索升级为“完成任务” [62][65] - 部分APP被“管道化”,功能单一的服务型App入口价值下降,复杂或体验型App仍是入口 [67] - Agent本身成为入口,可能是APP、浏览器或OS操作系统,预计2025年下半年围绕“通用入口级Agent”的大战将开启 [69][70] 竞争格局 竞争维度 - 围绕平台与应用、通用与垂直、成本与效率、交互范式、数据与护城河、人才竞争六个维度展开 [75][76] 模型即产品 - AI应用核心价值在于模型能力,爆款应用背后是模型能力更新,API经济可能走向终结 [77][78][79] - “浅层套壳产品”缺乏可持续竞争壁垒,终将被颠覆,真正的壁垒来自复杂工作流编排、工具集成能力和深度领域知识 [86][88] 通用Agent与垂直Agent - 通用Agent由大厂主导,大厂在基础大模型、平台与生态、应用集成方面布局 [92][95] - 垂直Agent短期内凭借深度领域知识和定制化能力有优势,但长期面临通用Agent泛化能力的威胁 [113][114] Agent将最先落地于知识工作 最先落地的行业和场景 - Agent最先落地于知识工作领域,尤其是代码/软件开发领域,已有成功案例,如Cursor、Devin [2][4] 代码/软件开发领域进展 - 代码领域进展较快,Cursor成长曲线陡峭,ARR和估值大幅增长 [115] 法律AI Agent对比 - 文档未提及相关内容 投资建议 - 重视2025年Agent投资窗口,跟踪基础模型、强化学习、工具调用等进展 [2] - 长期配置平台巨头,如海外的Google、微软,国内的阿里、腾讯、字节等 [2] - 关注垂直领域领跑者,如编程、研究、法律等领域,总结了30家上市公司在垂类Agent方面的布局 [2]
梁文锋和杨植麟再“撞车”
虎嗅APP· 2025-05-04 16:29
大模型技术进展 - DeepSeek推出数学定理证明专用模型DeepSeek-Prover-V2,参数规模达6710亿,较前代V1.5的70亿增长近百倍,miniF2F测试通过率88.9%,解决普特南测试49道题 [2] - 月之暗面同期发布形式化定理证明模型Kimina-Prover,开源1.5B和7B参数版本,miniF2F通过率80.7%,普特南测试成绩10道题,性能逊于DeepSeek-Prover-V2 [2] - 两家公司技术均采用强化学习方法,DeepSeek侧重子目标分解,月之暗面聚焦形式推理 [3] 公司竞争动态 - DeepSeek面临阿里巴巴开源模型追赶,市场期待其发布R2或V4模型巩固优势 [4] - 月之暗面Kimi受字节跳动豆包和腾讯元宝挑战,豆包月活5600万领先Kimi的2000万(2024年11月数据),2025年2月DeepSeek以1.94亿月活反超豆包1.16亿 [12] - 腾讯元宝通过微信引流和14亿元投流费用(一季度数据),月活达4200万超越Kimi [13] 技术路径与产品矩阵 - DeepSeek押注数学/代码、多模态、自然语言三大AGI路径,数学与代码被视为封闭可验证的智能试验场 [7] - DeepSeek模型矩阵同步进化:Prover系列2024年3月首发,2025年4月升级至V2;代码模型Coder迭代至V3-0324;通用推理模型R1性能比肩OpenAI o1 [8] - Prover-V2基于DeepSeek-V3微调,采用子目标分解与思维链合成技术 [9] 行业格局与挑战 - 阿里巴巴发布通义千问Qwen3,参数量为DeepSeek-R1的1/3但性能全面超越,开源模型全球下载量超3亿次 [14] - 百度推出文心4.5 Turbo和X1 Turbo,批评DeepSeek存在多模态缺失、幻觉率高、响应慢及成本高问题,但计划6月跟进开源策略 [15][16] - 行业观点认为中国需多个领先大模型而非单一明星公司,鼓励竞争推动技术发展 [14]
微软CEO和奥特曼失了和,OpenAI被“断粮”
猿大侠· 2025-05-03 12:16
就在这两天,《华尔街日报》放出猛料: 奥特曼和纳德拉,这对昔日让两家公司合作共赢的big name, 在诸多事情上分歧日渐加大,渐行渐远 。 衡宇 量子位 | 公众号 QbitAI 就很突然。 许久没有同框的奥特曼和微软CEO纳德拉,刚刚在推特上"大秀恩爱",还透露正在讨论合作新进展。 这没由来的操作,难道是有新发布? 但仔细一扒,或许更可能是回应新八卦。 奥特曼是谁?OpenAI的掌舵者;纳德拉是谁?微软的现任话事人。 在大多数人模糊的概念里,OpenAI是掀起这一波大模型浪潮的弄潮儿,而微软是其背后的支持者。 在ChatGPT出现之前,微软就为当时还略显透明的OpenAI注入巨额资金,支持其在AI领域的研究。后来又不断加码,给钱,给云服务器…… 但本月月初,微软暂停了美国俄亥俄州中部10亿美元投资计划的三个数据中心园区建设。不只是这一个, 微软正在"放缓或暂停"部分AI数据 中心项目 ,这么看来,OpenAI的算力助力或将因此惨遭骤减。 如今《华尔街日报》一记重锤,直接「揭发」:两人之间还是逐渐生出嫌隙。 ——更准确地说,是 OpenAI和微软的关系日益变得微妙,甚至紧张起来。 奥特曼和纳德拉,离心离德 ...
微软CEO和奥特曼失了和,OpenAI被“断粮”
量子位· 2025-05-02 12:36
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 就很突然。 许久没有同框的奥特曼和微软CEO纳德拉,刚刚在推特上"大秀恩爱",还透露正在讨论合作新进展。 这没由来的操作,难道是有新发布? 在大多数人模糊的概念里,OpenAI是掀起这一波大模型浪潮的弄潮儿,而微软是其背后的支持者。 在ChatGPT出现之前,微软就为当时还略显透明的OpenAI注入巨额资金,支持其在AI领域的研究。后来又不断加码,给钱,给云服务器…… 但本月月初,微软暂停了美国俄亥俄州中部10亿美元投资计划的三个数据中心园区建设。不只是这一个, 微软正在"放缓或暂停"部分AI数据 中心项目 ,这么看来,OpenAI的算力助力或将因此惨遭骤减。 如今《华尔街日报》一记重锤,直接「揭发」:两人之间还是逐渐生出嫌隙。 ——更准确地说,是 OpenAI和微软的关系日益变得微妙,甚至紧张起来。 奥特曼和纳德拉,离心离德 但仔细一扒,或许更可能是回应新八卦。 就在这两天,《华尔街日报》放出猛料: 奥特曼和纳德拉,这对昔日让两家公司合作共赢的big name, 在诸多事情上分歧日渐加大,渐行渐远 。 奥特曼是谁?OpenAI的掌舵者;纳德拉是谁?微软的 ...
“DeepSeek只打开一扇窗,大模型远没到终局”
投中网· 2025-05-02 11:25
将投中网设为"星标⭐",第一时间收获最新推送 只要创业者和投资人相信AGI的未来,行业就一定能做出来。 整理丨 杨博宇 来源丨 投中网 DeepSeek如何改变中国AI投资?具身智能距离清晰商业化还要多久?关于人工智能与人形机器人的 热门话题,吸引了众多资深投资人热烈讨论。 在 "第19届中国投资年会·年度峰会"上,投中网主编曹玮钰、红杉中国合伙人公元、云启资本合伙 人陈昱举行了一场别开生面的对谈,就当下AI与具身智能两大赛道进行了分享。 在陈昱看来,DeepSeek打破了美国AI叙事,对投资也有很多益处,美国投资人会对华人科技创业者 高看一眼。而具身智能将给十年后的世界显著的改变。他举了一个例子,随着平均年龄越来越渐长, 劳动力短缺,人们希望具身能够帮助我们养老,这就是社会对于具身智能最简单的诉求之一。 公元则从商业化的角度分析,今天的创业模式与互联网时代很大的不同在于,明确的商业化路线的重 要性已经让位于技术的颠覆创新。因为一个新模型能力的突破,用户可以瞬间转移。AI时代已经不再 像互联网时代,DAU和MAU这些指标和数据对企业而言有那么明显的领先优势。 "DeepSeek只打开一扇窗,六小龙远没到终局" ...
民营经济促进法获通过,一季度理财规模缩水 | 财经日日评
吴晓波频道· 2025-05-01 03:21
民营经济促进法 - 十四届全国人大常委会第十五次会议表决通过民营经济促进法 自2025年5月20日起施行 共9章78条 包括公平竞争 投资融资促进 科技创新等章节 [2] - 作为我国第一部专门关于民营经济发展的基础性法律 将进一步优化民营经济发展环境 保证各类经济组织公平参与市场竞争 [2] - 法律需要给予民营企业被保护的安全感 同时重视民企的实际经营需求 内容需随发展调整完善 [2] 制造业PMI数据 - 4月份制造业PMI为49% 比上月下降1.5% 非制造业商务活动指数为50.4% 比上月下降0.4% [3] - 构成制造业PMI的5个分类指数中 仅供应商配送时间指数高于临界点 高技术制造业PMI为51.5% [3] - 4月外贸摩擦影响显现 出口需求回落成为拖累PMI最大因素 内需修复对冲效果有限 [4][5] 贵州茅台业绩 - 一季度实现营业总收入514.43亿元 同比增长10.67% 归母净利润268.47亿元 同比增长11.56% [6] - 酱香系列酒营收70.22亿元 同比增长18.30% 海外市场营收11.19亿元 同比增长37.53% [6] - 3月末现金及现金等价物余额1765.48亿元 较年初增长3.87% [6] 腾讯AI布局 - 重构混元大模型研发体系 成立大语言模型部和多模态模型部 分别负责不同技术方向 [8] - 加强数据平台部和机器学习平台部建设 为AI模型训练提供全面高效的PaaS平台底座 [8] - 调整后研发体系以技术驱动 资源集中使用 提升训练效率 [8][9] 亚马逊关税争议 - 考虑在Haul平台显示关税附加费 直接向消费者展示特朗普关税政策影响 [10] - 该计划遭到特朗普政府猛烈抨击 亚马逊表示从未获得批准实施 [10] - 关税政策使美国企业面临两难境遇 政府施压加剧企业和消费者困境 [11] 外资券商发展 - 瑞银证券变更为外国法人独资 成为第五家外资全资控股券商 [12] - 瑞银集团持股比例由67%增至100% 多家外资券商加速布局中国市场 [12] - 金融对外开放步伐稳健 外资参与度提升有助于国内产业转型升级 [12][13] 理财市场动态 - 一季度末理财产品存续规模29.14万亿元 较2024年末减少约8100亿元 [14] - 4月第三周理财规模较前一周上升约3200亿元 呈现恢复态势 [14] - 一季度债市波动拖累理财产品收益 开放式固收类产品近1个月年化收益率平均2.24% [14] 股市行情 - 4月30日沪深两市成交额1.17万亿 较上个交易日放量1472亿 [16] - 全市场超3400只个股上涨 机器人 算力 华为概念股表现活跃 [16] - 银行板块调整 电力 钢铁 港口等板块跌幅居前 [16][17]
AI中厂夹缝求生
36氪· 2025-04-30 15:37
文章核心观点 昆仑万维在AI领域布局多年,2024年财报首次披露AI产品商业成果,但公司仍面临盈利挑战,不过其表示为抓住AI机遇会坚定投入,预计2027年AI大模型业务实现盈利 [1][16][17] 分组1:AI商业成果 - 公司AGI与AIGC业务商业化取得重要进展,AI社交单月最高收入突破100万美元,AI音乐年化流水收入ARR达约1200万美金(截至2025年3月底) [1] - 天工AI峰值月活跃用户突破1000万,app月活数据522万,全球排名64 [4] 分组2:AI产品布局 - 模型层覆盖语言、多模态、3D、视频、音乐等大模型,音乐大模型技术指标最好 [3] - 应用层在AI助手、AI游戏、AI短剧、AI音乐等方面全面开花,如天工AI智能助手功能不断升级,推出AI音乐平台和AI短剧创作平台 [3][4][5] 分组3:商业策略与思路 - 公司用AI重构传统业务,驱动信息分发与元宇宙平台Opera创新,提升用户体验 [8] - 为完成商业闭环,考虑通过模型优化压低推理成本、搭建AI UGC平台、发展AI终端三种路径 [10] - 采用模型+产品思路,通过调动更小参数实现高效运行,降低成本并提高灵活性和可扩展性 [9][10] 分组4:市场竞争地位 - 不属于大厂、创业公司、颠覆者三类,在模型市场迭代更新,打法更长远 [9] - 音乐生成大模型Mureka在测试中击败Suno,达到SOTA水平,但人声生成有瑕疵 [12][15] 分组5:财务状况与前景 - 2024年净利润(扣非)从2023年的6.6亿元下滑到亏损16亿,2025年一季度亏损7.7亿元,同比下滑298%,经营活动净现金流首次为负 [16] - 称亏损是主动性战略投入,预计2027年AI大模型业务实现盈利 [16][17]
实现商业化落地,人形机器人的核心点是上肢还是下肢?
Robot猎场备忘录· 2025-04-30 15:14
温馨提示 : 点击下方图片,查看运营团队2025年最新原创报告(共210页) 说明: 欢迎约稿、刊例合作、行业人士交流 , 行业交流记得先加入 "机器人头条"知识星球 ,后添加( 微信号:lietou100w ) 微信; 若有侵权、改稿请联系编辑运营(微信:li_sir_2020); 人形机器人要实现真正商业化落地是上肢重要还是下肢重要? 人形机器人真正落地实用场景,任务终结点是手臂和手,而小编注意到涉及手臂相关研究极少,是工业机械臂发 展多年,导致人形机器人机械臂结构和相关算法控制已完全成熟,只需要专注于"小脑"上层层面控制?但是参加 展会时,可明显看到人形机器人手臂运动过程中颤颤巍巍、卡顿、僵硬的现状,所 以这是"小脑"层面控制问题, 还是关节间问题? 目前业内对于灵巧手研究已经很多且备受重视,除了人形机器人本体厂商自研外,也出现了专注于灵巧手和触觉 感知研究的初创公司,也是目前人形机器人发展过程中核心卡点之一。 正文: 具身智能机器人是一个复杂的AI+机器人+自动驾驶的系统性学术+工程问题,远期AGI的物理世界载体,受算力、 软件算法、数据、硬件、工程化等多面因素影响;小编往 期文章 : 【原创】人形机 ...
通义千问 Qwen3 发布,对话阿里周靖人
晚点LatePost· 2025-04-29 16:43
文章核心观点 - 阿里云CTO周靖人认为大模型发展已进入早期阶段中期,需在多模态、工具使用、Agent支持和持续学习等多方向布局[5][14] - 通义千问Qwen3作为全球首个开源混合推理模型,通过融合推理和非推理模式实现性能与成本平衡,代表技术新趋势[6][15] - 阿里开源战略成效显著:Qwen系列下载量达3亿次,衍生模型超10万个,超越Meta Llama成为全球最活跃开源模型[7][8][18] - 公司坚持技术规律导向的研发节奏,强调长期创新而非短期竞争,认为AGI发展需要云计算体系与大模型的深度协同[12][13][21] 技术突破 - Qwen3-235B-A22B以2350亿总参数在多项基准测试超越6710亿参数的DeepSeek-R1,小尺寸MoE模型Qwen3-30B-A3B激活参数仅30亿但性能更优[7] - 混合推理模型创新性实现"思考预算"设置,开发者可自定义深度思考的token消耗量以平衡成本效益[15] - 模型支持vLLM/SGLang推理框架和MCP协议,配合Qwen-Agent框架可快速开发智能体[18] - 多模态技术积累始于2019年,2021年已发布万亿参数MoE多模态模型M6,当前视频生成模型万相2.1与Sora互有胜负[17][26] 开源生态 - 开源决策基于两大判断:模型作为核心生产元素需通过开源普及,开源已成为大模型重要创新驱动力[18] - 魔搭社区累计开源超200个模型,Qwen系列占Hugging Face下载量30%以上,衍生模型数量持续领先Llama系列[7][8][18] - 版本策略覆盖全场景需求:0.6B-32B稠密模型满足端侧到企业部署,MoE模型提供高性价比选择[18] - 开发者服务导向体现在消费级显卡适配、及时支持主流框架等举措,形成技术生态正循环[18] 研发体系 - 采用pipeline式研发管理,预研方向通过小规模实验验证后阶梯式投入,保持多技术方向并行探索[24] - 实验平台支持快速迭代,避免直接超大规模投入,强调科学评估和数据驱动的决策机制[25] - 人才策略结合职级普调与使命驱动,通过系统性工程积累形成代际技术优势[25][26] - 研发投入聚焦三大方向:类人思考能力进化、多模态融合、云模型协同优化带来的效率突破[13][20] 行业竞争 - 认为当前模型竞争本质是系统工程较量,需云计算、数据平台和工程能力的全面配合[13][21] - 指出纯Infra优化无法替代完整云服务,强调阿里云在SLA保障、多模型兼容等方面的企业级优势[22] - 预判行业将面临供电瓶颈,提前布局智算中心选址的energy-aware优化[22][23] - 3800亿新基建投入应对AI应用指数增长,目前MaaS服务已现供不应求态势[22]
对话昆仑万维方汉:冲击AI巨头的野望和决心
经济观察网· 2025-04-28 16:56
公司战略与投入 - 公司董事长方汉认为AI将重塑内容行业,并全力投入AI研发,包括亲自阅读200篇论文、面试算法博士等[1][16] - 公司2024年投入8亿元购买算力芯片,研发费用增至15.4亿元,同比增长近60%[1] - 公司采用"Fast Fail"机制,快速试错并集中资源于有突破潜力的领域如AI音乐、AI短剧、AI社交等[5][6] - 公司设立2050研究院,聚集年轻研究员专注AGI研发,并坚持开源策略,已开放20多个大模型[16][18][19] 财务与业务表现 - 公司2024年营收56.6亿元,同比增长15.2%,毛利率达73.6%[4] - 2024年公司出现上市十年来的首次年度亏损[1] - AI业务年化收入达1.4亿美元,成为海外收入增速最快的中国AI企业[5] - AI音乐年化流水收入达1200万美元,短剧平台Dramawave年化流水收入达1.2亿美元[5] - AI社交单月最高收入突破100万美元[5] 产品与技术突破 - 音乐生成工具Mureka V1上线后,用户创作歌曲成本降至0.1-0.7元,企业成本不到0.05元[8] - Mureka O1模型击败美国Suno登顶全球第一,支持10种语言,用户遍布100多个国家[8] - 推出全球首个集成视频大模型与3D大模型的AI短剧创作平台SkyReels[9] - 开源模型Skywork R1V和Skywork-Reward分别达到同类型开源模型全球第一[19] - 开源视频模型SkyReels V1被下载3万余次,带动短剧订阅用户暴涨十几倍[19] 市场与行业判断 - 国际作者和作曲者协会联合会预计AI生成音乐市场将从30亿欧元增至2028年640亿欧元[8] - 公司认为全球80亿人口中1%的付费用户即可催生千亿级市场[9] - 公司选择相对冷门的AI音乐、AI短剧等娱乐赛道避开与大厂直接竞争[11] - 公司判断3-5年内线下劳动力无法被完全替代,但20年内AGI将渗透至每个行业[20] 竞争优势与执行策略 - 公司拥有200万首正版歌曲授权数据,音乐语料规模仅次于腾讯、字节和网易[13] - 通过早期海外市场布局积累本地化经验,如优化千元以下手机音质[13] - 决策灵活,从决定All in AI到执行仅用7天,资源调配迅速[13][14] - 偏好招聘应届博士而非大厂老将,认为其创新思维更强[16][17]