CodeBuddy
搜索文档
Claude每用户的年化贡献,是ChatGPT的30倍|AI产品榜
36氪· 2026-04-08 21:36
文章核心观点 - 2026年3月AI产品榜单显示,“龙虾”(AI Agent)类产品成为市场新热点,并显著带动了上游云厂商的流量增长 [2][16] - Claude在用户平均收入贡献上表现突出,其单用户年化营收贡献是ChatGPT的30倍,尽管用户规模远小于后者 [6][15] - 国内各大云厂商因提供“一键部署龙虾”服务,本月网站访问量全线大幅增长,其中百度智能云环比增长超过100% [18][19] 主要AI产品竞争格局 全球总榜头部产品 - **ChatGPT** 以59.2亿月访问量位居全球第一,环比增长7.08% [24][61] - **New Bing** 和 **Gemini** 分别以37.3亿和26.8亿月访问量位列第二、三名,环比增长13.61%和22.86% [24][61] - **Claude** 月访问量达6.26亿,环比增速高达111.39%,是前四名中增长最快的产品 [24][61] 国内总榜头部产品 - **DeepSeek** 以4.64亿月访问量位居国内第一,环比增长30.57% [29][62] - **纳米AI搜索** 和 **纳米AI** 分别以2.67亿和1.85亿月访问量位列国内第二、三名,环比增速分别为58.29%和56.95% [29][62] - **豆包** 月访问量1.61亿,环比增长62.51%,增速显著 [29][62] “龙虾”(AI Agent)品类分析 市场热度与厂商跟进 - **OpenClaw** 以2948万月访问量位居全球龙虾榜第一,环比增长9.17% [17][20][35] - 国内大厂全速跟进,**腾讯QClaw** 以214万月访问量成为国内最大龙虾产品,本月新上榜 [18][20][35] - 阿里、网易、猎豹等公司均推出了各自的龙虾产品,榜单前十名中多数为新上榜产品 [20][35] 对云服务的拉动效应 - 因云厂商提供“一键部署龙虾”服务,其网站流量在3月获得全线大幅增长 [18][19] - **百度智能云** 月访问量环比增长105.35%,增速最高 [19][21][59] - **火山引擎**、**腾讯云**、**阿里云** 月访问量分别环比增长81.03%、71.83%、60.97% [19][21][59] 重点公司动态与产品表现 腾讯 - 腾讯3月多项产品数据亮眼,其中 **CodeBuddy** 月访问量764万,环比暴涨719%,位居国内增速榜第二 [23][38] - **QClaw** 新上榜即成为国内增速榜第一 [23][38] - **腾讯云** 在AI云榜中月访问量2746万,环比增长71.83% [21][23][59] - **腾讯元宝** 月访问量2095万,环比增长34.39%,位居国内总榜第十 [23][29] 阿里巴巴 - 阿里旗下 **ACCIO**(AI智能采购)月访问量526万,环比增长104.22%,位居出海总榜第17、全球增速榜第七 [23][37] - **千问** 和 **Qwen.ai** 月访问量分别为4568万和3468万,环比增长38.22%和14.51% [29][43] - **copaw** 作为阿里龙虾产品,月访问量90.55万,新上榜 [20][35] 百度 - **百度AI搜索** 月访问量3626万,环比下降16.31%,位居国内总榜第七 [23][29] - **百度智能云** 月访问量231万,环比增长105.35%,增速在AI云榜中领先 [19][21][59] 各细分品类榜单亮点 高增长产品 - **全球增速榜** 前列产品增幅惊人:**腾讯QClaw**(新上榜)、**CodeBuddy**(+719%)、**hi waifu**(+157.31%)、**Luma AI**(+114.49%)[36][37][64] - **国内增速榜** 除龙虾和代码产品外,**沉浸式翻译**(+65.02%)、**豆包**(+62.51%)、**纳米AI搜索**(+58.29%)等增长迅速 [38] 搜索引擎品类 - **New Bing** 以37.3亿月访问量位居第一 [24][66] - **纳米AI搜索** 以2.67亿月访问量位居第二,且环比增速达58.29% [24][66] - **百度AI搜索** 月访问量环比下降16.31% [23][66] 聊天机器人品类 - **ChatGPT** 访问量绝对领先 [43][67] - **Claude** 和 **豆包** 环比增速突出,分别为111.39%和62.51% [43][67] 代码辅助品类 - **GitHub Copilot** 以3.83亿月访问量位居第一 [25][56][71] - **Stitch** 和 **CodeBuddy** 环比增速分别达104.58%和719.00%,增长迅猛 [37][56][71]
2026企业AI大考:别秀PPT,亮出你的「用虾」真功夫
36氪· 2026-04-07 18:37
文章核心观点 - 中国企业AI应用正从初期的“启蒙”和单点效率提升,向深度融入核心业务流进行“价值跃迁”,评价标准已从“有没有接入”转变为“是不是真有用”和“有没有重塑业务”[3] - 智能体(AI Agent)是实现这一跃迁的关键,其价值在于能自主理解任务、调用工具并完成业务闭环,而非简单的聊天机器人[3] - 36氪与腾讯云联合发起“2026企业‘用虾’十大标杆案例评选”,旨在寻找并表彰那些真正将智能体深度应用于工作流、解决实际业务与组织问题的企业[3][23] 评选活动概述 - 评选活动由36氪与腾讯云联合发起,主题为“2026企业‘用虾’十大标杆案例评选”[2] - 评选面向所有真正“用虾”的企业,无论其使用的是腾讯WorkBuddy、CodeBuddy、ClawPro、QClaw等产品,还是基于腾讯云Lighthouse、智能体开放平台(ADP)打造的专属方案[3] - 评选不看PPT,只看真实工作流,并提出了一个全新的务实评价标尺——“含虾量”[4] - 入选企业将获得品牌加持(36氪深度报道与全渠道传播)以及技术产品加持(腾讯云“龙虾”专属高阶权益包等)[15][16] “含虾量”评估框架 - “含虾量”用于具体衡量一家企业将AI应用到多深的程度,是否进入核心业务并带来可验证的商业回报,以及智能体在多大程度上成为企业的生产力基础设施[4] - 评估主要围绕四笔账进行[4] 第一笔账:看渗透 - 评估渗透率的关键不在于是否覆盖,而在于是否被高频使用,即AI是少数人的专属工具,还是已进入销售、市场、客服、财务、法务、研发等多个岗位,成为日常调用的基础设施[5] - 高“含虾量”的企业不仅用得广,更懂得通过Skills精准调用、向量检索等手段进行精细使用,使每次智能体交互都指向真实任务[5] 第二笔账:看深度 - AI应用不能仅停留在写摘要、润色邮件等边缘场景,而需进入业务腹地,触及核心利润区[7] - 例如,数字视听平台公司风行基于腾讯云能力打造了视听行业专属龙虾FunClaw,将脚本创作、分镜设计、图片生成、AI配音到商业分发串联成完整的AI驱动链,跑通了从创意到变现的全流程[7] - 在金融场景,机构AI投研服务平台“进门”联合腾讯云推出的“投研龙虾”,整合了50万+独家路演及投研数据,让研究员能用自然语言调取深度行业洞察[8] - 在此类深度应用中,AI不再是外挂工具,而是承担了原本属于高强度脑力劳动的核心KPI[9] 第三笔账:看组织 - 评估智能体是否推动了组织的质变,例如跨部门协同是否更顺畅,重复繁琐的流程环节是否因智能体加入而被压缩[11] - 关键区别在于AI是少数人的尝鲜,还是已成为全员落地的生产力基础设施[11] 第四笔账:看产出 - 所有技术最终需在商业账本上接受检验,需关注人效提升多少、交付周期缩短多久,以及是否有业务线因AI加入出现明确的收入增长或成本下降[12][13] - 评选旨在寻找真正把智能体用进业务并产生可量化商业回报的团队[13][14] 评选奖项与节奏 - 评选将最终产生主奖项“2026企业‘用虾’十大标杆案例”[15] - 针对不同维度的突出表现,还将颁发四个专项奖:年度含虾量大奖(用虾最广,渗透最深)、年度用虾变革大奖(因虾而变,组织焕新)、年度虾苗新锐大奖(“虾期”虽短,增势惊人)、年度行业虾王大奖(赛道称王,行业标杆)[18] - 评选节奏:即日起征集通道启动,36氪同步开启案例初筛与采写;6月正式揭晓十大标杆名单及其他重磅奖项,并发布年度白皮书[19]
腾讯云就WorkBuddy登录异常致歉、特朗普宣称"压倒性胜利"、新能源车企3月销量比亚迪登顶
新财富· 2026-04-02 19:35
地缘政治与大宗商品市场 - 美国总统宣布对伊朗取得"压倒性胜利",但表示未来两到三周将实施"极其严厉打击",引发市场剧烈波动 [2] - 市场反应呈现分化:黄金价格从日内高位暴跌逾100美元/盎司,白银下跌超过3%;WTI原油期货则大幅飙升5%至每桶104美元附近;美股及亚太主要股指期货普遍下跌 [2] - 中东最大铝生产商阿联酋环球铝业的塔维拉冶炼厂因遭袭后电力中断,导致电解槽产线"失控停机"并被迫停止运营,严重损坏可能需至少一年修复 [3] - 该铝厂停产事件可能使明年铝市场从供过于求转为约130万吨的供应缺口,公司已开始在市场上大量出售制铝原料氧化铝 [3] 科技与航天产业动态 - 亚马逊正洽谈收购卫星通信公司Globalstar,以加强其低地球轨道卫星业务布局,与SpaceX的星链竞争,消息提振Globalstar股价盘后一度飙升24% [4] - 亚马逊已发射约200颗卫星,目标构建7700颗卫星的网络,但进度落后于SpaceX;SpaceX星链已部署超过9500颗卫星,为超过900万用户提供服务,并贡献了SpaceX一半以上的收入 [4] - SpaceX据悉已秘密提交IPO注册文件,有望在6月上市,估值可能超过1.75万亿美元,将成为首个登场的超大型IPO [11] - 特斯拉CEO埃隆·马斯克对OpenAI股票在二级市场遇冷的报道评论称"毫不意外",报道称投资者正迅速转向其竞争对手Anthropic [12][13] 中国新能源汽车行业 - 多家新能源车企公布3月销量数据:比亚迪销量30.02万辆,理想汽车交付41053辆,蔚来交付35486辆(同比增长136%),零跑交付50029辆,小米汽车交付超2万辆 [6] - 中国汽车出口延续强劲增长,今年前两个月累计出口135.2万辆,同比增长48.4% [6] 中国国内航空与猪肉市场 - 自2026年4月5日起,国内航线燃油附加费将大幅上调,800公里(含)以下航段从10元涨至60元,800公里以上航段从20元涨至120元,涨幅高达5倍 [5] - 调价主因是中东地缘冲突导致国际油价飙升,航油采购成本大幅上涨,航司启动了燃油附加费与油价的联动机制 [5] - 国家有关部门将开展今年第二批中央冻猪肉储备收储,要求各地同步进行,以发挥市场调节作用,受此消息影响,生猪产业板块个股盘中普涨 [7] 科技公司产品与服务 - 阿里巴巴发布图像生成与编辑统一模型Wan2.7-Image,该模型支持虚拟捏脸、通过Hex色号精准控制色彩,并支持最高3K Token文本输入以实现印刷级输出 [14] - 在人类偏好盲测中,其文生图能力超过GPT-Image1.5,文本渲染接近Nano Banana Pro [14] - 腾讯云旗下WorkBuddy及CodeBuddy部分国内用户出现登录异常等问题,服务已于当日修复,腾讯云宣布向受影响用户补偿1000 Credits [10]
腾讯云:致歉并公布补偿方案
财联社· 2026-04-02 16:19
事件概述 - 2026年4月2日,腾讯云旗下产品WorkBuddy & CodeBuddy发生服务故障,部分国内用户于09:10出现登录异常 [1][4] - 技术团队紧急介入处理,相关问题于11:45开始逐步修复,服务随后全面恢复稳定 [4] - 公司通过官方渠道就此次故障给用户工作和计划带来的不便与困扰公开致歉 [3][4] 公司应对措施 - 腾讯云官方及公司公关总监张军均在微博平台发布声明,确认故障已全部恢复 [1][3] - 公司宣布将对所有受影响的国内用户进行补偿,标准为1000 Credits [1][3][4] - 补偿积分将自动充入用户账户,并计划在2个工作日内发放,用户需在4月30日24时前登录“用量管理”页面领取 [4] 产品与用户影响 - 此次故障涉及腾讯云旗下的WorkBuddy和CodeBuddy两款产品 [4] - 故障影响范围限定为部分国内用户,国际用户未在受影响声明之列 [4] - 公司团队在监测到问题后第一时间介入处理,体现了对服务稳定性的监控机制和应急响应流程 [4]
独家丨腾讯云成立云产品六部,王慧星担任负责人
雷峰网· 2026-04-01 18:00
腾讯云组织架构调整 - 腾讯云发布内部信,宣布成立云产品六部,负责构建AI原生的代码产品与泛生产力智能体,并推进其能力建设与商业化 [2] - 云产品六部负责人由腾讯副总裁、腾讯云CTO王慧星兼任,向CSIG总裁汤道生汇报 [2] - 云产品六部助理总经理由刘毅担任,向王慧星汇报 [2] 组织架构调整背景与进程 - 此前,腾讯云产研共有五大产品部,分别负责IaaS、PaaS、大数据、AI SaaS、中台业务、CDN及音视频等不同领域 [2] - 2025年6月,王慧星晋升为腾讯副总裁,分管云产品二部、四部、技术支持部等多个部门,并虚线分管云产品一部 [2] - 2025年3月22日,原由腾讯云副总裁吴运声负责的云产品三部部分业务,被报道将划给王慧星 [3] - 此次成立云产品六部,标志着这轮组织调整已进入实质推进阶段 [1][3] 业务聚焦与未来展望 - 新成立的云产品六部将专注于AI原生的代码产品与泛生产力智能体,具体产品包括CodeBuddy与WorkBuddy [2] - 王慧星接手后,腾讯云智能体产品的未来演进与能否再上一个台阶,是此轮调整的关键看点 [3]
马化腾官宣:自研龙虾、本地虾、云端虾等陆续赶来,外媒曝还在开发智能体
YOUNG财经 漾财经· 2026-03-11 15:37
腾讯在AI智能体(“龙虾”/“虾”)领域的战略布局 - 公司CEO马化腾通过社交媒体宣布,公司正推出一系列以“虾”为代号的AI智能体产品矩阵,包括自研龙虾、本地虾、云端虾、企业虾、云桌面虾、安全隔离虾房、云保安、知识库等,并称还有一批产品陆续赶来[2] - 公司正持续在OpenClaw(龙虾)领域进行布局,发力完善相关产品与服务生态,目前已初步形成覆盖个人用户、开发者及企业级部署的智能体“养虾”矩阵[5] 面向个人用户的AI智能体产品与体验 - 公司在个人用户层面主打“零部署、开箱即用”的轻量化体验解决方案[5] - 新上线的自研全场景桌面智能体WorkBuddy能够完全兼容OpenClaw技能包,用户无需代码基础与环境配置经验即可跨软件执行自动化任务[5] - 公司基于OpenClaw开源生态打造的本地AI助手QClaw已正式开启内测,无需服务器和额外配置IM工具,即可在个人电脑上一键部署“小龙虾”[5] - 全场景AI智能体WorkBuddy于3月9日正式上线,其能力与OpenClaw类似但更易用,安装类似普通App,无需复杂部署,可以调用国内不同的模型[5] 市场反应与运营表现 - WorkBuddy国内公开测试上线后,用户访问量远超预期,导致公司旗下编程工具CodeBuddy因流量激增出现登录及服务不稳定问题,技术团队已紧急扩容10倍[6] - 本周以来公司股价明显上涨,3月11日午间微涨0.45%收于556港元,早盘一度摸高至578港元/股,较上周五(3月6日)收盘价519港元/股分别上涨7.13%和11.37%[6] 潜在的未来产品动向 - 据外媒报道,公司正在为微信秘密开发一款AI智能体,计划于今年第三季度向全体用户推出,该智能体将嵌入微信,以对话形式接入数百万个小程序,可替代用户完成叫车、外卖等日常任务[4]
马化腾发朋友圈,官宣全系“龙虾”矩阵
新华网财经· 2026-03-11 15:05
腾讯在AI智能体(“龙虾”/OpenClaw)领域的战略布局 - 公司正持续发力完善OpenClaw(龙虾)领域的产品与服务生态,已初步形成覆盖个人、开发者及企业级部署的智能体“养虾”矩阵 [3] - 公司CEO马化腾在朋友圈转发了腾讯全系“龙虾”矩阵产品相关内容,包括自研龙虾、本地虾、云端虾、企业虾、云桌面虾、安全隔离虾房、云保安、知识库等,并称还有一批产品陆续赶来 [1][3] “龙虾”矩阵产品发布与市场反响 - 3月9日,公司宣布全场景AI智能体WorkBuddy正式上线,该产品能力与“小龙虾”OpenClaw类似,完全兼容其功能且更易用,安装过程类似于普通App,无需复杂部署,可以调用国内不同的模型 [4] - 同日,公司基于OpenClaw开源生态打造的本地AI助手QClaw也正式开启内测,无需服务器、无需额外配置IM工具,即可在个人电脑上一键部署“小龙虾” [3] - WorkBuddy国内公开测试上线后,用户访问量远超预期,导致腾讯系编程工具CodeBuddy因流量激增出现登录及服务不稳定问题,技术团队已紧急扩容10倍 [4] 产品定位与用户体验 - 在个人用户层面,公司主打“零部署、开箱即用”的轻量化体验解决方案 [3] - 新上线的自研全场景桌面智能体WorkBuddy能够完全兼容OpenClaw技能包,用户无需具备代码基础与环境配置经验,即可跨软件执行自动化任务 [3] 市场表现与潜在业务 - 本周以来,公司股价明显上涨,3月11日午间微涨0.45%收于556港元,早盘一度摸高至578港元/股,较上周五(3月6日)收盘价519港元/股分别上涨7.13%和11.37% [4] - 据外媒报道,公司正在为旗下应用微信秘密开发一款AI智能体,计划于今年第三季向全体用户推出,该智能体将嵌入微信,以对话形式接入数百万个小程序,可替代用户完成叫车、外卖等涉及日常生活的任务 [3]
传腾讯秘密启动微信AI智能体项目;蔚来首次实现季度盈利,去年Q4经营利润12.5亿元;LeCun的世界模型公司种子轮融资逾10亿美元丨邦早报
创业邦· 2026-03-11 08:24
微信与腾讯相关动态 - 微信员工辟谣OpenClaw可自动发红包,指出截图中的QClaw无移动端部署方案且PC微信不支持发红包,并提醒注意AI自动化工具的权限管理[3] - 腾讯云代码助手CodeBuddy因WorkBuddy(腾讯版小龙虾)国内公开测试上线后用户访问量远超预期,导致服务不稳定,技术团队已紧急扩容10倍并恢复服务,同时为国内版用户在2026年3月31日前赠送5,000 Credits作为补偿[8][9][10] - 据外媒报道,腾讯正秘密为微信打造新型AI智能体,该项目旨在连接微信内数百万小程序,为微信14亿月活跃用户代为处理任务,以在中国本土AI市场竞争中超越阿里巴巴和字节跳动[10] - 腾讯宣布QClaw正处于内测中,这是基于OpenClaw推出的本地AI助手,支持Windows/Mac一键安装,可通过微信对话远程操控电脑执行任务[36] 蔚来汽车2025年第四季度及全年业绩 - 蔚来2025年第四季度营收346.5亿元,同比增长75.9%,经营利润12.5亿元,实现公司首次季度盈利[11] - 第四季度交付124,807台,同比增长71.7%,环比增长43.3%,创历史新高[11] - 2025年全年营收874.9亿元,同比增长33.1%,全年共交付新车326,028台,同比增长46.9%[11] - 2026年第一季度交付指引为80,000台-83,000台,同比增长90.1%-97.2%,营收指引为244.8亿元-251.8亿元,同比增长103.4%至109.2%[11] Meta与AI领域动态 - Meta首席执行官扎克伯格发布与亚历山大·王的合影,Meta发言人辟谣其离职传闻,称其仍在负责MSL和TBD业务,影响力正在提升[5] - Meta宣布收购专为AI智能体打造的社交平台Moltbook,其联合创始人将加入Meta超级智能实验室[11] - Meta前首席AI科学家杨立昆的AI初创公司Advanced Machine Intelligence Labs完成10.3亿美元种子轮融资,创欧洲最大种子轮纪录,公司估值达35亿美元[31] 字节跳动与AI电商 - 豆包App已支持应用内“购物下单”功能,通过语音对话可推荐商品并直接完成支付下单,无需跳转抖音,这是字节跳动首次将“AI电商”技术内置到DAU超1.45亿的豆包App中[11] 荣耀公司战略与产品 - 荣耀CEO李健透露将考虑在国内市场正式推出子品牌,以优化渠道组合,并表示其国内市场份额已位列前三[21] - 荣耀正式发布折叠旗舰Magic V6,折叠厚度8.75毫米,重219克,搭载第五代骁龙8至尊版芯片,售价8999元起[32] - 荣耀CEO李健表示人形机器人是公司阿尔法战略的一部分,将聚焦消费市场的购物协助、工作检查、陪伴三大场景,荣耀是全球第一家正式进军消费级人形机器人市场的手机厂商[22] AI智能体与工具发展 - 智谱正式上线AutoClaw(澳龙),这是国内一键安装的本地版OpenClaw,预置超50个热门Skills,支持一键接入飞书等工具,并提供免费体验额度[34] - 英伟达计划推出面向企业的开源智能体平台NemoClaw,并寻求与Salesforce、思科、谷歌等企业建立合作关系[40] - OpenAI宣布计划收购AI安防初创公司Promptfoo,该公司专注于识别并修复AI系统安全漏洞,被超过25%的财富500强公司信任[31] 其他科技公司要闻 - 叮咚买菜创始人梁昌霖辞任CEO,原CFO王松接任,梁昌霖将继续担任董事会主席,同时CTO蒋旭因个人原因将于3月底离任[23] - 贝壳旗下贝好家回应裁员35%传闻不实,称核心团队稳定,已在全国落地18个多模式合作项目[26] - 特斯拉财务副总裁辛迪尔·帕拉尼在公司工作17年后离职,马斯克对其贡献表示感谢[27] - 百度旗下萝卜快跑已恢复在阿联酋迪拜与阿布扎比的全无人测试与运营服务[30] 行业数据与市场趋势 - Omdia研究显示,2025年东南亚智能手机出货量达到1亿部,同比下降1%,但第四季度同比增长2%至2580万部,三星以1790万部出货量(同比增长5%)领跑市场,市场份额18%[40] - 知情人士透露,苹果公司2025年在印度生产了约5500万部iPhone,同比增长约53%,印度产量占其全球总产量的比例达到25%[40] - IDC报告显示,2025年中国腕戴设备市场出货量为7390万台,同比增长20.8%,其中智能手表出货5061万台(同比增长17.2%),手环出货2329万台(同比增长29.4%)[41] 融资与收购事件 - 具身智能企业灵初智能完成天使轮及Pre-A轮共计20亿元融资,资金将用于物流场景的规模化应用与数据采集解决方案构建[31] - 开源AI应用平台服务商Dify.AI完成3000万美元Pre-A轮融资,由红杉中国领投[31] - AI智能硬件企业原子埃尔完成数千万元天使轮融资,其核心突破在于“震动AI交互系统”[31] - AI互动娱乐平台幕间完成累计千万美元融资[31] - AI+材料科学企业材科源图完成数千万元天使+轮融资,成立不到一年累计融资近亿元[31] 产品更新与行业治理 - OpenAI宣布与Shazam合作为ChatGPT客户端添加音乐识别功能[38] - 小红书发布公告将严格打击AI托管类账号,禁止利用技术手段模拟真人进行非真实内容创作或虚假互动[18] - OPPO和一加发布公告将于3月16日起对部分已发售产品进行价格调整,业内人士预测2026年手机市场或将迎来多轮价格调整[26]
无需部署!腾讯版“小龙虾”正式上线
证券时报· 2026-03-09 19:08
文章核心观点 - 腾讯正式推出全场景AI智能体WorkBuddy,该产品旨在降低AI办公应用门槛,通过简化部署和增强易用性,推动AI智能体从聊天工具向深度嵌入工作流程、解决实际生产力问题的办公利器普及 [1][6][7][8] 产品发布与定位 - 腾讯于3月9日正式上线全场景AI智能体WorkBuddy [1] - 该产品基于与AI辅助编程工具CodeBuddy相同的Agent智能体架构构建,定位为一个“有底座、有生态、可扩展的桌面智能体平台”,而非简单的聊天窗口 [7] - 产品内测阶段(2026年2月启动)已覆盖腾讯内部超过2000名非技术背景员工的日常工作 [7] 产品功能与优势 - **兼容性与易用性**:WorkBuddy兼容OpenClaw功能,用户下载安装后连接企业微信即可使用,无需复杂的云端部署流程,较OpenClaw更易用、安全 [2] - **快速配置**:通过企业微信实现远程操作,最快1分钟即可完成配置并连接 [4] - **多平台支持**:除企业微信外,同样支持接入QQ、飞书、钉钉等软件 [4] - **核心功能**:被描述为能够“听懂人话”、“带脑子思考”和“真能操作本地电脑文件”的智能体,可根据用户一句话描述的需求自动完成工作并交付结果,能承担复杂的多步骤任务 [7] - **应用场景广泛**:实践视频显示,其功能包括批量命名文件、处理票据、制作PPT、生成海报、开发企业官网、自动撰写与发布社交媒体内容等 [7] 市场背景与行业痛点 - **OpenClaw的启示**:OpenClaw的爆火反映了市场对AI产品跳出“聊天问答”、真正嵌入工作流程以解决实际生产力问题的迫切需求 [6][7] - **现有产品门槛**:OpenClaw的云端部署存在操作门槛,催生了费用高达上百元的“上门代装”服务,对一般用户不够友好 [4] - **安全隐患**:工业和信息化部监测显示,OpenClaw开源版本在默认配置或不当部署场景下存在显著安全隐患 [4] - **降低接入门槛**:企业微信官方宣布“只需3步,快速将OpenClaw接入智能机器人”,并通过“长连接方式”创建智能机器人,支持被动回复和AI主动发送消息,提升了交互实时性,进一步降低了OpenClaw和WorkBuddy的接入门槛 [5] 推广活动与行业影响 - **推广活动**:在WorkBuddy上线前,腾讯于3月6日举办了免费安装活动,近千名“龙虾”爱好者在腾讯云工程师协助下完成OpenClaw的云端安装 [4] - **行业影响**:WorkBuddy的上线让“养龙虾”(指使用AI智能体办公)这一模式走向普及,推动AI办公进一步融入大众日常,成为更具平民化的办公生态 [8]
鲁棒强化学习赋能AI编程!破局企业数据噪声难题,同等算力训出更好模型 | 上交大&腾讯CodeBuddy
量子位· 2026-02-16 19:00
文章核心观点 - 上海交通大学、腾讯CodeBuddy等团队联合提出的GAPO方法,通过精准过滤训练数据中的噪声和异常值,并采用稳健的优势值估计方法,显著提升了代码大模型在真实复杂场景下的训练效率和准确性,解决了AI辅助编程工业化落地的关键瓶颈 [3][13][28] AI辅助编程行业面临的真实挑战 - AI辅助编程已成为软件开发的核心生产力,大语言模型深度融入代码编辑、调试与优化全流程 [3] - 企业使用真实复杂用户环境数据训练模型时面临核心问题:复杂上下文导致模型输出频繁出现异常,产生rollout噪声,进而造成奖励异常值,最终导致优势值估计不准确,严重拖累强化学习效果 [3][4] - 真实场景的代码编辑任务输入提示结构复杂,包含系统提示、当前代码、编辑历史、编辑范围与光标位置、用户提示等多层级信息,对模型理解能力要求极高 [4][5][8] - 真实训练数据显示,输入提示长度跨度从1,925到24,883字符,输出编辑长度从36到833字符,并覆盖Go、Python、Java等10种主流编程语言,其中Go语言任务占比最高,达37.71% [6][7] - 复杂上下文的多样性导致模型输出不确定性增加,常出现偏离需求的异常编辑,如遗漏逻辑、修改无关代码或生成语法错误,这些噪声在真实数据中呈常态而非个例 [5][8] - 传统分组相对RL方法依赖群体均值计算优势值,但真实数据奖励分布中,14.4%呈右偏、15.5%呈左偏,这种由异常值主导的分布偏斜导致优势值被系统性高估或低估 [9][10] - 不同编程语言和编辑场景的噪声特征差异大,传统方法的固定均值基准无法适应动态噪声,导致投入大量资源采集的真实数据难以提升模型效果,甚至可能使训练“越训越偏” [11][12] GAPO方法的技术原理与创新 - GAPO方法精准针对“复杂上下文→rollout噪声→优势值估计不准”的核心痛点,通过优化优势计算环节实现“即插即用”的突破 [13] - 第一步是锁定高信噪比区域以精准过滤异常值:该方法将问题转化为查找最高密度区间,通过滑动窗口算法在每个输入提示的奖励集合中找到覆盖默认0.5比例奖励点的最窄区间,该区间能最大程度排除异常值 [13][15] - 第二步是用中位数替代均值进行稳健的优势值估计:在筛选出的最高密度区间内,使用中位数作为自适应Q值基准,相较于均值,中位数对异常值不敏感,能更稳定地反映有效输出的奖励基准 [17][18] - 该方法将噪声纳入RL过程,使模型能获得更清晰的能力边界,从而更擅长处理复杂输入 [19] - 工程上,GAPO计算复杂度为O(n log n),滑动窗口扫描仅需O(n)时间,不会带来额外算力负担 [19] - 该方法仅修改优势计算函数,无需调整RL框架其他模块,可轻松集成到主流框架,适配企业基于真实复杂数据的训练流程,无需额外数据降噪预处理 [19] GAPO方法的实证效果与性能优势 - 在代码专用型模型上受益最显著:Qwen2.5-Coder-14B在域内精确匹配准确率达46.25%,较GRPO基线提升4.35个百分点 [20][21] - 在跨域场景下泛化能力突出:Qwen2.5-Coder-7B在zeta数据集上准确率提升5.30个百分点,相对提升达38.89% [22][23] - 在多个主流大语言模型上均实现稳定提升:实验覆盖了从3B到14B参数的9个主流LLM,包括Mistral、Qwen、DeepSeek-Coder等系列 [20][21] - 训练效率更高:GAPO达到最佳准确率所需的训练步骤比基线更少,例如在Qwen2.5-Coder-14B上使用GAPO (G)比GRPO少121个训练步骤 [21] - 训练更稳定,算力利用率优化:GAPO的梯度裁剪比例显著低于GRPO/DAPO基线,说明优势值估计更合理,政策更新更准确,能减少无效迭代 [27][29] - 提升硬件利用率并降低训练成本:GAPO让3B模型的平均GPU吞吐量提升4.96%,意味着用相同算力能从真实数据中获得更好的训练效果 [30] 对行业的影响与意义 - GAPO研究让企业采集的真实复杂数据从训练“包袱”转变为提升模型效果的“燃料”,精准突破了工业化落地的关键瓶颈 [12][28] - 该方法在精度、泛化能力、训练效率与硬件利用率上均实现突破,为降低AI辅助编程落地门槛、提升研发效率提供了切实可行的方案 [28] - 随着GAPO代码的开源,有望推动AI辅助编程更深入地融入软件开发全流程,促进软件产业向更高效、更智能的方向发展 [28][31]