Workflow
新全栈
icon
搜索文档
「第二次 Token 大战」或再打响,「新全栈」或许才是内卷的「解药」
雷峰网· 2026-05-13 21:33
文章核心观点 - AI行业正从大语言模型(LLM)驱动的“Token价格战”阶段,向以智能体(Agent)为核心、追求更高价值交付的“价值战”阶段转型 [2][6] - 公司提出“新全栈AI云”战略,旨在通过构建从底层算力到上层应用的全栈、一体化生态系统,帮助客户高效开发并运行智能体,实现从单纯提供技术到共建生态的转变 [3][30][31] - 公司的目标是跳出当前以“龙虾”(OpenClaw)为代表的、以降低Token成本为核心的竞争模式,通过提供更优的模型能力、工程效率和场景化解决方案,与客户共同成长,成为伙伴而非简单的买卖关系 [6][31][32] 新全栈AI基础设施(AI Infra)的升级 - **异构算力布局**:公司与昆仑芯深度合作,昆仑芯P800已完成规模化验证,2025年以来已交付多个万卡集群,并在国产集群上成功完成文心5.1大模型的训练,集群有效训练率达97%,万卡规模线性扩展度超85% [7] - **算力集群与能效**:实现了吉瓦级AIDC(AI数据中心),支持风冷或液冷的灵活适配以降低建设与电力成本 [7] - **网络与存储优化**: - 网络层面,通过多平面技术实现大规模全二层网络,提升负载均衡与传输效率,并具备链路故障容错能力 [10] - 存储层面,推出全新KV Cache存储系统,通过分层显存、内存、SID来扩展大模型的记忆空间 [10] - **计算平台演进**:发布百舸AI计算平台6.0版本,将其升级为“算力工厂”,并推出百舸AI Stack支持私有化部署,让用户无论在公有云或私有云都能使用最新AI能力 [11] - **框架与性能提升**: - 开源全模态训练框架Loongforge,使英伟达GPU与昆仑芯可通过同一框架运行,相比典型多模态训练提速45% [13] - 依托全栈AI Infra,具身智能公司在典型VLA(视觉-语言-动作)训练上获得超70%的加速,世界模型推理时延降低近50% [13] 智能体基础设施(Agent Infra)的革新 - **架构设计**:为支撑智能体高效运行,公司设计了三层架构:底层的智能体驾驭工程(Harness)、中层的模型服务、上层的基础服务(安全、可观测性等) [20][23][24] - **底层驾驭工程(Harness)**: - 自研DuMate Harness架构,在智能体评测基准PinchBench和Deepsearch榜单登顶,能缩短任务时长、减少Token消耗,并在信通院首批认证中获得最高安全评级 [22] - 集成超过3000个精选技能(Skills),包括Office办公软件和浏览器技能,增强企业跨生态任务执行能力 [22] - **中层模型服务优化**: - 通过上下文与Cache管理及全局推理资源调度,在长链路任务中减少重复计算,调用SOTA模型的速度比行业平均高出25% [24] - 在投机解码框架中集成多Token预测(MTP)策略,使OTPS(每秒输出Token数)吞吐提升2-3倍,模型验证通过命中率超80% [24] - **上层安全与服务**:针对OpenClaw等存在的安全问题,千帆平台强化了会话隔离、数据隔离、防误删等功能以保障用户数据与权限安全 [25] 市场应用与生态案例 - **金融领域**:招商银行已上线超800个AI应用,其中超过50%运行在昆仑芯P800上,公司提供了从算力适配到应用落地的全流程协助 [9] - **能源领域**:与国家电网合作,基于千帆ModelBuilder和文心大模型4.5打造“光明电力大模型”,用于电网负载分析、智能调度与多模态巡检 [25] - **智能硬件领域**:拥有超1000家智能硬件客户,在细分赛道云厂商中排名第一,并帮助荣耀打造个人助手YOYO,集成于用户手机使用习惯中 [25] - **具身智能领域**:是具身智能领域最大的AI云供应商,市场份额占35%,超过第二、三名之和,提供从算力到全链路模型开发工具链的支持 [11] - **产业落地**:视觉智能体“百度一见”在义乌充当企业的“AI厂长”管理生产;“数字伙计Hogee”在义乌帮助商家进行智能导购、私域运营等营销工作 [27] 行业趋势与公司战略定位 - **行业范式转变**:AI Agent的普及导致Tokens消耗成数倍甚至十倍上升,推动云服务需求从基础算力转向支持高活跃、高价值、规模化智能体应用的基础设施 [2][6] - **竞争焦点转移**:行业竞争正从“Token价格战”转向“AI价值战”,客户需求从“人无我有”的功能比拼,变为对一站式、无短板全栈能力的要求 [6][19] - **生态战略**:“新全栈”的核心是构建生态系统,让客户能在其生态内高效使用算力、微调模型、开发智能体,最终实现降本增效,从而与生态深度绑定 [31] - **业务健康度**:公司不过度追求KPI,曾拒绝许多“低质调用”商单,如今随着市场对AI能力认知加深,更高质量、客户更愿付费的调用正在涌现 [31]
8岁小学生idea直接变应用,秒哒3.0刚刚把AI应用门槛打没了
量子位· 2026-05-13 19:30
文章核心观点 - AI正在将应用开发从少数专业人士的专业技能转变为普通大众也能掌握的创造能力,百度秒哒3.0的发布是这一趋势的关键推动力,它通过支持生产级应用开发、APP生成和企业级功能,显著降低了创造门槛并扩展了能力边界 [4][5][6][7][8] AI应用开发民主化趋势 - 应用开发门槛大幅降低,非专业人士也能快速创造应用:二年级学生开发“拼伞小程序”和操作系统;4人无代码团队7天搭建覆盖9万老人的养老平台;个人通过AI制作的心理测试应用在电商售出近千单,日访问用户超44万,访问量超120万 [1][2][3][65] - 行业趋势从比拼模型能力转向关注普通人能用AI做什么,焦点是“把想法变成现实” [83][85][87] 百度秒哒3.0的核心升级 - 从“能做应用”跨越到“能做生产级应用”,补齐了从生成Demo到真正可运行、可分发应用的“最后一公里” [5][11][12][14] - 支持直接生成真正的iOS和Android原生APP,而非H5页面,并支持安卓打包和在线热更新 [15][18] - 推出秒哒APP(安卓版已上线,iOS版即将推出),支持用户通过手机端的语音或文字完成应用生成、调试到发布的全流程,实现随时随地创作 [25][27][28][29] 进军企业级市场与生产级能力 - 发布秒哒企业版,标志着产品从个人工具转向企业级AI应用平台 [33][37] - 扩展企业任务场景:支持先调研再生成应用、准备宣传物料、提供数据监控能力,实现业务端到端闭环 [35] - 重点升级两大核心能力以解决企业落地问题:1) 企业级管理与协同开发(支持企业-团队-成员三级权限管理,应用可按权限协作);2) 服务稳定性与安全(数据库测试与生产环境隔离,提供企业级SLA承诺) [40] 秒哒在百度“新全栈”战略中的定位 - 秒哒是百度“芯云模体”全栈AI能力向大众开发侧延伸的体现 [76][79] - 百度判断AI行业正从“模型竞争”进入“应用爆发”阶段,需要“新全栈”能力,即底层芯片、云、模型、Agent系统协同整合,以支持AI在真实业务场景中完成任务并持续进化 [67][68][72][75] - 百度智能云已在工业制造、智慧能源等超过100个场景推动智能体落地 [78] 对未来影响的展望 - 当APP生成、Agent工作流、企业级协作能力成熟后,AI应用开发可能迎来快速爆发 [88] - 其深远影响在于让数亿普通人获得“创造应用”的能力,而不仅仅是少数公司生产应用 [89][90]