Workflow
Agentic AI(代理式人工智能)
icon
搜索文档
国产GPU厂商放言:2030年百亿Token只要1分钱
是说芯语· 2026-03-08 11:30
文章核心观点 - AI应用大规模落地的核心瓶颈在于高昂的计算成本,特别是Token费用,行业正致力于通过硬件创新和架构优化,在未来5-10年内将成本降低数个数量级,以推动Agentic AI(代理式人工智能)的普及 [1][3][8] AI应用成本与算力需求 - 2026年初爆火的AI应用OpenClaw消耗Token过多,导致使用成本高昂,许多人难以承受 [1] - 近两个月国产AI大模型的调用量已超越谷歌、OpenAI、Anthropic,主要因其Token费用更便宜,但成本仍需进一步大幅降低 [1] - 随着AI代理执行大规模网络搜索、图像生成和复杂数据分析,全球Token消耗量瞬间飙升了1000倍 [8] - 爆发式的计算需求造成了巨大的算力真空,无论硬件如何扩张,在Agentic AI渗透人类工作的趋势下,算力将长期处于受限状态 [8] 国产芯片发展路线与目标 - 国产GPU初创企业云天励飞提出,未来5到10年全球AI竞争焦点将从“谁最聪明”转向“最能让AI应用大规模落地” [3] - 该公司目标是在“十五五”期间(未来5年)将AI计算成本降低100万倍,目标是到2030年实现百亿Token仅需1分钱 [3] - 公司发布了新一代GPU路线图,将推出名为GPNPU的芯片,该芯片融合GPU与NPU特性,可兼容CUDA,声称仅需一行代码即可完成从GPU到国产芯片的部署迁移 [3] - 公司设计了prefill与decode分离的系统架构:P芯片侧重计算密集,D芯片侧重访存密集,旨在实现极致推理效率与性价比 [3] - 其GPNPU芯片将采用多芯片协同的超节点设计:计划在2026年推出第一代超节点P芯片,算力对标NVIDIA的Hopper架构;2027年推出第一代超节点D芯片,主打超低时延推理,对标NVIDIA的Blackwell架构 [3] - 计划在2028年推出第二代超节点D芯片,对标NVIDIA的Rubin芯片,有望实现毫秒级推理时延 [4] Agentic AI的生态与影响 - NVIDIA CEO黄仁勋将开源软件OpenClaw评价为“当代最重磅的软件发布”,认为其普及速度在短短三周内已超越了Linux过去三十年的成就,成为历史上下载量最大的开源软件 [6] - 黄仁勋将AI生态比作一个“五层蛋糕”,指出OpenClaw所在的应用程序层是目前产出最高、最具回报的领域 [7] - OpenClaw的流行向世界证明了AI可以深入高度个性化的环境,直接解决普通用户和企业的冗余任务 [7] - NVIDIA的下一代架构Vera Rubin将重点针对智能体AI的约束进行优化,通过提升板载显存容量和引入ICMS等平台,致力于解决长上下文处理等核心痛点,市场对其需求预计将非常巨大 [9]
9点1氪:贾国龙卸任西贝CEO;字节跳动启动最大规模转正实习生招聘;OpenClaw爆火,程序员上门安装收费500元
36氪· 2026-03-07 09:15
西贝人事变动与组织调整 - 春节前,贾国龙卸任西贝主品牌CEO,前任CEO董俊义重新回归该职,董俊义自1992年加入公司,从学徒一路成长为事业部CEO [3][4] - 公司对内宣告“因公司业务量大幅下降”,不少总部员工需待岗(按最低工资标准执行)或离开 [5] - 公司为被要求离开的总部员工提供三种方案:停薪留职、发放2025年部分绩效后主动离职、或按“N”倍补偿解聘(补偿金分期一年支付或“转股份”) [7] - 本轮裁员后,西贝总部员工人数预计从原本超过500人降至大约200余人 [7] 字节跳动招聘计划 - 字节跳动启动史上规模最大的转正实习生招聘计划(ByteIntern项目),拟面向全球高校招聘超7000名实习生,面向2027届毕业生 [7] - 所有岗位均提供转正机会,整体转正率超50% [7] - 招聘重点倾斜研发、产品与AI领域,其中研发类岗位Offer数量超4800个,占比超六成 [8] AI行业动态与OpenClaw影响 - NVIDIA CEO黄仁勋将开源软件OpenClaw评价为“当代最重磅的软件发布”,指出其在短短三周内的普及速度超越了Linux过去三十年的成就,成为历史上下载量最大的开源软件 [9] - 黄仁勋将AI生态比作“五层蛋糕”,认为OpenClaw所在的应用程序层是目前产出最高、最具回报的领域,其成功在于证明了AI能深入个性化环境解决冗余任务 [10] - OpenClaw的爆火催生了“上门安装”服务,线下部署收费常见价格为500元/次,远程安装价格在50-100元左右,部分相关网店服务显示已售1000+ [8] 科技公司与产品动态 - 小米公司基于MiMo大模型构建的AI交互测试产品Xiaomi miclaw于3月6日开始小范围封闭测试 [19] - 谷歌拟对Google Play商店进行系统性改革,包括降低所收费用、全面开放第三方支付系统和第三方应用商店,这是其商业模式的一次彻底重构 [16] - SpaceX计划在2027年底前发射约1200颗第二代卫星,旨在全球范围内提供移动版Starlink互联网服务,目标下载速度100兆比特/秒,上传速度50兆比特/秒 [13] 消费与零售行业 - 蜜雪冰城现磨咖啡业务处于前期规划试点阶段,将试点升级咖啡产品线,包括推出新品、升级咖啡豆与牛奶等原料,延续高质平价策略 [12] - 公司已公布“滴漏式咖啡壶”、“包装盒(咖啡)”、“包装袋(咖啡)”等多项咖啡相关外观设计专利 [12] - 雅诗兰黛集团达成协议,收购印度阿育吠陀美容品牌Forest Essentials剩余51%股份,交易预计于2026年下半年完成,完成后该品牌将全面纳入集团体系 [15] - 线上零售商Quince正洽谈新一轮融资,融资完成后公司估值将超过100亿美元,较上一轮融资估值翻倍以上 [23] 汽车与制造业 - 福特汽车因后视摄像头存在缺陷可能导致图像无法显示,在美国召回174万辆汽车 [11] - “天创机器人”完成超亿元D轮融资,金洲管道与超达装备两家上市公司战略入股,该公司专注于4D场景下的特种具身智能系统研发与应用 [23] 医药与健康 - 辉瑞中国宣布,国家药品监督管理局已正式批准新一代GLP-1受体激动剂埃诺格鲁肽注射液(先维盈®),用于中国成人超重/肥胖患者的长期体重管理 [17] - 万邦德预计2026年第一季度归属于上市公司股东的净利润为1.65亿元,同比增长985.40%,主要因公司由仿制药向创新药战略发展转型初见成效,业务拓展取得积极进展 [22] 宏观经济与政策 - 中国人民银行行长表示,融资平台债务风险化解取得重要阶段性成效,2025年末相较2023年初,融资平台数量和债务规模均下降超过70% [13] - 商务部部长表示,中国跨境电商进出口规模达到了2.75万亿 [14] - 商务部部长表示,中国网剧在全球市场的营收占比达90%,APP下载量占全球80% [15] - 商务部部长表示,机器人等高端智能、绿色低碳产品已成为中国外贸的新标签 [13] 金融市场与大宗商品 - 国际原油期货结算价创有记录以来最大周涨幅,WTI原油期货4月合约收涨12.21%至90.9美元/桶,本周累涨35.6%;布伦特原油期货5月合约涨8.52%至92.69美元/桶,本周累涨27.88% [11] - 美股三大指数集体收跌,纳指跌1.59%,标普500指数跌1.33%,道指跌0.95%;大型科技股普跌,英伟达跌3% [11] 公司财报与业绩 - 新希望2月销售商品猪98.22万头,环比下降12.44%;商品猪销售收入13.27亿元,环比下降18.49%,同比下降7.42%;商品猪销售均价11.45元/公斤,环比下降8.25%,同比下降21.79% [20] - 老凤祥2025年度实现营业收入528.23亿元,同比下降6.99%;归属于上市公司股东的净利润17.55亿元,同比下降9.99% [21] 其他行业新闻 - 印尼通信与数字事务部声明,将从3月28日起逐步禁止16岁以下儿童在YouTube、Facebook、Instagram等被认定为高风险的数字平台上拥有账户 [13] - 东芝公司正在重组其大部分有息债务,为目标于2028财年在东京证券交易所重新上市铺平道路 [17] - 英伟达云服务合作伙伴Together AI正洽谈融资事宜,计划融资约10亿美元,融资前估值为75亿美元 [20] - “死了么”App创始人因该App爆火后,被原公司建议离职,现已注册成立新公司成为全职创业者 [9]
昇思MindSpore AI框架下载量超1300万
环球网资讯· 2025-12-26 08:56
昇思MindSpore AI框架发展现状 - 昇思MindSpore AI框架全球下载量超过1300万,覆盖156个国家和地区,社区贡献者超过5.2万 [1] - 公司致力于打造超节点亲和、全场景融合、架构开放、敏捷使能的人工智能框架,以助力千行万业智能化转型 [1] 昇思MindSpore技术架构与创新 - 昇思MindSpore聚焦超节点技术创新,打造昇思HyperParallel架构,以加速新模型结构和新训推范式创新,引领AI框架迈入“超节点时代” [1] - 昇思HyperParallel架构将超节点视为一台“超级计算机”进行编程和调度,具备HyperShard声明式并行编程、HyperMPMD异构非规则并行、HyperOffload多级智能卸载等特性 [4] - 该架构旨在加速Agentic AI(代理式人工智能)、全模态等新模型结构和训推范式创新 [4] 行业应用与生态合作案例 - 中国商飞上海飞机设计研究院基于昇思MindSpore框架,推出业界首个民机超临界翼型气动设计智能体“御风·智翼”,构建了基于工程经验的超临界翼型智能一站式解决方案 [3] - 昇思社区践行共建共治共享理念,积极融入业界生态,并全链路支持AI人才培养 [3] - 大会由昇思MindSpore开源社区、全球计算联盟GCC主办,联合了华为技术有限公司、OSCHINA开源中国、AtomGit、Gitee、AITISA新一代人工智能产业技术创新战略联盟、OpenI启智社区、魔乐社区、焕新社区、书生社区、司南社区等多个组织承办 [4] 人工智能行业发展趋势 - 人工智能大模型的规模正走向长序列和稀疏的十万亿级,模型结构走向非规则化,训推范式走向异构化 [3] - 模型发展正驱动AI基础设施从“服务器集群时代”迈入“超节点时代”,AI框架作为产业智能化的核心基石面临新的挑战和机遇 [3]
易鑫集团正式发布汽车金融行业首个Agentic大模型
证券日报之声· 2025-11-12 17:37
公司产品发布 - 易鑫集团于2025世界互联网大会乌镇峰会正式发布汽车金融行业首个代理式人工智能大模型XinMM-AM1 [1] - 该模型参数量约300亿,响应延迟低于200ms,单卡吞吐可达370 tokens/s,便于低成本大规模部署与业务服务 [1] - 模型作为业务核心大脑和调度者,具备全渠道互动、全模态感知、全局协同与全量安全合规等关键能力 [1] 产品功能与影响 - XinMM-AM1赋能汽车金融业务全链路,覆盖获客、进件、智能风控、资金链路、智能客服、资管大脑等环节 [1] - 模型实现智能化、自动化决策,在有效提升风控能力和业务质量的同时,显著提高融资申请通过率 [1] - 该技术大幅解决汽车金融业周期长、交互步骤多、决策因素复杂的行业难题 [1] 公司技术地位与战略 - 易鑫集团是以人工智能驱动的金融科技平台,2024年成为中国汽车金融领域首个通过生成式人工智能大模型备案的企业 [2] - 公司率先在业务全场景实现AI的大规模应用,并于今年3月开源业内首个高性能推理模型 [2] - 随着代理式大模型上线,公司将加快对行业的AI赋能,持续推动智能汽车金融生态的建设 [2]
万亿云市场为何大爆发:巨头涌入AI基础设施竞赛,算力需求打开空间
新浪财经· 2025-09-16 07:05
全球AI算力产业链景气度 - 甲骨文最新财报推动公司股价大涨30% 英伟达等算力芯片厂商跟随上涨[2] - 博通获得新客户100亿美元定制芯片订单 股价上涨近10%[2] - 海外算力链高度景气 科技公司持续投资数据中心满足云服务需求[3][5] - 2024年全球云计算市场规模达6929亿美元 同比增长20.2%[3] - 2024年中国云计算市场规模达8288亿元 同比增长34.4%[3] 科技巨头AI基础设施投入 - Meta计划到2028年至少投资6000亿美元建设数据中心[5] - OpenAI计划在数据中心建设上花费数万亿美元[5] - 谷歌Q2云收入同比增32% 资本开支224.46亿美元同比增70.23%[9] - 微软Q2智能云业务增26% 资本开支170.79亿美元同比增23.11%[9] - 亚马逊Q2云计算业务增17.5% 资本开支313.68亿美元同比增91.35%[9] - 2025年全球ICT市场总投资规模接近5.9万亿美元 2029年增至7.6万亿美元[8] AI推理市场增长前景 - AI推理市场将远大于AI训练市场[11] - Agentic AI需要更复杂任务流程 推理Scaling是重要路径[11] - Token调用量随推理扩展倍数增长 算力需求随Token增长倍数增长[12] - Agentic AI渗透将使Token调用量增长10倍以上 算力硬件需求增长100倍以上[12] - 2024年初中国日均Token消耗量1千亿 2024年6月底突破30万亿增长300多倍[14] 中国云服务市场发展 - 阿里云2026财年Q1营收增26% AI基础设施累计投入超1000亿元[13] - 2025年上半年中国AI云市场规模223亿元 阿里云占比35.8%[13] - 2025年中国AI云市场预计增长148% 2030年达1930亿元规模[13] - 中国已建设高质量数据集超3.5万个 总体量超400PB[14] - 2025年中国企业级ICT市场规模3147亿美元 同比增长14.3%[14] - 中国IaaS支出五年复合增长率达14.7%[15] 甲骨文AI业务转型 - 甲骨文RPO飙升至4550亿美元 同比增长359%[6] - 第一季度新增RPO 3170亿美元 与OpenAI/xAI/Meta等签订大规模云合同[6] - 甲骨文从数据库转型AI基础设施提供商 为客户提供稳定可靠服务[6] - 二线云厂商可通过多云策略获得业绩增长 但需在技术/服务/性价比等方面积累优势[6]