Workflow
ASI(超级人工智能)
icon
搜索文档
中兴通讯崔丽:全球大模型之争“三极鼎立”,开启“实用竞赛”
21世纪经济报道· 2025-12-30 18:24
全球大模型竞争格局演变 - 2025年开年,DeepSeek的崛起成为改变全球大模型竞争态势的关键一环,国产大模型正充分拥抱开源生态 [1] - 行业逻辑正从“开源做生态,闭源做商业”的简单二元论发生变化,形成“三极鼎立”的新局面 [1][4] - 新的现实是,开源正在毁灭卖模型的商业模式,逼迫闭源走向更深的服务整合,即集成和分发 [1][4] 大模型竞争“三极鼎立”格局 - **第一极:美方SOTA闭源模型**,以GPT-5、Gemini 3为代表,凭借断层式推理性能和Agent能力,服务于企业关键业务流和高价值知识挖掘,以私有数据访问权、极致安全性和用户入口构建护城河 [4] - **第二极:中国普惠开源模型**,核心是算法优化突破算力瓶颈,追求极致和普惠 [4] - DeepSeek-V3通过MoE和MLA等创新,实现训练和推理成本量级降低 [4] - DeepSeek-R1性能对标OpenAI o1,采用纯强化学习路径和蒸馏技术,将高阶智能拉入普惠人间 [5] - 截至2025年10月,阿里通义千问Qwen的全球下载量已突破7亿次,成为全球第一AI开源模型 [5] - DeepSeek与Qwen的崛起不仅是性能追赶,更是架构效率与工程化能力的超越,在全球构建了足以抗衡硅谷的第二极技术生态 [5] - **第三极:垂域Agentic AI深耕**,聚焦垂直行业应用落地和价值挖掘,典型代表包括欧洲Mistral等 [5] 开源与闭源模式的战略转变 - Meta从“开源先锋”转向闭源(启动“Avocado”项目),是资本效率与竞争逻辑下的必然选择 [2] - 2023至2024年,Meta通过开源Llama系列模型,将PyTorch和Llama架构确立为行业事实标准,成功扮演了“反OpenAI联盟”盟主角色,使模型商品化以削弱竞争对手的垄断溢价 [2] - 进入2025年,该策略遭遇资本墙,前沿模型训练成本突破百亿美元大关,单纯依靠“生态影响力”已无法满足投资回报率审查,且缺乏云服务或应用场景等变现能力,无法构建可持续商业闭环 [3] - 曾引领文生图领域的开源先驱Stability AI在2025年面临严重现金流断裂与债务危机,最终不得不重组并引入外部资本控制 [3] AI发展目标:从AGI到ASI的演进 - AI发展逻辑正从“拟人化”迷途回归“工程化”坦途,即从“模仿人类”转向“数学优化” [5] - ASI被定义为在科学、代码、数学和复杂系统模拟等客观领域远超人类能力的智能形式,其发展目标从“模仿人类的通用性”重定向为“追求客观真理的极致优化” [6] - ASI将智能进化重构为可量化、可预测的工程问题,核心由三大引擎驱动 [6] 1. 通过测试时计算进行慢思考,依赖可预测的工业堆叠 2. 递归自我进化,利用“形式化验证”作为奖赏信号,不依赖昂贵且不稳定的人类反馈 3. 合成数据成为模型的高质量“燃料” - ASI发展面临三大阻碍 [6] 1. 评价体系滞后,易陷入“刷分陷阱” 2. “验证鸿沟”:当ASI提出的解法超越人类理解范畴时,难以判断是创新还是幻觉,这是阻碍其商业价值闭环的关键卡点 3. 面临物理世界反作用力,如吉瓦级(GW)的能源缺口、半导体供应链极限、安全治理真空等 算力基础设施面临的系统性挑战 - 随着摩尔定律边际效应递减及大模型参数量指数级膨胀,未来算力基础设施的显著瓶颈已从单一芯片计算能力转向数据传输能力 [7] - 核心挑战在于“内存墙”与“通信墙”的双重夹击,以及由此导致的“空泡”现象 [8] - “内存墙”:模型参数增长速度远超显存容量增速,模型必须被切分得更细,导致更频繁的跨芯片通信,加剧带宽压力 [8] - “通信墙”:在传统冯·诺依曼架构下,数据在存储与计算单元间搬运的能耗可能占总能耗的60%至90% [8] - 由于单个GPU显存无法容纳完整大模型,必须采用流水线并行、张量并行等技术将模型切分到多个GPU甚至多个计算节点上,随着集群规模扩大,跨节点通信变得频繁 [8] - 跨机通信带宽远低于机内通信带宽,导致“空泡”时间在总训练时间中占比急剧上升,极端情况下,昂贵GPU集群有超过50%的时间在等待数据 [8] - 竞争焦点从单芯片算力发展为芯片+互联+生态的协同竞争,以AI芯片和Scale-up互联为基础的推理效能和超节点算力成为主要方向 [8] 算力基础设施的未来发展方向 - 算力基础设施的未来不是“GPU越多越好”,而是追求“通信效率越高、系统越可靠、成本越可控” [9] - 超节点是应对数据传输瓶颈的关键路径,聚焦算力密度和算力扩展能力提升,使其在逻辑上表现为一台“巨型计算机” [9] - 构建可持续基础设施的主张包括 [9] - 以开放协议为根基:推动开放互联协议标准化,支持并参与国内开放互联标准(如OSIA、OLink、ETH-X)的制定与推广,构建兼容多厂商GPU的开放型超节点架构 - 以系统工程为手段:强化系统级工程能力,提升可靠性与可运维性,推动“算力+网络+散热+供电”一体化设计,布局液冷与智能供电 - 以场景价值为导向:追求“性能-成本-能耗”更优平衡 - 主张“性能甜点区”,反对盲目追求超大规模 [10] - 大模型训练中,优先验证64卡超节点的性价比 - 推理场景中,探索与DeepSeek类似的“跨节点专家并行+通信重叠”等软件优化方案 - 推动“Scale-up+Scale-out”混合架构,核心训练集群采用超节点,边缘或中小模型部署采用传统8卡服务器,实现资源分层、按需供给 AI与通信网络的深度融合 - 通信网络正从“管道”向“神经中枢”转型,算力是神经元,网络就是神经网络 [10] - **AI对网络的双重影响** [10] - **AI for Network**:产品级重点在硬件智能内生和软件智能进阶;网络级则通过Agentic AI、大数据和数字孪生深度融合,加速自智网络向L4+迈进 - **Network for AI**:在智能生产阶段,需要支持多种开放标准的高速无损互联(Die 2 Die、GPU 2 GPU、集群内部和DC之间),提升智算中心性能与效率;在智能应用环节,云边端协同、智能体间协同成为常态,泛在AI需要更强大的网络支撑 - 基础设施层面,将从“芯片级摩尔”向“系统级摩尔”迈进,即网、算、存、软、能协同发展 [11] - 应用层面,AI+通信网络+感知交互+存储计算+新能源五大基础技术融合,最终走向超级智能体 [11] - 传统APP面临AI Agent重构与“升级换代”,构建自有AI Agent开发平台支撑传统应用演进和AI原生应用成为核心需求 - Agentic AI会让算力网络和边缘计算重回关注重点 - 运营商需要能力上从“尽力而为”到“万无一失”,业务上从“一致性”到“差异化”,服务上从“拼指标”到“拼场景体验”,融合和集成能力是关键,最终考验资源利用效率和服务变现效率 [12] - 在AI大模型加持下,通信行业正经历从底层物理设施到上层商业模式的彻底重构 [12] 1. **架构融合**:推动通信网络向“分布式超级计算机”演进,算力网络通过SRv6和算网大脑,打破计算与网络界限,实现资源的原子化解耦与重组 2. **AI内生**:6G网络将是智能原生的,深度学习深度融入,使网络具备自我学习、自我优化能力 3. **价值重塑**:运营商和设备商有望从单纯的连接提供者跃升为智能时代的“发电厂”和“输电网”,成为数字经济赋能者 对AI“泡沫论”的见解 - 当前AI“泡沫论”的兴起,源于英伟达市值伴随业绩屡创新高,以及全球头部AI玩家围绕AI基础设施的密集投资和交叉投资推高市值的争议 [13] - 与2000年“互联网泡沫”的相似点在于:都有改变世界的愿景,都充斥FOMO(错失恐惧症)情绪,都存在大量初创公司高估值 [13] - 与互联网泡沫的不同点在于 [13] - 今天的AI已有大规模实际应用和激增的收入 - 核心大玩家(微软、谷歌、英伟达等)拥有稳健的现金流和相对合理的市盈率 - AI技术效用是真实的,更类似2000年的光纤基础设施建设,虽然短期可能算力过剩,但基础设施的铺设为长期应用爆发奠定了基础 [13] - 最大的风险存在于金融层面,市场上确实存在估值泡沫和约6000亿美元的营收缺口 [14] - 巨头通过“云计算信贷”和“往返交易”构建的账面繁荣掩盖了部分真实需求不足,债务融资与SPV的操作也存在较大风险 [14] - AI领域存在赢家难定、利润之谜、技术寿命等巨大不确定性,也可能导致泡沫破裂 [14] - 开源与闭源的博弈、通用与专用的博弈、推理经济性、能源约束、监管与法律等,也可能成为影响行业的变量 [14] 构建健康AI商业循环的建议 - 关注从“参数竞赛”转向“推理经济学”,只有当推理像水电一样便宜,Agent才能大规模替代人工 [14] - 拒绝“套壳”,深耕“工作流”,商业模式应从简单的Chatbot转向嵌入核心业务流的Agentic AI,按结果收费 [14] - 为避免反垄断拆分风险,巨头应主动降低对初创公司的排他性算力绑定,开放解耦 [14] - 对于能源和芯片的投资,应基于真实的推理需求预测,而非线性的训练规模外推,坚持投资基础设施的长期主义 [14] - 着眼去杠杆、关注ROI,应剥离金融工程带来的虚假收入,关注扣除云成本后的单元经济模型,优先采用小语言模型降低落地成本 [15] - 不能忽视监管机构在平衡创新与安全方面的作用 [15]
迈向 ASI,阿里云以全栈 AI 服务能力开拓智能新版图
钛媒体APP· 2025-12-02 11:45
阿里云在AI时代的全栈战略定位 - 公司认为AI时代大模型与云计算的结合是行业重要趋势和技术创新的核心驱动力 [2] - 公司已转型为全球少数大模型与云计算全栈自研且技术领先的全栈人工智能提供商 [3] - 公司的技术创新围绕模型、基础设施和AI应用开发三个维度展开 [3] 通义大模型家族的发展与成就 - 通义模型家族已成为全球最大的模型家族,并成为全球第一开源模型及中国企业选择最多的模型 [3][6] - 截至2025年9月,通义大模型开源300余个模型,全球下载量突破6亿次,衍生模型达17万个,稳居全球第一 [6] - 超100万家客户接入通义大模型,2025年上半年在中国企业级大模型调用市场中占比第一 [6] - 在云栖大会上“七连发”,发布6款新模型及1个新品牌,覆盖全场景并在多维度实现突破 [9] 核心模型的技术突破与性能 - 旗舰模型Qwen3-Max预训练数据量达36T tokens,总参数超万亿,在全球权威评测中性能超越GPT-5、Claude Opus 4等,跻身世界前三 [10] - Qwen3-Max在代表Agent核心能力的工具调用和Coding能力评测中位列全球第一梯队 [10] - 下一代基础模型架构Qwen3-Next系列总参数80B,仅激活3B参数性能便可媲美235B旗舰模型,训练成本相较Qwen3-32B锐减超90%,长文本推理吞吐量提升10倍以上 [11] - 编程模型Qwen3-Coder开源后在OpenRouter平台调用量激增1474%,位列全球第二 [11] 多模态与专项模型的升级 - 视觉理解模型Qwen3-VL增强了复杂空间理解能力,实现3D基础训练,为具身智能奠定基础 [12] - 全模态模型Qwen3-Omni首次实现音、视、文多模态混合训练而各项能力不降反升 [12] - 多模态生成模型通义万相Wan2.5实现原生音画同步的10秒视频生成 [12] - 全新语音大模型家族通义百聆,包括基于数千万小时真实语音数据训练的Fun-ASR及可提供上百种预制音色的Fun-CosyVoice [12] AI基础设施的全栈升级 - 推出新一代磐久超节点服务器,单机柜可容纳高达128颗AI芯片,单柜功率达350千瓦 [14] - 推出HPN 8.0高性能网络架构,是全球首批实现“训推一体”设计的AI网络,支持从万卡规模跃升至数十万卡互联 [15] - CPFS面向AI训练与推理深度优化,单客户端吞吐量高达40GB/s,性能相比传统方案提升60%,并实现百万级IOPS [15] - 引入智能分层存储机制,热数据驻留CPFS,冷数据自动转移至OSS以优化成本 [16] - OSS全面升级支持向量化数据存储与索引,通过Vector Bucket机制实现多模态数据高效查询 [16] - 灵骏智算集群支持容器、虚机、裸金属等多种算力形态,智能化监测系统故障发现率超98% [16] 多模态智能数据底座的构建 - 瑶池发布基于“湖仓库一体化”的多模数据智能管理平台,融合OLTP和OLAP能力 [18] - 多模数据管理平台DMS: OneMeta+OneOps,支持40多种数据源,已服务超10万家企业客户 [19] - DMS助力客户将多模开发效率提高2倍以上,数据交付效率最高提升5倍,同时降低90%安全合规风险 [20] - 大数据平台MaxCompute、Hologres等产品数据处理全面支持AI Function,实现数据处理与AI推理无缝融合 [22] 数据库与大数据平台的性能突破 - Hologres发布全新向量索引HGraph,登顶Vector DB Bench性价比榜单QPS、Recall、Latency、Load四项第一 [24] - Milvus相比同类型产品性价比提升4倍 [24] - 云原生数据库PolarDB全球首创基于CXL Switch的分布式内存池技术,网络时延从微秒级降低至纳秒级,内存单价降低30% [24] - 开源大数据平台EMR在TPC-H10T starrocks测试中性能相比前榜首提升111%,在TPCDS 100T Spark测试中性价比相比前榜首提升500% [24] 训练与推理全流程优化 - 人工智能平台PAI创新推出专用训练引擎paiMoE,在Qwen3训练中实现端到端加速比提效3倍,训练MFU超过61% [26] - 针对DiT架构推出训练推理一体化加速引擎paiFuser,在8卡并行推理场景下视频生成耗时最高减少80%以上 [27] - 通过全链路优化,实现推理吞吐TPS增加71%,时延TPOT降低70.6%,扩容时长降低97.6% [27] - PAI-EAS推出企业级EP解决方案,使千亿参数MoE模型首Token生成响应时间降低92%,端到端服务吞吐提升超5倍 [28] - 大规模强化学习训练框架PAI-Chatlearn在相同硬件下,训练吞吐比开源框架提升2倍以上 [29] AI应用开发与Agent生态 - 阿里云百炼平台形成“1+2+7”企业级Agent体系:一套模型服务、两种开发模式、七大关键能力 [32] - 发布全新Agent开发框架ModelStudio-ADK,让专业开发者1小时就能开发一个能生成深度报告的Deep Research项目 [33] - 低代码平台ModelStudio-ADP已广泛应用于金融、教育和电商等领域,网商银行基于其开发的贷款审核应用任务处理时间从3小时优化至5分钟内,准确率超95% [33] - 阿里云百炼平台已有超20万开发者开发了80多万个Agent [33] - 过去12个月里,百炼模型服务调用量增加了15倍 [36] - 在金融领域,通义大模型已覆盖九成国家级及大型国有银行、全部12家股份制银行和排名前十的财险公司 [36]
阿里巴巴最新披露!
证券时报· 2025-11-24 19:09
公司战略与产品发布 - 阿里巴巴旗下AI助手千问APP公测一周下载量超过1000万次,成为史上增长最快的AI应用 [1] - 公司于11月17日正式推出千问APP,接入开源模型Qwen3并免费开放,旨在与ChatGPT展开全面竞争 [1] - 千问APP定位为“会聊天能办事的个人AI助手”,未来计划逐步增加智能体AI功能,并计划通过海外版本向全球扩张 [1] - 公司计划将地图、外卖、订票等生态服务接入千问APP,旨在打造统一的AI服务入口 [1] - 阿里巴巴正以“用户为先,AI驱动”为核心战略,投入重金构建从底层算力到上层应用的整体生态 [2] 管理层愿景与行业展望 - 阿里巴巴CEO吴泳铭指出,实现AGI是确定性事件,终极目标是发展出ASI以解决重大科学难题 [2] - 管理层认为未来“自然语言就是AI时代的源代码”,任何人都能创造自己的Agent [2] - 随着千问APP与淘宝、高德、钉钉等应用打通,预计将强化阿里整个生态的用户黏性和活跃度,创造协同价值 [2] 资本开支与市场竞争力 - 高盛报告上调对阿里巴巴的资本开支预测,预计2026至2028财年的合计资本开支将达到4600亿元人民币,高于此前3800亿元的目标 [2] - 高盛认为AI推理需求的激增是支撑资本开支增长的核心逻辑,更高的计算效率可能提升资本开支向云收入的转化率 [2] - 中国多模态大模型凭借开源、低价和高速度等策略在全球市场形成差异化竞争优势 [3] - 中国AI模型的全球应用增加,例如爱彼迎正大量使用阿里巴巴的Qwen模型支持其客服代理,显示中国开源AI模型获得全球市场认可 [3]
开战!阿里千问App公测,与ChatGPT正面交锋
证券时报· 2025-11-17 17:22
公司战略与产品发布 - 阿里巴巴于11月17日正式官宣“千问”项目并上线千问APP公测版,全力进军AI to C市场 [1] - 公司定位千问APP为“会聊天能办事的AI个人助理”,全面对标ChatGPT,并免费开放 [2] - 未来计划逐步增加智能体AI功能以支持淘宝等平台的购物功能,并计划通过海外版本向全球扩张 [1] - 公司计划将地图、外卖、订票等生态服务逐步接入千问APP,试图打造统一的AI服务入口 [2] 产品功能与技术基础 - 千问APP基于公司自研的全球性能第一的开源模型Qwen3打造,展现出多场景服务能力 [2][4] - 产品功能覆盖专业领域和生活场景,可快速处理研究报告、提取论文要点,并提供健康咨询、拍照识物等服务 [2] - 千问APP已在中国各大应用商店上架,同步提供网页端和PC版,未来还将上线国际版 [3] - 千问大模型家族已形成包含300多款模型的体系,囊括文本、编程、图像、语音、视频等全模态,覆盖从0.5B到480B的全尺寸参数规模 [4] 市场影响与生态协同 - Qwen模型在全球范围内被亚马逊、苹果、英伟达等科技巨头采用,在中国企业级市场占有率稳居第一 [4] - 千问APP的推出旨在将阿里生态内分散的AI能力整合到统一入口,形成聚合效应,2025年“双11”购物节已成为阿里AI应用的一次大检阅 [6] - 千问APP与淘宝、高德、钉钉等应用的打通,预计将强化整个生态的用户粘性和活跃度,创造协同价值 [7] - 公司以“用户为先,AI驱动”为战略,构建从底层算力到上层应用的完整生态,终极目标是发展出超级人工智能以解决重大科学难题 [6]
开战!阿里千问App公测,与ChatGPT正面交锋
证券时报· 2025-11-17 17:18
文章核心观点 - 阿里巴巴于11月17日正式官宣“千问”项目并上线同名APP公测版,此举标志着公司全力进军“AI to C”市场,与ChatGPT展开全面竞争 [1] - 公司将“千问”项目视为“AI时代的未来之战”,旨在借助其在大模型领域的开源优势和国际影响力,在竞争激烈的C端AI应用市场中赢得关键席位 [3] - 千问APP的推出是阿里巴巴将技术优势从底层模型向应用层、从企业端向消费端传导的关键一步,旨在打造统一的AI服务入口,实现AI战略的全链路布局 [4][9] 产品定位与功能 - 千问APP被定位为“会聊天能办事的AI个人助理”,与市场上侧重于娱乐聊天的应用不同,其从一开始就瞄准了“生产力工具”赛道 [3] - 产品基于公司自研的千问Qwen最强模型打造,展现出多场景服务能力,在专业领域可快速处理研究报告、提取论文要点,在生活场景中可提供健康咨询、拍照识物等服务 [4] - 公司计划将地图、外卖、订票等生态服务逐步接入千问APP,并计划在未来几个月内增加智能体AI功能以支持淘宝等平台上的购物功能 [1][4] 技术基础与优势 - 千问APP的底气源于公司在底层模型上多年的深耕,其建立在性能领先全球的“千问Qwen”大模型家族之上 [7] - 从2023年推出第一代模型开始,公司坚持全面开源策略,已形成包含300多款模型的“千问家族”,囊括全模态,覆盖从0.5B到480B的全尺寸参数规模 [7] - Qwen模型已在全球范围内产生重要影响,被亚马逊、苹果、英伟达等科技巨头采用,并在中国企业级市场占有率稳居第一 [7][8] 战略布局与生态协同 - 公司正以“用户为先,AI驱动”为战略,投入重金构建从底层算力到上层应用的完整“全栈式”AI生态 [11] - 公司高层将实现AGI视为起点,终极目标是发展出能自我迭代的ASI,而千问APP被视为承载智能体并通往ASI的关键入口 [11] - 千问模型已在阿里生态内全面渗透,千问APP的推出旨在将分散的AI能力整合到统一入口,强化整个生态的用户粘性和活跃度,创造协同价值 [11][12]
全球AI基建竞赛白热化,阿里云重出降价牌破局海外
华夏时报· 2025-10-16 07:37
阿里云海外市场降价策略 - 公司宣布将于2025年10月30日起调整部分海外地域云服务器ECS产品价格 [2] - 价格调整涉及法兰克福、东京、迪拜,最高降幅为10.26% [2] - 降价产品规格族包括ecs.c9i、ecs.g9i等,对包月、包年价格及节省计划进行普降,幅度从3.74%至10.26% [3] - 此次降价被视为公司在欧洲、亚太及中东区域加快市场攻势的信号 [3] 阿里云全球化战略与AI基建投入 - 全球化是公司核心战略,2014年首次出海,已布局北美、欧洲、日韩、东南亚、中东等市场 [4] - 公司计划在巴西、法国和荷兰首次设立云计算地域节点,并扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心 [5] - 截至2025年9月,公司已在全球29个地区运营91个可用区 [5] - 阿里巴巴集团积极推进3年3800亿元的AI基础设施建设计划,并持续追加更大投入 [5] - 根据远期规划,为迎接超级人工智能时代,2032年公司全球数据中心能耗规模将较2022年提升10倍 [5] 中国云计算厂商海外竞争格局 - 相较于国内市场,利润更高的海外市场成为云计算厂商的投资重点 [6] - 腾讯云计划未来投入1.5亿美元在沙特建设中东数据中心,并在大阪新建日本第三个数据中心 [6] - 百度已在全球十余个地区建立大规模数据中心 [6] - 2025年第一季度中国大陆云基础设施服务支出达116亿美元,同比增长16%,阿里云以33%份额位居第一 [6] - 全球市场由亚马逊云科技、微软Azure和谷歌云主导,2025年第二季度三者合计占全球云基础设施支出的65% [7] - AI出现后,海外竞争焦点从“低价”转向“AI+场景”,中国云厂商靠实时音视频、游戏社交PaaS错位突围 [7] 全球AI投资与行业前景 - 全球科技巨头纷纷投入AI基础设施建设,Meta宣布追加300亿美元投入AI数据中心,OpenAI宣布在阿联酋建设全球最大AI数据中心,AWS宣布投资1000亿美元用于云和AI基建 [7] - 最近一年全球AI行业投资总额已超过4000亿美元,未来5年全球AI累计投入将超过4万亿美元 [8] - 未来全球可能只会有5-6个超级云计算平台,跻身其中是公司的核心任务 [8]
构建全栈AI护城河!科技巨头为未来AI十亿倍增长“引弓”?|AI观察系列策划
每日经济新闻· 2025-10-09 17:53
英伟达与OpenAI的新合作 - 英伟达将在芯片、软件、系统及AI工厂层面与OpenAI合作,助其建立完整技术栈并成为完全自运营的超大规模公司[1][5] - 此次合作核心是帮助OpenAI首次建立自己的AI基础设施,此前其数据中心建设外包给微软[5] 全栈AI布局成为行业趋势 - 全栈AI布局指从底层芯片、数据中心到云计算及模型层的全面覆盖,是科技巨头角逐AI的核心壁垒[1] - 全球范围内仅有少数公司能实现全栈自研,如阿里巴巴与谷歌,旨在打通从硬件到应用的完整闭环生态[1][5] - 阿里巴巴集团CEO宣布阿里云的新定位是“全栈人工智能服务商”,将提供世界领先的智能能力与全球AI云计算网络[10][11] 英伟达财务业绩与市场地位 - 2026财年第二季度英伟达收入为467亿美元,环比增长6%,同比增长56%[2] - 当季GAAP和非GAAP毛利率分别为72.4%和72.7%[2] - 主推的AI芯片Blackwell系列收入在该季度环比增长17%,显示其在AI算力市场的持续领先[2] AI推理增长的宏大预期 - 英伟达CEO预计AI推理将迎来百万倍乃至十亿倍的增长,并称此为一场“工业革命”[2] - 其信心源于AI代理系统的演进,AI已成为能同时运行、使用工具、处理任务的多模态系统[3] - 在传统AI规模定律上引入了“思考”推理定律,使推理能力呈指数级增长[2] 全球AI基础设施投资加速 - 摩根大通指出2025年上半年全球资本支出实现11%的年化增长,强劲势头延续[4] - 花旗集团认为AI基础设施投资正以远超预期的速度“急剧加速”,并由真实企业级需求驱动[4] - 阿里巴巴正积极推进3800亿元的AI基础设施建设计划并持续追加投入[7] 阿里巴巴的AI业务表现与战略 - 阿里2026财年Q1(自然年2025年Q2)财报显示,阿里云收入增长加速至26%,创三年新高[7] - AI相关产品收入已连续8个季度实现三位数同比增长[7] - 阿里通义开源了300余个模型,全球下载量突破6亿次,衍生模型达17万个[12] AI技术发展阶段的演进 - AI正从AGI迈向ASI,当前处于“自主行动”的第二阶段,特征是“辅助人”[8] - 下一阶段“自我迭代”的目标是让模型自我学习与完善,但仍面临技术难题[8] - AI Chatbot是人类史上用户渗透率最快的功能,Token消耗速度每两三个月翻一番[12] 资本市场对AI的反应 - 高盛、摩根近期上调对国内主要AI科技企业如阿里、腾讯的目标价[2][9] - 2025年初以来阿里巴巴股价上涨,市值超3万亿港元,创近4年新高[9] - 摩根大通将阿里巴巴港股目标股价上调近45%,认可其从算力到应用的全环节布局[9]
AI应用时代,阿里云看到的宽路和窄门
搜狐财经· 2025-09-28 21:57
核心观点 - 阿里云在云栖大会上展示了AI技术在多个具体场景的应用 包括珊瑚礁生态监测、视障辅助、机器人开发和农牧场管理 强调技术向善和普惠价值 [1][3] - 公司不追逐单一"杀手级应用" 而是通过构建"模型+工具+场景"的闭环 推动AI与物理世界交互能力的升级 [4][5] - 阿里巴巴集团CEO提出"ASI(超级人工智能)"蓝图 将大模型定义为下一代操作系统 超级AI云为下一代计算机 并进行了全栈技术升级 [7][9][11] - 阿里云战略从技术输出转向生态共建 通过开发者平台和产业合作挖掘AI应用价值 目标成为全栈人工智能服务商 [14][16][18] AI场景应用案例 - 通义千问VL多模态大模型应用于珊瑚礁生态监测 将人工分析时间从18.6小时压缩至12小时 处理20多T水下影像数据 [1] - 瞳行科技利用AI语音交互技术为视障用户提供沟通渠道 [1] - UP主张子豪通过通义大模型实现低成本机器人开发 支持C++、Python等多种编程工具 [1] - 铁骑力士使用通义千问VL多模态大模型提升养殖场生物安全风险识别能力 管理8000多个摄像头监控数据 [3] 技术战略与布局 - 通义千问Qwen3-Max模型具备顶级智力和推理能力 Qwen3-VL在32项核心能力测评中超过Gemini-2.5-Pro和GPT-5 [11] - 通义万相(视觉)和通义百聆(听觉)升级 强化AI感知能力 [11] - Agent开发框架完善Tool Use能力 使AI具备工具使用和复杂任务执行功能 [11] - 阿里云推出以GPU为核心的全新AI原生计算架构 覆盖从模型制造到生态构建的全链条 [11][13] 生态建设与商业模式 - 超过20万开发者在阿里百炼平台开发80多万个Agent 利用阿里云AI基础设施和Qwen模型能力 [16] - 公司支持ISV生态伙伴开发产业级产品 推动中国AI应用在不同维度的生态发展 [14] - 基础模型能力同质化背景下 阿里云从技术输出方转型为生态共建者和价值发现者 [14]
奥特曼和量子计算奠基人讨论GPT-8
量子位· 2025-09-28 11:39
核心观点 - 萨姆·奥特曼与戴维·多伊奇就“AI能否发展为具备意识的超级智能”展开对话,奥特曼以未来GPT-8可能解决量子引力问题并解释其思考过程为例,论证AI具备超级智能的可能性 [1][8][22] - 戴维·多伊奇最初认为AI无法发展为具备意识的超级智能,但被奥特曼的GPT-8假设说服,认为如果AI能提供解决复杂问题(如量子引力)的“过程故事”,则可被视为具备解释性创造力 [1][11][12][22] 奥特曼的观点 - 奥特曼极度乐观地认为,即使在AI世界里,人类依然永远不会缺少可以做的事、可以发挥价值的方式、可以解决的问题和可以探索的未知 [6] - 奥特曼认为AI有可能发展成具备意识的超级智能,并以GPT-8为例,假设其能搞懂量子引力并讲述如何做到,以此论证AI的超级智能潜力 [1][8][22] 戴维·多伊奇的观点 - 戴维·多伊奇最初认为AI不会发展成为具备意识的超级智能,并指出现有系统(如ChatGPT)的能力是知识的副产物,而非真正的AGI [11][12][13] - 多伊奇强调“解释性创造力”和“过程故事”是判断智能的关键,认为真正通用的智能需具备主动选择动机的能力,而非机械输出 [18][19][21] - 多伊奇被奥特曼的GPT-8假设说服,认为如果AI能提供类似爱因斯坦发现相对论那样的“过程故事”,则可被视为具备超级智能 [22] 对话背景与影响 - 对话围绕AGI定义标准模糊、目标不断变化展开,引发网友讨论,有人认为AGI无法衡量,目标已转向ASI(超级人工智能) [3] - 多伊奇是量子计算奠基人,曾提出量子图灵机理论框架和Deutsch-Jozsa算法,为量子计算机发展奠定数学基础 [23][24][26]
吴泳铭的演讲把阿里市值又拉升了2000多亿 但「全栈」的护城河可能没那么深
第一财经· 2025-09-25 14:25
公司战略与愿景 - 阿里巴巴集团CEO吴泳铭提出超级人工智能(ASI)发展的三阶段框架:涌现智能、自主行动和自主学习,并认为行业目前处于第二阶段 [1][7] - 公司提出“大模型是下一代操作系统”和“AI Cloud是下一代计算机”的核心判断,将阿里云定位为AI时代的计算机,通义千问模型为其操作系统 [4][9][12] - 为支持ASI愿景,公司在原定3年3800亿元人民币的AI基础设施投入预算基础上,宣布将持续追加投入 [1][12] 技术进展与产品发布 - 阿里云发布通义千问模型的最强性能版Qwen3-Max,参数量超过万亿,据称性能接近Anthropic的Claude 4 Opus和OpenAI的GPT-5 [20] - 公司发布首款音视频一体化模型“通义万相Wan2.5-Preview”,支持10秒1080P高清视频生成及自动配音,但在多模态生成方面进度晚于Google和百度 [19] - 阿里云还发布了多模态理解模型Qwen3-VL和代码生成模型Qwen-Coder-Plus,强调其在模型能力上的持续进步 [16][20] 市场竞争地位 - 市场调研机构Omdia报告显示,阿里云在中国AI云全栈(IaaS、PaaS、MaaS)市场中占比35.8%,市场份额超过第二名到第四名的总和 [23] - 通义千问模型在《财富》中国500强企业中的渗透率达到53%,基于其开源版本的衍生模型数量在Hugging Face上已达17万,超过Meta的Llama系列 [15] - 若仅以token消耗量为维度,火山引擎以49.2%的市场份额位居中国公有云大模型服务市场第一,阿里云以27%的份额位列第二 [25] 市场反应与财务影响 - 吴泳铭在云栖大会阐述AI战略后,阿里巴巴港股股价单日大涨9.16%,公司市值增加约2546亿元人民币 [4] - 此前公司发布2025年第二季度财报后,因管理层透露将全面进入本地生活到店市场,股价单日大涨12.9% [2]