Workflow
超级人工智能(ASI)
icon
搜索文档
阿里吴泳铭勾勒ASI演进路线 全栈自研卡位全球竞争
环球网· 2025-09-28 10:25
阿里云人工智能战略定位 - 公司首次系统阐释通往超级人工智能的三阶段演进路径 明确阿里云作为全栈人工智能服务商战略定位 [1] - 通用人工智能已是确定性事件但仅是起点 终极目标是实现能自我迭代全面超越人类的超级人工智能 [1] - 愿景背后是阿里云在模型平台基础设施三层架构的全面发力 [1] 三阶段技术演进路径 - 第一阶段智能涌现特征为学习人 大模型通过理解人类知识全集涌现泛化智能与推理能力 [3] - 通义千问Qwen3-Max在AIME 25数学测试中获满分 印证智能涌现成熟度 [3] - 第二阶段自主行动核心为辅助人 是当前行业所处阶段 AI通过工具调用和编程能力与物理世界交互 [4] - 自然语言是AI时代源代码 用户用母语描述需求即可实现自主编写逻辑调用工具操作设备 [4] - 第三阶段自我迭代目标为超越人 AI需直接获取物理世界原始数据并通过自主学习实现模型架构自我优化 [4] - 该阶段需突破数据获取算法架构与能源支撑等多重瓶颈 [4] 全栈人工智能服务能力 - 模型层通过通义家族实现全模态全尺寸覆盖 Qwen3-Max在多项评测中超越GPT-5跻身全球前三 [5] - 通义万相2.5实现音画同步视频生成 通义百聆语音模型下载量超5.6亿次 [5] - 通义模型矩阵已衍生超17万个模型 总下载量突破6亿次 [5] - 平台层通过百炼平台提供模型定制与Agent开发服务 支持企业快速部署智能体 [5] - 夸克推出AI创作平台造点 集成通义万相与Midjourney V7降低视频创作门槛 [5] - 基础设施层提出超级AI云是下一代计算机 未来全球仅会有5-6个超级云计算平台 [6] - 公司凭借自研芯片存储系统与网络架构 成为中国唯一具备全栈自研能力的云厂商 [6] 资源投入与基础设施规划 - 为支撑超级人工智能算力需求 计划至2032年将数据中心能耗规模提升10倍 相当于新增数千亿级算力投入 [6] - 通过3800亿AI基础设施投入及10倍算力扩容为超级人工智能奠基 [4] 行业竞争格局与市场地位 - 全球仅阿里与谷歌同时具备大模型云计算与芯片三层能力 [6] - 优势在于全栈自研与联合创新 在模型即服务领域提前布局实现模型与云平台深度耦合 [6] - 中国500强企业中约70%已采用生成式AI 其中53%使用阿里云服务 [6] - 计入开源私有部署数据后实际渗透率更高 [6] 技术挑战与发展瓶颈 - 当前AI在工具调用与复杂推理上已有突破 但距自我迭代仍需解决原始数据获取多模态记忆自主反馈等难题 [7] - 网络延迟能源效率等基础设施挑战将制约AI规模化落地 [7] 产业生态与开发者战略 - 开源策略使公司成为全球开发者生态最活跃的AI平台之一 [5] - 开源策略成为争夺全球开发者关键 [6] 应用场景与合作伙伴 - 与英伟达合作推进具身智能落地 逐步实现从数字世界向物理世界渗透 [4] - 通过Vibe Working模式使AI成为超级助手 未来每个个体可能调度上百个Agent实现十倍百倍产出杠杆 [8]
当AI有了大脑和身体,世界将如何改变?| 品牌新事
吴晓波频道· 2025-09-28 08:31
公司战略与投资规划 - 公司首次系统性提出通往超级人工智能的三步走路径:第一阶段智能涌现已完成,第二阶段AI将掌握工具使用以辅助人,第三阶段AI将实现自我迭代并超越人类[11][13][14] - 公司宣布未来3年将投入3800亿元用于建设云和AI基础设施,该金额超过过去十年投资总和[18] - 公司致力于成为AI时代的Android,坚定开源开放路线,其通义系列模型已实现300多个模型、超过6亿次下载、17万个衍生模型的开源成绩[15] 技术架构与产品创新 - 公司发布七款通义系列新模型,旗舰模型Qwen3-Max拥有超过万亿参数,预训练数据量达36T tokens,性能超越GPT-5和Claude Opus 4跻身全球前三[23] - 下一代Qwen3-Next架构采用高稀疏度MoE结构,800亿参数模型仅激活30亿参数即可媲美2350亿参数模型性能,训练成本降低超过90%,推理吞吐量提升10倍以上[23] - 全模态模型Qwen3-Omni首次实现音视文多模态混合训练,视觉模型Qwen3-VL具备操作手机和电脑的视觉编程能力[23][24] - 公司推出新一代磐久128超节点AI服务器,单机柜集成128颗AI芯片,推理性能提升50%,并具备Pb/s级通信带宽和百纳秒级延迟[29] 开发生态与应用落地 - 阿里云百炼平台推出Agent开发框架ModelStudio-ADK,使开发者仅需1小时即可开发出深度报告生成项目,低代码平台ModelStudio-ADP支持非技术人员通过拖拉拽构建Agent应用[27] - 平台已聚集超过20万开发者构建80万个Agent,在汽车行业支撑95%中国车企智能化升级,贡献60%智能驾驶算力[28] - 网商银行贷款审核Agent能识别400多种细粒度物体,准确率超95%,将3小时人工审核任务压缩至5分钟内完成[28] 行业趋势与竞争格局 - 云栖大会参展企业类型多元化,涵盖车企、医疗、金融、农业等领域,出现AI超级交易所平台,显示AI应用呈现井喷式发展[33] - 阿里云成为全球四朵超级AI云中唯一中国公司,过去一年AI算力增长超过5倍,AI存力增长4倍多[33][35] - 公司计划将AI基础设施扩张至巴西、法国、荷兰、墨西哥等全球市场,云计算竞争将演变为全链条生态战[35][36]
第七次谈自定义Agent
国盛证券· 2025-09-27 21:48
行业投资评级 - 增持(维持)[3] 核心观点 - 自定义 Agent 代表 AI 交互新范式,从被动响应转向主动服务,OpenAI 的 ChatGPT Pulse 功能可在用户睡眠时持续研究并推送个性化内容,支持连接 Gmail 和 Google 日历以增强上下文理解,未来可能通过广告实现商业化 [1][12][18] - 阿里云在云栖大会提出 AGI 仅是起点,终极目标是超级人工智能(ASI),发展路径分三阶段:智能涌现、自主行动和自我迭代,阿里云定位全栈 AI 服务商,通义千问开源 300 多款模型,全球下载量超 6 亿次,衍生模型超 17 万个,并推进三年 3800 亿 AI 基础设施建设计划,目标 2032 年全球数据中心能耗规模较 2022 年提升 10 倍 [2][23][24] - 自定义 Agent 应用前景广阔,金融机构可构建个人投研知识库、智能群发助手、信息整理工具、个性化工作助理、AI 编程工具和生活助手,未来用户可通过创作 Agent 分享收益,如 AI 数字劳动力市场 MuleRun 已上线 [6][32][43] 行业动态与产品发布 - OpenAI 发布 ChatGPT Pulse 预览版,支持移动端专业版用户,功能包括主动研究、个性化更新和主题可视化卡片,用户可管理研究内容并通过点赞/踩提供反馈 [1][12][14] - 阿里云发布通义大模型家族 7 连发,旗舰模型 Qwen3-Max 在 Chatbot Arena 排行榜列第三,Qwen3-Next 架构训练成本较密集模型 Qwen3-32B 降低超 90%,长文本推理吞吐量提升 10 倍以上,多模态模型 Qwen3-VL 在 32 项测评中超过 Gemini-2.5-Pro 和 GPT-5 [2][26][28] 技术发展路径 - ASI 发展三阶段:智能涌现(大模型学习全球知识,具备泛化智能和推理能力)、自主行动(大模型通过 Tool Use 和 Coding 能力创建 Agent)、自我迭代(AI 连接真实世界数据并自主优化) [2][20][21] - 大模型被视为下一代操作系统,自然语言成为编程语言,Agent 是新的软件,Context 是新的 Memory,超级 AI 云是下一代计算机,需要更稠密算力和高效网络 [2][22][23] 应用场景展望 - 个人投研知识库:支持资料检索、分析和分享汇报,可导入调研纪要和访谈记录,实现协作和客户汇报自动化 [6][32] - 智能群发助手:分析聊天记录实现差异化群发和自动回复闭环 [6][34] - 信息整理工具:提炼微信消息、研报和公众号要点,支持个性化规则设置 [6][35] - 个性化工作助理:保存自定义设置,如要求输出时附权威来源链接 [6][37] - AI 编程工具:通过对话生成数据分析代码和实用工具,如底稿生成和报销助手 [6][40] - 生活助手:整合竞品平台查询,如美团"小美"测试点餐功能,未来可自定义跨平台 Agent [6][41] 商业化与生态发展 - Pulse 创新可能影响新闻和社交媒体消费习惯,未来通过广告商业化 [1][18] - MuleRun 作为全球首个 AI 数字劳动力市场,允许用户上传 Agent 并通过算力积分获取收益,平台抽成,实现低门槛开发和持续收益 [6][43] 建议关注公司 - 算力领域:寒武纪、海光信息、中际旭创、浪潮信息、中科曙光等 [7][47] - Agent 领域:阿里巴巴、腾讯控股、科大讯飞、用友网络、恒生电子等 [7][47] - 自动驾驶领域:江淮汽车、赛力斯、小鹏汽车、理想汽车等 [8][48] - 军工 AI 领域:拓尔思、能科科技、中科星图等 [8][48]
先进科技主题:阿里巴巴推进3800亿的AI基础设施建设,华为公布自研AI芯片路线图
上海证券· 2025-09-27 18:33
行业投资评级 - 电子行业评级为增持(维持)[2] 核心观点 - 人工智能产业正处于应用快速发展期 相应的基础设施建设也处于同样阶段 AIDC需求快速增加[8] - 大模型进入实用化阶段 人工智能正催生出大量全新的应用场景[8] - 短期涨幅过高后的回调下 重视PCB ODM AIOT AIDC板块的逢低布局机会[9] 市场回顾 - 本周上证指数报收3820.09点 周涨跌幅为-1.3% 深证成指报收13070.86点 周涨跌幅为+1.14% 创业板指报收3091点 周涨跌幅为+2.34% 沪深300指数报收4501.92点 周涨跌幅为-0.44%[5] - 中证人工智能指数报收2243.85点 周涨跌幅+1.17% 跑赢大盘[5] 重大行业动态 - 华为全联接大会2025公布最新昇腾AI芯片路线图:2026年第一季度推出昇腾950PR芯片 四季度推出昇腾950DT 2027年四季度推出昇腾960芯片 2028年四季度推出昇腾970芯片[7] - 华为鲲鹏CPU路线图:2026年四季度推出鲲鹏950 拥有96核心192线程和192核心384线程两个版本 2028年一季度推出鲲鹏960 拥有96核心192线程高性能版本和大于等于256核心512线程高密度版本 单核性能提升50%[7] - 华为全面开放超节点基础硬件 包括NPU模组 风冷刀片 液冷刀片 AI标卡 CPU主板和级联卡等不同形态硬件[7] - 阿里巴巴在2025云栖大会推出模型Qwen3-Max 并宣布积极推进3800亿AI基础设施建设[7] - 阿里巴巴计划到2032年使全球数据中心能耗规模提升10倍 意味着算力投入将指数级提升[7] - 英伟达与OpenAI宣布达成战略合作 OpenAI将建成并部署至少10吉瓦的AI数据中心 配备数百万块英伟达GPU[8] - 英伟达将在新系统落地过程中向OpenAI投资至多1000亿美元 首阶段系统目标于2026年下半年通过Vera Rubin平台上线[8] - 10吉瓦算力相当于400-500万块GPU 与英伟达今年预计出货量一致 是英伟达去年出货量的两倍[8] 技术发展趋势 - 目前我国单机柜功率正从当前的50kW向300kW甚至更高水平推进[8] - 超节点规模的扩展使单集群供电需求跃升至数百MW 远超现有数据中心单栋楼10-20MW供电能力[8] - 华为开放灵衢协议和超节点参考架构 允许产业界基于技术规范自研相关产品或部件[7] - 开源操作系统灵衢组件 用户可将源代码集成到现有操作系统中[7] 投资建议与重点公司 - PCB板块关注胜宏科技 东山精密 沪电股份 景旺电子 生益电子[10] - PCB设备板块关注芯碁微装 大族数控 东威科技 日联科技[10] - PCB材料板块关注天承科技 江南新材[10] - 自主可控板块关注芯原股份 翱捷科技 北方华创[10] - AI新消费场景板块关注泰凌微 思特威[10] - AIDC板块关注飞龙股份 潍柴重机[10] - 端侧ODM板块关注华勤技术 龙旗科技[10] 产能扩张情况 - 胜宏科技越南人工智能HDI项目总投资18.15亿元 产能15万平方米 泰国高多层印制线路板项目投资14.02亿元 产能150万平方米[11] - 沪电股份人工智能芯片配套高端印制电路板扩产项目投资约43亿元[11] - 深南电路泰国工厂投资12.74亿元 生产高多层和HDI产品[11] - 景旺电子泰国一期项目投资20亿元 产能10万平方米/月 计划2026年初投产[11] - 生益电子智能算力中心高多层高密互连电路板建设项目第一阶段产能15万平方米 2025年试生产 第二阶段产能10万平方米 2027年试生产[11] 财务数据表现 - 中际旭创2025Q2营业收入81.15亿元 同比增长36.25% 归母净利润24.12亿元 同比增长78.80%[17] - 新易盛2025Q2营业收入63.85亿元 归母净利润23.70亿元[17] - 沪电股份2025Q2营业收入44.56亿元 同比增长56.91% 归母净利润9.20亿元 同比增长47.01%[17] - 胜宏科技2025Q2营业收入47.19亿元 同比增长91.51% 归母净利润12.22亿元 同比增长390.14%[17] - 生益电子2025Q2营业收入21.89亿元 同比增长101.12% 归母净利润3.30亿元 同比增长374.34%[17]
高代码时代来临,阿里云百炼要让 Agent 真正跑在业务里
36氪· 2025-09-27 15:19
行业趋势与市场动态 - AI Agent成为企业提升效率的关键路径 普华永道调研显示79%的受访公司已在某些业务中应用AI Agent 其中66%实现生产力提升 57%实现成本下降 55%加快决策效率 54%提升客户体验 [1] - Agent平台成为互联网巨头竞争焦点 海外LangChain/LangGraph 微软AutoGen Google ADK升级 国内腾讯 华为 百炼在2025年9月集中推出和升级Agent平台 [1] - 低代码Agent平台存在局限性 依赖预定义编排逻辑 仅适合简单问答或流程自动化 难以处理跨系统调用 长链条任务和多轮反思决策 [2] 阿里云百炼平台战略定位 - 平台定位为企业提供AI Agent开发"土壤" 集成模型调用 框架搭建 资源调度 合规运维等全套能力 [4] - 基于完整技术栈构建产业链 顶层通义系列大模型 中间百炼企业级开发平台 底层云计算基础设施 [4] - 平台开发者生态规模显著 过去一年20多万开发者开发超80万个Agent [4] 平台技术架构与能力升级 - 推出ModelStudio-ADK高代码框架 突破预定义编排方式 支持自主决策 多轮反思和循环执行能力 [2][7] - 采用双轨并行开发模式 低代码ADP支持快速原型验证 高代码ADK支持复杂业务深度定制和大规模部署 [4][8] - 集成七大企业级能力矩阵 包括工具调用 记忆存取 动态推理调度 沙箱环境 全链路可观测性 支付通道 [2][5] 模型与组件能力建设 - 持续更新通义千问旗舰模型 Qwen3系列推理性能提升50% 决策成功率达90% [5] - 开放200多款业界模型调用接口 支持Qwen Wan DeepSeek等模型一键接入 [5][9] - 搭建Pay Server支付通道 成为业内首个面向企业级Agent的专业商业化支付解决方案 [5] 实际应用与性能表现 - 网商银行贷款审核应用处理26类凭证和400多种细粒度物体 识别准确率超95% 将3小时人工作业压缩至5分钟内 [12] - 平台模型月调用量过去一年增长15倍 承接千行百业AI应用开发需求 [5] - 开源DeepResearch Agentic-RAG Computer Use等示例项目 支持开发者直接体验和二次开发 [11] 技术演进与行业影响 - Agent技术从实验室试验向企业大规模生产演进 阿里云通过平台+框架+组件系统布局打通全链路 [12] - 高代码框架解决Agent规模化落地难题 保证复杂场景灵活性稳定性 补齐可控性 可观测性和商业化能力 [8][11] - OpenAI预测2025年AI代理将加入劳动力大军并改变公司产出 阿里云全栈AI能力正推动该趋势成为现实 [13]
阿里巴巴-W(9988.HK):2025阿里云栖大会:以大模型OS与AI云计算机重塑智能时代
格隆汇· 2025-09-27 11:05
核心战略定位 - 公司以超级人工智能(ASI)为终极目标 明确大模型是下一代操作系统与AI云是下一代计算机两大核心判断 旨在重塑AI时代计算范式 [1] - 公司提出从学习人到辅助人再到超越人的三阶段演进路线图 ASI致力于创造超级科学家以解决人类根本性科学难题 [1] - AGI只是起点 ASI目标致力于抢占未来AI领域战略制高点 [1] 大模型战略 - 发布性能跻身全球前三的Qwen3-Max旗舰模型 坚定选择开源路线 将通义千问打造为AI时代的Android [1] - 自然语言成为AI时代编程语言 Agent成为新软件 软件研发范式发生巨大变革 [1] - 发布全栈全模态通义全家桶 包括ModelStudio-ADK等开发框架 大幅降低AI应用门槛 旨在构建繁荣开发者生态 [1] 基础设施投入 - 发布自研磐久AI服务器和HPN 8.0高性能网络为代表的全栈AI基础设施 进行全面迭代 [1][2] - 宣布推进三年3800亿元AI基建投资计划 以应对未来数据中心10倍能耗规模增长 [1][2] - 超级AI云作为下一代计算机 支撑海量Agent应用 [2] 竞争战略 - OS加计算机的新范式 结合饱和式投入和开源生态战略 构筑未来全球超级云计算平台核心竞争力 [2]
吴泳铭给出了中国版的“加速主义”AI叙事
观察者网· 2025-09-27 11:02
阿里巴巴AI战略愿景 - 阿里巴巴CEO吴泳铭将通用人工智能(AGI)视为确定性事件,并视其为超级人工智能(ASI)的起点 [1] - AGI目标是将人类从80%日常工作中解放,ASI将创造超级科学家和全栈超级工程师,以指数级速度解决医学、能源、气候及星际旅行等难题 [3] - 阿里巴巴定位为全栈人工智能服务商,提供世界领先的智能能力和全球AI云计算网络 [4] 技术发展路径 - AI发展分为三阶段:智能涌现(学习人)、自主行动(辅助人)、自我迭代(超越人) [3] - AI需直接从物理世界获取全面原始数据,通过自主学习实现自我优化并跨越技术奇点 [3] - 大模型被定义为下一代操作系统,超级AI云被视为下一代计算机 [4] 行业投资与竞争格局 - 阿里巴巴宣布投入3800亿人民币建设AI基础设施,计划2032年将数据中心能耗规模提升10倍 [4] - 全球AI行业过去一年投资总额超4000亿美元,未来5年累计投入预计超4万亿美元 [6] - 全球AI云计算平台可能仅存5-6个超级集群,需整合数百万GPU及吉瓦级电力与冷却能力 [7] 国际视角与行业共识 - 雷·库兹韦尔预测2045年实现技术奇点,AGI于2029年实现并遵循计算能力每18个月翻倍的加速回报定律 [5] - 萨姆·奥特曼认为AGI将引发超级指数级经济增长,使个人生产力提升10-100倍 [5] - 中美AI投入差距显著:美国4家科技巨头过去5年资本开支总和达5.36万亿人民币,中国7家头部公司仅6300亿人民币 [6] 中国AI生态与厂商布局 - 中国AI云市场前五大厂商(阿里云、火山引擎、华为云、百度AI云、腾讯云)有望竞争全球5-6个超级平台席位 [8] - 阿里巴巴具备全栈技术能力,包括基础模型Qwen3-Max及深度整合的AI云解决方案 [7] - 阿里强调AI需与物理世界互动,通过真实场景数据驱动发展 [7]
周靖人解读阿里云大模型“七连发” 与OpenAI、谷歌比拼迭代与创新
中国经营报· 2025-09-26 19:51
阿里云大模型技术发布 - 阿里云在2025云栖大会上一口气发布七款大模型技术产品 覆盖语言、语音、视觉、多模态、代码等模型领域 在模型智能水平、Agent工具调用、Coding能力、深度推理、多模态等方面实现突破 [1] - 通义千问家族最大最强的基础模型Qwen3-Max预训练数据量达36T tokens 总参数超过万亿 在SWE-Bench Verified测试中Instruct版本斩获69.6分 位列全球第一梯队 在Tau2-Bench测试中取得突破性的74.8分 超过Claude Opus4和DeepSeek-V3.1 [2] - 通义万相Wan2.5-preview首次实现音画一体视频生成等功能 成为阿里迄今为止最强的全模态视觉生成大模型 首次采用原生多模态架构 涵盖文生视频、图生视频、文生图和图像编辑四大模型 [2] 多模态与语音模型发展 - 语音大模型通义百聆新发布语音识别大模型Fun-ASR和语音合成大模型Fun-CosyVoice Fun-ASR基于数千万小时真实语音数据训练而成 具备强大的上下文理解能力与行业适应性 Fun-CosyVoice可提供上百种预制音色 用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景 [3] - 通义大模型家族包含300个大模型 从0.5B到超万亿 覆盖LLM、编程、图像、语音、视频等"全模态" 满足从智能终端到云上的多场景需求 [3] 阿里云战略定位与竞争优势 - 阿里云定位为全栈人工智能服务商 提供世界领先的智能能力和遍布全球的AI云计算网络 向全球各地提供开发者生态友好的AI服务 [5] - 阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研 能够做到联合创新的云计算公司之一 全栈自研包括三部分 AI模型、Agent开发以及AI基础设施 [5] - 阿里云是全球前四里面唯一一个中国的云厂商 也是中国唯一具备国际影响力和具有国际很强大竞争力的云厂商 [6] 技术路径与投入规划 - 阿里云选择"全栈式"技术攻坚路径 从底层芯片到上层应用构建完整技术闭环 腾讯则秉持"生态融合"战略 将AI技术深度嵌入微信、游戏、广告等核心业务场景 更强调"场景化"技术落地策略 [6] - 阿里云积极推进三年3800亿元的AI基础设施建设计划 并持续追加更大投入 对比2022年GenAI的元年 2032年阿里云全球数据中心的能耗规模将提升10倍 [6] 行业趋势与判断 - 实现通用人工智能(AGI)已是确定性事件 大模型是下一代操作系统 大模型代表的技术平台将会替代现在苹果OS的地位 成为下一代的操作系统 [1][3] - AI将会替代能源的地位 成为最重要的商品 超级AI云是下一代的计算机 [5]
OpenAI 3万亿美元测试,AI首战44个行业人类专家
36氪· 2025-09-26 17:47
AI发展新阶段 - AI发展进入新阶段,关注点从通用人工智能转向超级人工智能,后者旨在全面超越人类智能 [1] - OpenAI研究路线图的下一个重点是推理,未来5年目标是打造能自动发现新想法、自动化研究工作的AI系统 [1] GDPval评估体系 - OpenAI推出全新评估体系GDPval,旨在基于真实工作任务审视AI进步轨迹,而非凭空臆测 [2] - 该评估体系覆盖9大行业、44种职业,涉及每年共计3万亿美元经济价值的真实工作任务 [12] - 任务集包含1,320个高度专业化任务,源于法律意见书、工程图纸等真实工作产出,其中220项为金标任务子集并已开源 [14] - 每项任务平均经历5轮专家评审,确保高度贴近实际工作场景、可由专业人士独立完成且具备明确评估标准 [16] - 与传统评估不同,GDPval要求模型处理完整参考材料与工作背景,输出形式包括文档、PPT、图表、电子表格甚至多媒体内容 [17] 模型性能表现 - 在220项金标任务盲测中,Claude Opus 4.1表现最佳,在接近一半的任务上产出与人类专家相当或更好 [7][21] - 从GPT-4o到GPT-5,模型在GDPval任务上的平均表现几乎翻倍,呈现线性进步趋势 [8][22] - 顶尖模型完成GDPval任务的速度和成本平均是人类的1%,约快100倍且便宜100倍 [24] - GPT-5在准确性方面领先,尤其擅长定位专业知识点,而Claude Opus 4.1在美学表现方面最强 [21] 评估方法与优化 - 评估依赖平均拥有14年从业经验的资深专家作为评分员,来自Meta、微软、高盛等顶尖机构 [29][30] - 专家在盲评中判断AI生成结果“优于”、“相当于”或“劣于”人类结果,并制定了详细评分标准 [32] - OpenAI开发了与人类专家评估一致性达66%的自动评分器,但因其局限性未取代人类打分员 [32][34] - 通过增量训练、扩大模型规模、增加推理步骤等方法,可实质性提升模型在GDPval上的性能 [26] 经济影响与未来展望 - GDPval被视为“后人类经济时代”的第一套会计体系,标志着AI产出开始计入GDP [19][20] - 评估表明AI能承接重复性强、结构清晰的任务,为人类腾出时间专注创造性工作 [35] - 当AI以补充而非替代人类的方式运作时,将为经济增长释放巨大潜力 [36]
阿里京东千亿对战!下一个十年的中国AI如何“出奇制胜”
钛媒体APP· 2025-09-26 14:47
公司战略与投入 - 京东集团CEO宣布刘强东亲自担任集团探索研究院院长 目标未来三年持续投入带动各产业形成万亿规模AI生态 [2] - 自2017年向技术转型以来 京东体系研发投入累计超1500亿元 [2] - 阿里集团CEO表示公司资本开支在3800亿基础上增加更多投入 瞄准超级人工智能(ASI)领域 [2] - 京东不追求运动式AI 强调可持续发展及为产业创造价值 提出AI价值公式为模型×体验×产业厚度² [3] 产品与技术发布 - 京东发布全新大模型品牌JoyAI 并推出三大AI产品:京犀(购物生活服务超级App)、他她它(数字人智能体应用)、JoyInside附身智能(机器人大脑系统) [2] - 阿里通义千问开源300多款模型 全球下载量超6亿次 衍生模型超17万个 号称全球第一开源模型矩阵 [9] - 京东零售研发团队开源大模型推理引擎Oxygent-9N-xLLM 实现零售业务5倍效率提升和90%成本优化 [3] - 阿里云提供一站式模型服务平台百炼 支持模型定制化及Agent快速开发 同时运营中国第一的AI基础设施和云计算网络 [10] - 京东发布JoyAgent 3.0智能体平台(100%开源 内部超3万个智能体运营)、JoyCode IDE 2.0代码平台(开发周期缩短30%)、数字人平台4.0(直播成本降至真人1/10)及JoyScale AI算力平台(支持10个国产异构算力调度) [15] 行业应用落地 - 京东在零售场景推出电商创新AI架构体系Oxygen 将于10月发布智能搜索推荐功能"爱购" [11] - 京东物流超脑大模型2.0实现多模态升级 标准化操作水平提升15% 人机协同效率提升20% [11] - 京东健康推出京医千询2.0大模型问诊及AI医院1.0 汇聚超千个专家医生智能体 [11] - 京东工业供应链大模型JoyIndustrial依托5710万工业品SKU数据 已服务超1万家重点工业企业 [11] - 阿里通义千问纳入To B端 夸克覆盖AI To C端 加速技术落地 [9] 技术性能与成果 - 京东JoyAI大模型在Rrbench评测中获得76.3分 推理能力国内第一全球第二 在AIME/GPQA等科学数据集处于第一梯队 [12] - JoyAI大模型拥有推理加速技术Q-EPLB 单块计算卡每秒吞吐达3000tokens 性能提升1.8倍 [12] - JoyInside附身智能接入超30家头部品牌硬件产品 对话次数平均提升超120% 与10家人形机器人品牌合作 [11] 行业发展与竞争格局 - 全球AI行业最近一年投资总额超4000亿美元 未来5年累计投入将超4万亿美元 [9] - 美国六大科技公司自ChatGPT发布后市值总额增长10.9万亿美元 英伟达市值增长3.9万亿美元涨幅超950% [5] - 2025年美国AI初创公司获2000亿美元风投 其中41%资金流向10家顶级AI公司 [13] - 中国AI产业呈现头部效应 互联网大厂凭借流量与用户规模优势在C端商业化能力远胜创业公司 [16] 技术演进方向 - 阿里提出通往ASI三阶段演进路线:智能涌现→自主行动(当前阶段)→自我迭代 [18] - 具身智能主要聚焦两个技术方向:强化学习与运动控制、基础模型与灵巧手交互 [12] - OpenAI推出ChatGPT新功能"Pulse" 实现从被动响应转向主动提供个性化服务 [14] - 谷歌DeepMind推出Gemini Robotics 1.5模型 使机器人能执行多步骤任务如分类洗衣和互联网搜索 [14]