AGI(通用人工智能)
搜索文档
中国智驾打响残酷突围战
华尔街见闻· 2025-11-27 20:17
行业核心观点 - 中国智能驾驶行业正经历激烈洗牌与权力版图重构 行业从百花齐放转向急速萎缩 市场不再相信PPT 唯有掌握百万级量产数据入口的玩家才有未来 [1] - 智能驾驶不再是锦上添花的配置 而是通往AGI(通用人工智能)时代的昂贵门票和船票 其终极目标是成为物理世界的大脑 [1][11][12] - 2025年是行业泡沫破裂的寒冬 也是价值回归的暖春 市场格局加速集中 最终可能仅剩两三家主要玩家 [14] 行业竞争格局与趋势 - 竞争维度已从比拼Demo转向比拼能否跨过“一百万辆”的物理门槛 达不到此量级的玩家将因数据单一而失去价值 [7] - 车企策略转变 不再盲目广撒网 而是整合内部资源或仅与极少数头部玩家深度绑定 [1] - 行业权力结构重塑 拥有“百万级”数据入口的玩家获得产业链绝对定价权 没有中间地带 要么做大成为平台 要么小而美后枯萎 [9][10] - 市场份额正加速向华为、Momenta、地平线等头部玩家集中 技术同质化、缺乏造血能力的腰部供应商正被出清 [14] - 未来格局将分为两类:掌握百万辆销量的自研派车企 以及服务于其余车企、通过联盟汇聚数据的超级Tier 1供应商 [15] 关键成功要素 - **数据规模是核心**:在端到端大模型时代 数据是算法进化的燃料 只有当车队规模达到百万级且日活足够高时 才能覆盖足够多长尾场景 驱动模型产生“智能涌现” [7] - **量产上车能力**:纯高速场景辅助驾驶难以形成有效数据闭环 商业模式存在问题 必须实现城市复杂场景的量产落地 [7] - **战略合作深度**:智驾供应商角色升级 从幕后零部件提供商转变为决定车型生死的战略合伙人 需要获得车企核心爆款车型订单 [8] 主要公司动态 毫末智行(负面案例) - 公司传出停工消息 其员工证实了该情况 [1] - 公司前身为长城汽车智驾系统前瞻部 2019年独立 曾获资本青睐 2021年一年内拿下两轮数亿元融资 [2] - 最新一笔融资为2024年上半年的超亿元B轮融资 但此轮融资已无长城汽车参与 [2] - 技术战略出现重大误判:硬件上押注重性价比的高通Snapdragon Ride芯片 而非行业主流的英伟达Orin 导致转向Transformer架构时适配困难 运行效率低下 [3];2023年7月行业风向转向“端到端大模型”时 公司技术高管仍公开持保留态度 错失技术代际升级时机 [3] - 客户开拓不力:除长城汽车外 对其他客户(如北京现代)的开拓不如人意 搭载其方案的车型屈指可数 [5] - 失去核心客户支持:因“PPT交付”等问题 长城汽车耗尽耐心 转而引入并独家投资了竞争对手元戎启行 [5] 元戎启行(正面案例) - 公司高调宣布拿下第三方辅助驾驶市场40%的份额 [1] - 从供应商焦灼战中胜出 拿下长城汽车核心车型订单 如魏牌蓝山、坦克500等 [7] - 为争取客户展现“狼性” 团队曾凌晨四点蹲守客户争取试驾机会 [8] - 搭载其方案的魏牌高山MPV月销量从年初的300台暴涨至2024年10月的近1万台 [8] - 技术路径上推出VLA(视觉-语言-动作)模型 使车辆具备思维链推理能力 以应对复杂路况 [11] - 推行“特斯拉路径” 利用量产乘用车数据和硬件升级实现L4 宣布使用成本仅20-30万的长城蓝山等量产车型落地Robotaxi 跑通其单位经济模型 [13] - 提出RoadAGI计划 目标是将智驾能力复用到人形机器人、物流机器人等更广阔的物理世界 [12] 卓驭科技(原大疆车载) - 公司获得一汽集团36亿元人民币的注资 拿到“国家队”背书 [1][8] - 交易核心价值在于保持独立运营的承诺 这使其能接入其他品牌数据 具备成为平台的价值 [9] - 一汽看中其性价比和开放性 在价格战惨烈的当下 这种能力是车企的救命稻草 [9] 地平线 - 公司副总裁称“每三台智能汽车中 就有一台搭载了地平线” [7] - 公司试图构建类似PC时代“Wintel”的芯片+算法生态联盟 [7] - 技术强调“直觉系统” 通过“一段式端到端”架构让车辆拥有类人的驾驶直觉 [11] - 与元戎启行类似 坚定选择“特斯拉路径” 利用量产车升级实现L4自动驾驶 [13] 技术演进与商业模式 - **技术范式转变**:行业从“高精地图+规则算法”时代 经“轻地图” 急速转向“端到端大模型”统治的下半场 [1][3] - **端到端大模型的核心价值**:让算法从僵硬执行代码 转变为能像生物一样流畅感知环境、博弈交互 甚至具备逻辑推理能力 [11] - **Robotaxi范式革新**:通过量产车数据和硬件实现L4的模式 打破了辅助驾驶与无人驾驶的界限 使Robotaxi从科研项目转变为消费级服务 粉碎了Waymo式重资产运营的壁垒 [13] - **“沿途下蛋”模式**:跑在路上的百万辆私家车既是出行工具 也是数据采集员 源源不断为高阶模型提供长尾场景数据 [13] - **智驾公司的终极愿景**:通过汽车训练端到端大模型和博弈策略 最终将能力复用到人形机器人等更广阔的物理世界 目标是成为物理世界的大脑 [12]
离开OpenAI后,苏茨克维1.5小时长谈:AGI最快5年实现
36氪· 2025-11-27 13:43
当前AI发展阶段的评估 - AI技术已实现但经济影响尚不显著,投资巨大但日常体验未发生根本改变[3] - 模型在评估测试中表现出色但实际应用效果和经济贡献存在明显滞后[4] - 模型能力存在"锯齿状"落差,常犯循环性低级错误,泛化能力差[5][6] AI模型训练与性能瓶颈 - 单纯堆数据与算力的"规模化"路径已见顶,预训练数据即将耗尽[5][17] - 强化学习训练使模型过于专注和狭隘,缺乏"意识"导致基础任务表现不佳[4] - 训练环境设计变量过多,可能无意中优化评估目标而忽视实际应用需求[6] - 模型像"应试专家",通过海量题目填鸭式训练成为答题高手但难以灵活应用知识[7] 价值函数与AI学习效率 - 价值函数被类比为AI的"情绪系统",可引导AI更高效、鲁棒地学习[5][14] - 价值函数能提供中间步骤反馈,加快学习过程,而非仅依赖最终结果评估[14] - 人类拥有内在价值感知,能快速自我纠正,而模型缺乏此类机制[25] - 情绪作为相对简单的价值函数机制,在进化中硬编码且至今有效服务人类[16] 行业发展阶段与范式转变 - 行业从2020-2025年的"规模化时代"回归到"研究时代",但拥有更强大计算资源[18] - 规模化"吸走了房间里的所有氧气",导致创新想法稀缺,公司数量远超新想法数量[28] - 强化学习正成为新的规模化目标,其计算投入可能已超过预训练[19] - 研究所需计算资源并非绝对最大规模,像Transformer最初仅在8-64个GPU上训练[29] SSI公司战略与差异化 - SSI已筹集30亿美元资金,专注于研究"直通超级智能"路径[5][30] - 公司不急于商业化,专注研究,与其他公司将资源用于推理和产品开发形成对比[30][32] - 采用不同的技术方法,主要区别在于技术路径,认为最终策略会逐渐收敛[52][53] - 计划可能调整,考虑渐进式部署,让AI在全球发挥作用并影响世界[33][34] 泛化能力与样本效率 - 模型泛化能力远差于人类,是当前最根本的问题之一[20][21] - 人类样本效率高可能与进化赋予的视觉、听觉和运动等先验知识有关[21][22] - 人类在语言、数学和编程领域的学习优势表明存在更高效的基础学习机制[23] - 人类学习更具无监督特性,所需数据样本少,过程更灵活和鲁棒[24][25] 超级智能发展路径与影响 - 人类级别AGI预计在5到20年内实现[5][55] - 超级智能可能表现为"超级智能的15岁少年",非常聪明但知识有限,通过部署持续学习[36] - 达到关键点后,广泛部署将引发快速经济增长,不同国家政策将导致增长差异[37][38] - 可能出现多个超级智能体,而非单一系统,形成专业化分工[58][59] AI对齐与安全策略 - 倡导构建"关心有情生命的AI",认为这比对仅关心人类更为稳健[41][45] - 随着AI能力提升,行业处理安全问题的方式将发生变化,公司会变得更加警觉[40][41] - 对齐策略最终会趋同,包括可靠沟通、确保最早超级智能是对齐的等目标[53][57] - 长期均衡可能通过人类与AI融合实现,例如通过改进版Neuralink成为半AI生物[47] 模型多样化与自我博弈 - 当前模型同质化严重,主要因预训练数据相似,强化学习是分化开始[61][62] - 自我博弈可通过计算而非数据创建模型,激励方法多样性[62][63] - 智能体间竞争自然促使差异化思考,是打破"模型同质化"的路径之一[5][63] - 完全复制相同思维收益递减,真正需要的是具有不同想法的智能体[60] 研究方法与理念 - 好研究应兼具简洁、优雅与对大脑机制的正确借鉴[5][64] - 研究需要"自上而下的信念",在实验结果与信念相悖时坚持方向[66] - AI应该具有特定"美学",思考人类本质但必须以正确方式理解[64] - 分布式表示、从经验中学习等概念受到大脑运作方式的启发[65]
Ilya重磅发声:Scaling时代终结,自曝不再感受AGI
36氪· 2025-11-26 14:54
当前AI技术路线评估 - 当前模型持续改进但无法实现AGI,现有技术路线后劲不足[3] - 真正可行的AGI系统架构至今尚未掌握构建方法[3] - 模型泛化能力远逊于人类,即使使用所有编程竞赛题目训练仍无法形成真正的解题直觉[3] - 评测结果与现实应用出现明显脱节,评估分数光鲜但实际性能滞后[5][8] - RL训练最终演变为对评估指标的过度优化,真正的奖励机制黑客是设计基准测试的科研人员[3][6] Scaling Law与预训练瓶颈 - 预训练时代已终结,行业正从Scaling时代走向研究时代[1][13][14] - 预训练最大突破是Scaling配方好用,但数据有限总有用光之时[12] - Scaling把行业创新空气吸干,导致公司数量远远多于点子数量[15] - 未来创新将回归小而美实验,类似AlexNet用两张GPU、Transformer用8-64块GPU的模式[16][18] - 已见证从预训练Scaling切换到RL Scaling,但RL非常烧算力且效率低[15] 模型泛化能力与学习机制 - 人类学习能力来自自进化硬编码的价值函数,情绪是决策系统一部分而非噪音[10] - 当前AI的价值函数训练方式脆弱粗糙,还不是内置的[11] - 预训练优势在于数据量大且无需刻意挑选,具有天然高度真实性[8] - RL训练让模型目标变得单一狭隘,削弱全局感知能力[5] - 模型在基础任务上表现不佳,如在修复bug时会反复犯同样错误[5] AGI/ASI发展路径与影响 - ASI可能在5-20年内降临,实现人类级别学习能力后变得超越人类[3][51] - 超级智能不是完成形态心智,而是能够学会做每一项工作的心智[29][30] - 部署将包含通过试错学习时期,是过程而非直接投放最终成品[29] - 一旦实现这种学习算法,可能会迎来一波快速的经济增长[32] - AGI与AI的本质区别在于力量,当力量很大时会发生难以想象的事情[38][40] 行业趋势与安全考量 - 随着AI变得更强大,政府和公众会产生做点什么的愿望,公司将更加充满危机感[43][44] - 竞争激烈的公司开始在AI安全方面合作,OpenAI和Anthropic已迈出第一步[44] - 构建稳健对齐、专门关爱有感知生命的AI比仅关爱人类生命的AI更容易[48][49] - 渐进主义将是任何AGI计划与生俱来的组成部分,逐步发布可分散冲击力[19]
阿里巴巴最新披露!
证券时报· 2025-11-24 19:09
公司战略与产品发布 - 阿里巴巴旗下AI助手千问APP公测一周下载量超过1000万次,成为史上增长最快的AI应用 [1] - 公司于11月17日正式推出千问APP,接入开源模型Qwen3并免费开放,旨在与ChatGPT展开全面竞争 [1] - 千问APP定位为“会聊天能办事的个人AI助手”,未来计划逐步增加智能体AI功能,并计划通过海外版本向全球扩张 [1] - 公司计划将地图、外卖、订票等生态服务接入千问APP,旨在打造统一的AI服务入口 [1] - 阿里巴巴正以“用户为先,AI驱动”为核心战略,投入重金构建从底层算力到上层应用的整体生态 [2] 管理层愿景与行业展望 - 阿里巴巴CEO吴泳铭指出,实现AGI是确定性事件,终极目标是发展出ASI以解决重大科学难题 [2] - 管理层认为未来“自然语言就是AI时代的源代码”,任何人都能创造自己的Agent [2] - 随着千问APP与淘宝、高德、钉钉等应用打通,预计将强化阿里整个生态的用户黏性和活跃度,创造协同价值 [2] 资本开支与市场竞争力 - 高盛报告上调对阿里巴巴的资本开支预测,预计2026至2028财年的合计资本开支将达到4600亿元人民币,高于此前3800亿元的目标 [2] - 高盛认为AI推理需求的激增是支撑资本开支增长的核心逻辑,更高的计算效率可能提升资本开支向云收入的转化率 [2] - 中国多模态大模型凭借开源、低价和高速度等策略在全球市场形成差异化竞争优势 [3] - 中国AI模型的全球应用增加,例如爱彼迎正大量使用阿里巴巴的Qwen模型支持其客服代理,显示中国开源AI模型获得全球市场认可 [3]
新BAT逐鹿AI to C
北京商报· 2025-11-23 23:32
蚂蚁集团发布“灵光”AI助手 - 蚂蚁集团于11月18日发布全模态通用AI助手“灵光”,支持安卓与iOS系统,上线首日下载量突破20万,上线4天下载量超100万 [1][2] - “灵光”核心功能为“自然语言30秒生成可运行小应用”,首批上线三大功能包括“灵光对话”、“灵光闪应用”和“灵光开眼”,支持3D、音视频、图表等全模态信息输出 [2] - 产品实测显示,输入“做一个像素画生成器”指令后,灵光可在约1分钟内生成具备画布调节、画笔颜色选择等功能的简易应用 [2] 阿里巴巴推出“千问”App - 阿里巴巴于11月17日推出基于Qwen3开源模型的“千问”App,主打免费策略与生活服务整合,声称与ChatGPT展开全面竞争 [1][3] - 千问App定位为“生产力工具”,致力于打造“会聊天能办事的AI个人助理” [3] - 阿里系通过“千问”与“灵光”形成“通用覆盖+垂直深耕”的矩阵,覆盖全用户层级 [1][3] AI to C市场竞争格局 - 字节跳动“豆包”以1.72亿月活位居中国原生AI App首位,腾讯“元宝”依托微信社交生态渗透场景 [6] - 行业竞争焦点从单纯对话能力转向AI的“办事”能力,即调用服务完成用户任务,争夺AI时代超级流量入口 [6] - 竞争核心从单一产品比拼升级为集团资源整合能力较量,字节依赖流量生态,腾讯依托社交网络,阿里系整合场景资源 [1][7][10] 行业发展趋势与挑战 - 2025年被业内视为AGI元年,AI范式从聊天转向更复杂的智能体应用,能够从经验中学习并适应新环境 [2] - 行业面临高质量场景数据匮乏、AI落地成本高、用户需求与产品功能匹配度不足等痛点 [9] - 下一个竞争焦点或为“场景化解决方案的落地效率”,即AI能力与真实需求的深度绑定 [9] - 长期趋势为AI从“锦上添花的助手”转变为“无处不在的基础设施”,推动工具化AI普及 [10]
“千问恐慌”背后:全球AI价值正在重估
环球时报· 2025-11-22 06:45
中国AI大模型产业格局与竞争态势 - 中国AI市场从“百模大战”迈入差异化竞争新阶段,DeepSeek、豆包、Kimi、千问、文心等模型成为国内外媒体常客[1] - 阿里巴巴正式宣布“千问”项目进入AI to C市场,计划将地图、外卖、办公、学习、购物、健康等各类生活场景接入千问APP[3] - 科技巨头和初创企业都在追求打造“国民级”AI应用,爆发窗口期预计在2026年下半年至2027年中期开启[10] 技术能力与性能表现 - 百度发布原生全模态文心大模型5.0,支持文本、图像、音频、视频等多种信息的输入与输出[3] - 豆包大模型日均Tokens调用量已突破30万亿,相比今年5月底增长超80%[3] - 中美顶级AI大模型性能差距大幅缩至0.3%,接近抹平[15] - 中国大模型用美国同行10%的算力成本实现其90%甚至95%的性能[16] - 谷歌Gemini 3 Pro模型超越GPT-5.1登顶智力指数榜单,月之暗面Kimi K2 Thinking模型排名第三[18] 商业化应用与市场拓展 - 千问APP展现出强大办事能力,几秒钟即可完成研究报告并制作成精美PPT[3] - MiniMax的AI视频生成平台“海螺AI”受全球超200个国家和地区用户欢迎,已帮助创作超3.7亿个视频[7] - 技术焦点集中在“系统2”思维能力的构建,让AI具备逻辑推理、自我反思和纠错能力[17] - 许多AI应用首月用户流失率高达80%-90%,产品需要从“好玩”进化为“有用”[10] 国际化进展与全球影响 - 中国AI模型凭借创新力和成本优势加速“出海”,全球开发者转向中国开源系统[11][13] - 千问累计下载量达3.85亿次,超越Meta的Llama系列(3.46亿次)[13] - 近期发布的新语言模型中超过40%基于千问架构[13] - 风险投资家查马斯·帕里哈皮蒂亚透露合作企业已转而使用月之暗面的Kimi K2模型[12] - 爱彼迎客服助手依赖十余种AI模型,阿里巴巴千问系列占据主导地位[12] 产业发展趋势与战略差异 - 中国企业战略侧重点在于“铺地”,争夺场景渗透率和推理成本[17] - 美国企业战略侧重点在于“封顶”,堆叠算力集群验证缩放定律[17] - 美国主流企业采取闭源策略,中国主流企业多采取开源策略[16] - 中国优势在于丰富的工业与消费场景数据及工程落地能力[17] - 美国优势在于先进GPU集群和顶尖算法科学家[17] 未来发展方向 - 真正的爆发点要等待端侧AI硬件渗透率突破30%[10] - 未来18个月是各类垂直应用残酷的淘汰赛[10] - 中国AI“走出去”需要通过差异化的地缘政治经济策略实现[18] - 潜在黄金场景在于东盟、中东及共建“一带一路”国家[18] - 输出路径应从“单一产品”转向“主权AI”解决方案[18]
中国AI编程赛道,谁能跑到最后?
36氪· 2025-11-20 19:34
AI编程的全球市场潜力与商业价值 - AI编程被视为技术迭代最快、商业化路径最清晰、用户渗透率最高、资本认可度最强的AI应用之一[1] - 典型公司Cursor在2022年创立后估值飙升至99亿美元,年化经常性收入突破5亿美元,付费用户超36万,日活用户达100万,覆盖1.4万家企业客户[1] - 全球约3000万软件开发者,AI编码工具可提升至少20%生产力,最优场景下生产力可翻倍,相当于每年创造3万亿美元GDP贡献,堪比法国GDP[1] - AI编程生态系统有潜力支持数十家数十亿美元公司,甚至是一个万亿美元级巨头[1] AI编程的战略重要性及中国市场特殊性 - 大模型的编码能力被视为通往通用人工智能的必经之路,因为智能体可以自主编码,理论上能解决无限复杂的问题[2] - Cursor停止向中国大陆提供美国模型,加之数据隐私保护要求,使中国绝大多数企业级用户不会轻易使用境外AI应用,为国产工具留下巨大发展空间[2][3] - 2024年美国91%的开发者使用AI编程工具,而中国仅30%,显示中国市场渗透率有巨大提升空间[4] - 2024年阿里、字节、腾讯、百度等厂商在中国市场的AI编程产品收入在千万量级,预计整体市场规模将大幅增长[4] 中国AI编程市场竞争格局与厂商动态 - 2023年主要科技公司已拥有AI编程产品,但主要内部使用,2024年上半年开始高调推广并打起"免费战"[5][6] - 字节跳动1月上线国际版Trae,3月落地国内版,采取激进的低价策略,国内版完全免费,国际版定价大幅低于竞品,上线不到半年月活用户突破100万[8][11] - 百度、腾讯、阿里、华为等公司纷纷推出免费或低价的个人版产品,形成免费为主流、付费为补充的C端定价局面[11] - 主要玩家加速产品升级,推出自研AI IDE,如字节Trae、阿里通义灵码AI IDE、百度文心快码Comate AI IDE、腾讯CodeBuddy IDE,实现从需求到上线的完整开发平台[12] 产品形态演进与开发者生态建设 - AI编程工具从插件式助手发展为独立IDE,功能从代码补全扩展到需求分析、架构设计、测试用例生成、部署运维等全流程[12] - 独立IDE能提供更好的用户体验,并具有流量入口价值,模型差距缩小后,竞争焦点转向用户入口和独立IDE产品[13] - Cursor成功的关键在于基于VS Code内核和开源插件生态,让开发者感到熟悉,无需重新学习,而中国厂商推自研IDE面临更大挑战[21][22] - 厂商通过绑定自有资源如云服务、社交场景来建设开发者生态,并将AI编程工具作为云服务入口,带动AI大模型和云资源消耗[23] 企业市场现状与挑战 - IDC数据显示31%已探索生成式AI的企业使用了AI编码工具,科技公司使用率最高,金融、通信等数字化基础高的行业跟进[26] - 腾讯超过90%工程师使用CodeBuddy,50%新增代码由AI辅助生成,百度2025年二季度AI生成代码超43%,字节超80%工程师使用Trae[26] - B端项目面临强定制化和碎片化挑战,企业付费意愿不强,40%企业认为AI对软件质量改善不明显,因企业软件工程基础薄弱[31] - 项目客单价不高,竞争激烈导致价格战,如预算100万元项目最终中标价不到40万元,影响大厂团队资源争取[32] 创业公司机遇与市场未来展望 - 创业公司数量稀少,2023年至今敢进入该领域的团队不多,行业共识是AI编程主要是模型厂商的机会[13][14] - 大厂以做C端为主,急于用标准化产品圈住开发者,B端定制化需求优先级低,为创业公司留出发展窗口期[29] - 工具类产品需要大量用户反馈和多场景验证才能迭代,创业公司可能不具备大厂的条件,如腾讯CodeBuddy内部运行十个月收集了5000多个问题[15] - 中国AI编程市场仍处于蓝海阶段,未来可能出现不同维度的工具服务不同用户和研发流程,产品形态仍在快速演进中[33]
独家 | 通义核心人才相继“叛逃”,阿里双管齐下:砸天价年薪揽才+竞业锁喉
钛媒体APP· 2025-11-19 16:37
公司战略转向 - 阿里巴巴于2024年底启动AI战略重大转向,从长期深耕B端企业服务转向聚焦C端大众市场布局[2] - 公司宣布未来三年将投入至少3800亿元用于云计算与AI基础设施建设,该金额超过过去十年在相关领域的投入总和,覆盖算力部署、模型研发及AI云计算全链条[2] - 2025年9月云栖大会期间,公司CEO吴泳铭明确推进该投资计划并披露追加后续投入规划,进一步聚焦AI驱动的业务增长路径[2] 核心产品与技术 - 2025年11月17日,公司正式宣布“千问”项目全力进军AI to C市场,千问App公测版同步上线,基于全球性能领先的开源模型Qwen3,凭借免费策略及与阿里生态生活场景深度绑定,与ChatGPT展开全面竞争[1] - 千问App的核心竞争力聚焦“世界模型”,目标是构建“理解生成一体化”的模型,让AI同时实现“交互”与“创造”,既能理解信息,也能生成内容、理解世界规则并预测变化[4] - 技术路线上探索Autoregressive LLM、Diffusion及两者结合的路线,同时攻关多模态训练数据、自动化评估等,向AGI推进[4] - 2025年9月云栖大会发布的通义千问旗舰模型Qwen3-Max综合性能跻身全球前三,总参数超万亿,预训练数据量达36T tokens,其Instruct版本在SWE-Bench Verified编程测试中获69.6分,位列全球第一梯队;Tau2-Bench智能体工具调用测试中取得74.8分,超越Claude Opus4和DeepSeek-V3.1;推理增强版本在AIME 25和HMMT高难度数学测试中斩获满分[6] - AI智能体生态已形成规模,通过打通淘宝、天猫、高德、饿了么等内部核心业务数据与授权能力,千问App已具备解决用户多元生活需求的服务能力[6] 研发体系与架构 - 通义千问实验室与阿里达摩院形成“基础研究 + 应用攻坚”的协同模式,通义千问实验室承接达摩院在机器智能、多模态融合等领域的基础研究成果,专项负责模型迭代优化与场景落地应用[7] - 相较于OpenAI“研究实验室 + 产品部门”的一体化架构,阿里的协同体系更侧重技术产业化效率[7] - 通义大模型研发体系由阿里云CTO、达摩院副院长、通义实验室负责人周靖人统筹管理,下设自然语言智能实验室、语音实验室、应用视觉实验室、智能计算等二级部门[8] 人才战略与流动 - 公司通义团队正以显著高于市场平均水平的薪资力度大规模招募AI人才,部分岗位薪资翻倍,整体溢价超50%,核心专家岗位薪酬较百度文心、字节火山大模型同级别岗位具有30%-50%的竞争力优势[25] - 薪资结构采用“基础薪资 + 高额期权 + 专项奖金”组合模式,资深技术专家可获得极具竞争力的基础年薪与长期期权激励,特别优秀的应届博士人才年薪可突破百万级[27] - 核心招募方向聚焦多语言大模型和世界模型两大赛道,多语言大模型赛道重点突破低资源语言处理、跨文化语义理解等,千问系列模型已支持119种语言和方言,全球累计下载量突破6亿次[27] - 世界模型研发被视为向AGI进军的战略支点,重点探索Autoregressive LLM与Diffusion模型结合的创新架构[28] - 招聘筛选标准极为严苛,候选人需具备计算机/人工智能相关专业硕士及以上学历,在顶级学术会议发表至少2篇一作论文,且至少1篇聚焦多语言或跨文化语义理解方向[29] - 公司同步启动“全球揽才计划”,面向斯坦福、MIT、剑桥等国际顶尖高校精准招募,侧重具备跨文化背景的“双语 + AI”复合型人才[30] 关键人才变动 - 语言技术实验室前任负责人司罗已离职,现任斑马智行CTO,目前该实验室自然语言处理方向由黄非领衔[13] - 应用视觉团队负责人薄列峰于2025年6月前离职,其主导研发了人物动作生成框架Animate Anyone、一键换装技术Outfit Anyone等爆款技术,离职后加入腾讯混元大模型团队[14][16] - 语音团队负责人鄢志杰于2025年2月15日离职,后加入京东探索研究院出任语音实验室负责人,该岗位空缺后,公司于6月初引入原零一万物联创兼VP李先刚出任通义语音实验室负责人[17][19] - 智能计算实验室技术骨干周畅于2024年7月从阿里离职,后加入字节跳动,公司以其“违反竞业协议”为由提起劳动争议仲裁[23] - 2025年5月,32岁的通义千问开源负责人林俊旸晋升,成为公司最年轻P10级专家,同步统筹多模态与具身智能研究[23] 竞业限制策略 - 公司通过严苛的竞业限制协议构建技术壁垒,绝大多数算法工程师岗位需签署竞业限制协议,限制期限为离职后1至2年,覆盖百度、腾讯、字节跳动等国内互联网AI巨头及商汤、旷视等AI企业[31] - 作为竞业限制对应补偿,公司按员工离职前12个月平均工资的30%-50%按月支付补偿金,向资深算法专家盖坤支付的月补偿金达47500元,对应年度补偿金超57万元[31] - 对于违反竞业协议的行为采取“零容忍”追责态度,除对周畅提起超千万元索赔外,盖坤离职后化名加入快手,被法院判决返还已领取的补偿金33万余元,并支付违约金207万余元[31]
谷歌Gemini 3夜袭全球,暴击GPT-5.1,奥特曼罕见祝贺
36氪· 2025-11-19 08:07
产品发布核心 - 谷歌正式发布新一代旗舰人工智能模型Gemini 3 Pro,该模型被定位为“史上最强推理+多模态+氛围编程”三合一的AI模型 [1] - 此次发布标志着公司在通往AGI的道路上迈出重要一步,被视为开启了AI的下一个时代 [3][9] - 发布获得了行业高度关注,包括OpenAI CEO在内的业界人士表达了祝贺 [1] 核心性能优势 - 在多项关键基准测试中,Gemini 3 Pro性能相较于前代Gemini 2.5 Pro实现全方位跃升,并在多项测试中超越竞争对手包括GPT-5.1和Claude Sonnet 4.5 [3][4][18] - 模型在LMArena排行榜上以1501 Elo分数名列榜首,在WebDev Arena排行榜上以1487 Elo分数登顶,展示了顶尖的推理和编码能力 [5][6][31] - 其核心优势体现在博士级推理能力,在Humanity‘s Last Exam测试中取得37.5%(无工具)和45.8%(使用搜索和代码执行)的成绩,在GPQA Diamond测试中取得91.9%的成绩 [4][17] 多模态与复杂任务处理能力 - 模型具备世界领先的多模态理解力,能处理文本、图像、视频、音频、代码等多种信息形态,在MMMU-Pro测试中获81.0%高分,在Video-MMMU测试中获87.6%高分 [4][19][28] - 在长程规划和智能体任务方面表现卓越,在Vending-Bench 2测试中以平均净值$5,478.16的成绩大幅领先于其他模型,展示了出色的长期规划能力 [4][38][40] - 模型具备100万token的上下文长度,能够帮助用户以个性化方式进行学习,例如破译手写食谱、分析教学视频并生成训练计划等 [28][30] 编程与开发能力 - Gemini 3在“氛围编程”和智能体编码方面实现突破,能够根据简单提示生成美观灵动的应用和复杂的Web UI [14][31][34] - 在编码基准测试中表现强劲,在LiveCodeBench Pro测试中获得2,439 Elo评分,在SWE-Bench Verified测试中取得76.2%的成绩 [4][32] - 公司同步推出革命性智能体开发平台Google Antigravity,该平台与Gemini 3紧密集成,允许开发者以任务为维度与智能体协同,实现端到端的软件任务开发 [42][45][47] 市场应用与生态整合 - 即日起,Gemini 3 Pro预览版全面上线,而更高级的Deep Think模式将稍后向Google AI Ultra订阅用户开放 [11][41] - 模型的API定价针对不同上下文长度设定,对于不超过20万token的请求,输入价格为每百万tokens $2.00,输出价格为每百万tokens $12.00 [24] - 模型已接入Google AI Studio、Vertex AI等多个开发平台,并与Cursor、GitHub、JetBrains等第三方平台集成,供全球开发者使用 [36] 技术实现与行业影响 - Gemini 3完全在谷歌自研的TPU上完成训练,这被视为公司重要的技术护城河 [54] - 早期实测演示显示模型能力强大,可一次性生成复杂的3D乐高编辑器、重现经典iOS游戏甚至构建Game Boy模拟器,展示了其在游戏开发和复杂应用构建上的潜力 [48][49][52] - 模型的发布在行业内引发广泛关注和讨论,一系列实测Demo展示了其在实际应用中的卓越表现 [48][52]
开战!阿里千问App公测,与ChatGPT正面交锋
证券时报· 2025-11-17 17:22
公司战略与产品发布 - 阿里巴巴于11月17日正式官宣“千问”项目并上线千问APP公测版,全力进军AI to C市场 [1] - 公司定位千问APP为“会聊天能办事的AI个人助理”,全面对标ChatGPT,并免费开放 [2] - 未来计划逐步增加智能体AI功能以支持淘宝等平台的购物功能,并计划通过海外版本向全球扩张 [1] - 公司计划将地图、外卖、订票等生态服务逐步接入千问APP,试图打造统一的AI服务入口 [2] 产品功能与技术基础 - 千问APP基于公司自研的全球性能第一的开源模型Qwen3打造,展现出多场景服务能力 [2][4] - 产品功能覆盖专业领域和生活场景,可快速处理研究报告、提取论文要点,并提供健康咨询、拍照识物等服务 [2] - 千问APP已在中国各大应用商店上架,同步提供网页端和PC版,未来还将上线国际版 [3] - 千问大模型家族已形成包含300多款模型的体系,囊括文本、编程、图像、语音、视频等全模态,覆盖从0.5B到480B的全尺寸参数规模 [4] 市场影响与生态协同 - Qwen模型在全球范围内被亚马逊、苹果、英伟达等科技巨头采用,在中国企业级市场占有率稳居第一 [4] - 千问APP的推出旨在将阿里生态内分散的AI能力整合到统一入口,形成聚合效应,2025年“双11”购物节已成为阿里AI应用的一次大检阅 [6] - 千问APP与淘宝、高德、钉钉等应用的打通,预计将强化整个生态的用户粘性和活跃度,创造协同价值 [7] - 公司以“用户为先,AI驱动”为战略,构建从底层算力到上层应用的完整生态,终极目标是发展出超级人工智能以解决重大科学难题 [6]