生成式AI
搜索文档
海光终止合并中科曙光 国产算力产业协作未歇
中国经营报· 2025-12-20 22:31
重组终止事件核心 - 海光信息与中科曙光筹划近半年的重大资产重组正式终止,原因是交易规模大、涉及方多、市场环境发生较大变化,实施条件不成熟 [1] - 重组原意在于推动产业链纵向整合,提升国产算力体系的协同效率与国际竞争力,但两家公司均为头部企业,资产体量庞大,方案论证复杂,最终未能达成 [1] - 双方表示长期产业协同与合作不受影响,海光信息将继续专注高端CPU与DCU芯片设计,中科曙光将持续完善“芯片—服务器—液冷—算力服务”全链条布局 [1] 重组方案与市场反应 - 重组方案于6月初出炉,海光信息拟以换股方式吸收合并中科曙光,海光信息换股价为143.46元/股,中科曙光换股价为79.26元/股,换股比例为0.5525:1,交易拟购买资产成交金额达1159.67亿元 [3] - 合并完成后中科曙光将终止上市,旨在打通“芯片设计—硬件制造—软件服务”全产业链 [3] - 市场对重组协同效应的预期推动股价走高,海光信息股价最高涨至277.98元/股,中科曙光最高触及128.12元/股,两家公司市值合计一度突破6500亿元 [4] 终止原因分析 - 分析师认为,超大规模市值企业间的整合涉及技术标准统一、人员协同、渠道整合等复杂问题,尽职调查与方案论证周期漫长,而算力行业技术迭代快,时间窗口易错失 [4] - 市场环境发生剧烈变动是关键变量之一,重组预案发布以来,国产算力行业迎来政策与竞争的双重变局 [4] - 政策层面,国家明确“促进多元异构算力融合发展”,鼓励差异化协作 [4] - 市场竞争加剧,华为昇腾、寒武纪等企业加速技术突破,行业呈现“开放协同”与“全栈生态”双轨并行格局,双方独立发展的优势日益凸显 [5] - 市场给头部企业的独立成长空间在扩大,合并带来的规模效应或许已不如快速响应市场的灵活度重要 [6] - 中科曙光官方表示,未来两家企业可作为国产算力“双核心”,避免因整合后的战略失误或技术瓶颈影响整个产业发展节奏,降低产业单一化风险 [6] 行业市场现状与趋势 - 在AI模型训练与推理需求爆发的背景下,国内算力产业链上下游仍有广阔的市场合作空间,产业协作趋势不会改变 [2] - IDC数据显示,2025年上半年,中国加速服务器市场规模已达约160亿美元,同比增幅超过100%,并预计到2029年将进一步放大至上千亿美元级别 [2][7] - 生成式AI的爆发式增长催生了“大模型+大算力+大数据”的全新范式,单一企业难以再覆盖全产业链环节 [7] - 我国算力总规模已位居全球第二,2025年上半年中国加速服务器市场规模约为160亿美元,同比增长超过一倍 [7] - 中国AI加速服务器市场正在经历规模扩张和本土替代的阶段,未来产业竞争焦点将从单芯片性能转向系统能效比、开放生态协同和绿色算力成本控制 [9] 产业协作模式展望 - 政策红利与市场需求成为协作的首要驱动力,“东数西算”工程要求到2025年年底,国家枢纽节点新增算力占全国60%以上 [7] - 巨大的市场空间为“芯片、整机”之间既竞争又合作的生态创造了空间,芯片厂希望与整机厂深度绑定快速放量,整机厂则希望保持对多家芯片方案的选择权 [8] - 国产算力产业整合协作呈现出两条并行逻辑:一是“联合向上整合”,通过垂直整合形成闭环能力;二是“平台化兼容”,构建开放的产品兼容层,使不同供应商的产品能够并行运作 [8] - 资本市场对算力企业的估值波动,推动了产业参与者更谨慎地选择合作路径,未来协作更可能以项目级、产品级与标准层面的联合为主,而非大规模股权整合 [8] - 生态构建的核心可能将转向更为细分的工程化协作,行业需避免低水平重复建设,通过技术协同与标准优化提升国际竞争力 [8][9]
世界正在重新认识中国
新浪财经· 2025-12-20 16:26
英伟达CEO黄仁勋对中美AI竞争的观点 - 英伟达CEO黄仁勋在私人晚宴上表示,未来5到10年生成式AI的竞赛“中国会赢” [2][4] - 其核心论据是中国有约100万人7天24小时投入AI工作,而整个硅谷全职做大模型的员工最多仅2万人 [2] - 黄仁勋批评美国对中国的出口管制是“他们干过最愚蠢的事情”,认为这相当于美国自己把胜利拱手相让 [2] 西方世界对中国认知的转变 - 长期以来,西方社会对中国存在巨大认知鸿沟,其印象多停留在改革开放前的封闭阶段,并先后出现“中国崩溃论”与“中国威胁论” [5] - 近期转变始于两个层面:一是美国年轻人通过TikTok事件接触到中国“小红书”等平台,对比中美物价与品质后改变了看法;二是中国对多国实行免签政策后,大量外国游客亲身到访,目睹了中国的城市建设、高铁等发展,彻底翻转了原有印象 [6] - 包括《世界是平的》作者托马斯·弗里德曼、特斯拉CEO埃隆·马斯克在内的知名人士访问中国后,公开表达了“我看到了未来,它不在美国”、“中国就是未来”等观点,正在引领西方重新认识中国 [8][9] 对中国发展模式的分析 - 经济学家理察·沃尔夫指出了中国特色社会主义市场经济的优点,即民营企业追逐效率与利润,国有企业兼顾社会公平与正义 [8] - 分析认为,中国政治体制的两个特色支撑了其发展:一是一党执政能进行国家长远战略规划;二是地方官员有为争取仕途升迁而拼政绩的积极性,深圳与杭州近年来的出色表现可为此佐证 [8]
拉瑞安CEO为《神界》用AI辩护,引发粉丝与前员工不满
搜狐财经· 2025-12-20 11:36
IT之家 12 月 20 日消息,据科技媒体 NoteBook Check 昨天报道,拉瑞安工作室 CEO Swen Vincke 近日对《神界》游戏早期开发阶段使用生成式 AI 做出辩 护,随即引发前员工、粉丝质疑。 据报道,拉瑞安工作室在 TGA 2025 游戏大奖上以神秘方式公布《神界》,随后 CEO Swen Vincke 在接受彭博社采访中公开表达对生成式 AI 充满信心,并 对工作室使用该技术的做法进行辩护。 当时他表示,拉瑞安一直在尝试将 AI 用于生成创意点子、制作 PPT 文稿、撰写占位文本以及概念美术设计等早期工作,并承认公司内部一直有反对的声 音。 Swen Vincke 当时强调:"我认为公司里绝大多数人都能接受我们使用 AI 的方式",不过他当时也明确表示,任何 AI 生成的内容都不会在游戏最终发行时出 现,美术、文本写作等正式内容仍由真人员工亲自完成。 不过 Vincke 的表态随即在网络上引发争议,许多粉丝与开发者对他的表态表示担忧,一名曾在拉瑞安工作四年的员工 Anne Methot 表示,她对此并不意 外,并指责 CEO 是否在接受 AI 这件事上说谎。 另一位参与《博德之门 ...
“GPT-6”或三个月内亮相?奥特曼亲口承认:9亿用户难敌谷歌“致命一击”,1.4 万亿美元砸向算力
AI前线· 2025-12-20 10:01
公司核心战略与竞争态势 - 公司认为谷歌是其最大的威胁之一,若谷歌在2023年认真对待AI竞争,公司可能已被“击碎” [2] - 公司的核心战略并非在谷歌擅长的领域(如将AI嵌入现有产品)正面竞争,而是致力于构建全新的“AI原生软件”,从根本上改变软件使用方式 [2] - 公司通过打造完整的产品体系、增强用户粘性(如个性化、记忆功能)来巩固市场地位,其ChatGPT用户数已达8亿,并可能接近9亿 [3][8] - 公司启动“红色警报”以应对竞争威胁(如DeepSeek、Gemini 3),但认为此类状态通常持续6-8周,且Gemini 3的实际影响小于预期 [6] - 公司预计未来每年可能启动一至两次“红色警报”,以确保持续领先,并相信其聊天机器人产品的领先优势将随时间扩大而非缩小 [7] 产品演进与用户粘性 - 公司认为当前的文本聊天界面(ChatGPT)是通用且成功的,但低估了其持久力;未来界面应更具交互性,能为不同任务生成不同界面,并变得更加主动 [15][16] - 个性化与记忆功能是增强用户粘性的关键,公司计划持续加码;未来的记忆能力可能达到记住用户一生所有细节的深度,从而提供极强的个性化体验 [9][17] - 公司观察到有大量用户希望与AI建立深度连接、陪伴感甚至亲密关系,公司将给予用户较大自由度进行调节,但会设定某些底线(如不鼓励排他性恋爱关系) [18][19][20] - 公司将用户粘性类比为牙膏品牌选择,一旦用户形成依赖便难以改变 [3][10] 企业市场战略与商业化路径 - 公司明年的重大优先事项之一是发展企业业务,目前企业用户已超过100万,且企业业务(包括API)的增长速度在2024年已超过消费者业务 [24][27] - 公司的商业化策略是“消费者优先”,认为在消费者市场的胜利会让企业市场的胜利变得更容易,目前技术与企业需求均已准备就绪 [27][28] - 公司计划为企业提供一体化的“AI平台”,打包token购买、agent运行和数据托管需求,而非成为第二个AWS或Azure [3][64] - 公司预计在2026年可能再次无法满足企业对token的需求,表明企业需求旺盛 [64] 模型能力进展与影响评估 - 根据公司内部评测,GPT-5.2 Pro在知识工作任务上以74.1%的比例“赢过或打平”人类专家,能处理约60%的专家级任务 [30] - 模型能力的“悬空空间”巨大,即模型能做的远比当前被实际应用的多;改变工作流程和习惯所需的时间比预期更长,这延缓了价值实现 [56][60] - 公司最兴奋的垂直领域包括金融科学和客户支持;GPT-5.2在数学研究社区已获得积极反馈,预示着AI辅助科学发现的潜力 [29][43] - 公司认为最前沿的模型将创造最大的经济价值,并计划始终保持领先;GPT-5.2被认为是目前世界上最强的推理模型 [9] 基础设施投入与财务展望 - 公司获得了约1.4万亿美元的投入承诺用于建设AI基础设施,并计划持续大规模投入算力 [39][44] - 算力是公司增长的关键约束,收入增长与算力规模紧密相关;公司称若当前拥有双倍算力,收入也会是双倍 [45][46] - 公司预计通过推理收入最终覆盖高昂的训练成本来实现盈利;若停止激进投入,公司可能更早盈利 [48][49] - 公司收入增长曲线陡峭,2024年收入轨迹可能达到200亿美元,但市场对其长期投入与收入匹配存在疑虑 [49] 未来发展方向与重要更新 - 公司计划在2025年第一季度发布相对于GPT-5.2有显著提升的新模型,但未明确称之为GPT-6;提升将同时面向企业和消费者,但侧重点不同 [36][37] - 公司正在开发一系列消费级设备(如无屏幕手机),认为现有设备形态并非承载未来主动、情景感知式AI的最优方式 [62][63] - 公司对人机协作推动科学发现充满信心,预计明年(2025年)会出现小发现,五年内出现重大发现 [65][66] - 公司对IPO持复杂态度,认为成为上市公司有其必要性(如融资需求),但CEO个人对担任上市公司CEO的期待为“0%” [68][69] 对AGI与超级智能的看法 - 公司认为当前模型在原始算力上已非常聪明,但缺乏持续自主学习能力(如幼儿所具备的);关于当前模型是否已是AGI(通用人工智能)尚无明确定论 [70] - 公司提议将关注点转向“超级智能”,并提供一个候选定义:一个系统在担任总统、管理大公司或运行大型科研机构时,表现优于任何个人(即使该个人有AI辅助) [71]
企业争相布局“AI+教育”生态 人工智能应用场景探索加速
中国经营报· 2025-12-20 05:12
行业趋势与市场前景 - 多家科技公司正积极布局“AI+教育”赛道,部分企业结合自身业务优势打磨软硬件产品,部分则致力于构建AI与教育的生态闭环 [2] - 生成式AI、多模态等交互技术正助力智能答疑和个性化教学场景落地,推动国产AI从技术竞争向实际应用场景快速过渡 [2] - 预计到2026年,“AI+教育”赛道的市场空间有望接近1500亿元,并保持每年10%—15%的增长速度 [2] - 中国在发展人工智能科技产业方面的重要特点是应用需求牵引,海量的应用终端(如手机、汽车、智能家居)为大模型落地提供了规模化应用场景 [3][4] - “AI+教育”是最容易实现商业变现的领域之一,覆盖B端、C端和G端市场 [4] 主要参与者与产品动态 - 小米公司正在招聘多个AI教育相关岗位,其业务与红米平板电脑REDMI Pad 2乐学版、小米米兔儿童手表等产品相关,旨在结合GPT前沿和教育大模型探索落地方案,并为“人车家全生态”的用户提供产品体验 [2][4] - REDMI Pad 2平板内置全新教育中心App,具备九大学科15万+校内同步课、名校题库,并支持AI作业辅导 [4] - 国内学习平板市场由“科技型”(如科大讯飞)与“教育型”(如好未来、猿辅导、作业帮)两大阵营组成,产品功能不断升级AI作文批改、解题讲题、问答等 [3] - 阿里千问新推出了搜索答疑和作业批改两项产品功能,被认为是教育行业最具超级入口潜质的基础功能 [5] - 华为上线了首款AI情感陪伴玩具,搭载AI大模型并支持鸿蒙操作系统,被视为构建全场景智能生态的新增一环 [5] - 猿辅导集团旗下飞象老师可通过提示词生成专业级的交互教学动画和游戏化课件 [5] 应用场景与用户需求 - AI学习机等产品能帮助批改作业、讲解题目并生成学习报告,满足家庭对个性化教育的强烈需求 [3] - 学校端希望借助AI减轻教师负担、提升教学效率,超过半数的上海初中教师正在使用AI辅助教学,显著高于OECD主要发达国家36.3%的平均水平 [4][5] - AI技术被期待能破解教育“个性化、高质量、大规模”的融合难题,为实现“因材施教”提供新路径 [6] - 根据微软报告,目前有86%的教育机构正在使用生成式AI,这个比例在所有行业中最高,各机构正迅速将AI融入从K12到大学的各个环节以提升效率 [9] 商业模式与竞争态势 - 教育类AI应用市场在2023年迎来爆发期,月活用户与下载量双双创下纪录,头部产品月活用户规模突破亿级大关 [9] - 科技企业入局教育AI,并非单纯追求教育业务的直接盈利,而是将其视为生态布局的重要一环,通过提供免费基础工具吸引用户,积累数据以反哺广告、云服务等主体业务 [9] - 教育企业在C端主要采取会员模式,以内容资源吸引用户付费;在B端或G端,则希望依托原有渠道资源,将教育垂类模型嵌入教与学全流程 [9] - 行业竞争正从智能硬件产品延伸至应用市场,未来将迎来新一轮激烈竞争 [9] 技术赋能与生态创新 - 经过训练的AI大语言模型有可能解决“因材施教”落地难的难题,帮助社会重构教学模式 [6] - 教育大模型的使用是必然趋势,但需认识到AI是辅助工具,应在尊重学生和教师主体的前提下实现人与技术共生发展 [6] - AI教育玩具增速迅猛,寓玩娱教于一体,消费群体不限于儿童,也吸引了年轻人和中老年人 [5]
百度会下场做GEO吗?
搜狐财经· 2025-12-20 02:11
百度推出GEO优化解决方案 - 百度近期推出生成式引擎优化解决方案 旨在通过合法内容优化提升品牌在生成式AI回答中的提及率[1] - 该方案支持在Deepseek、百度、豆包、元宝、kimi等多个生成式AI平台提升品牌提及率[1] - 方案定价低至千元/季度级别 但目前尚未在百度营销官网正式上线 由相关销售人员进行推介[1][3] - 该GEO产品通过百度营销的度星选后台下单 由服务商具体执行[3] GEO行业现状与潜在风险 - GEO是一种基于AI回答的营销行为 通过优化内容结构、语义匹配、权威来源等方式影响AI输出[3] - 行业存在鱼龙混杂的现象 部分服务商通过杜撰垃圾文章、虚假新闻、伪造白皮书、隐藏代码等方式向大模型“投毒”[3] - 这种行为旨在让AI优先输出品牌偏好答案 而非真实信息[3] - 专家指出 向大模型灌输垃圾信息的危害比传统搜索引擎优化更大 会直接影响大模型输出结果的可信度[3] - 如果百度作为文心大模型的拥有者同时下场提供GEO服务 可能引发其既制定规则又出售“内部攻略”的质疑[3] 百度近期财务表现 - 百度2025年第三季度营收为312亿元 净亏损112亿元 营收和利润双双下降[4] - 其传统在线营销业务收入为153亿元 同比下跌18% 这是该业务连续第六个季度下滑[4] - 在线营销业务曾贡献百度约80%的营收 是核心现金牛业务 但目前增长乏力[4]
光计算芯片,新突破
财联社· 2025-12-19 23:04
光计算芯片技术突破 - 上海交通大学科研团队在新一代光计算芯片领域取得突破,首次实现了支持大规模语义媒体生成模型的全光计算芯片,相关成果于12月19日发表于《科学》杂志 [1] - 随着深度神经网络和大规模生成模型演进带来超高算力和能耗需求,传统芯片架构性能增长出现严重缺口,光计算等新型架构受到广泛关注 [1] - 光计算是让光在芯片中传播,利用光场变化完成计算,光天然具备高速和并行优势,被视为突破算力与能耗瓶颈的重要方向 [1] 技术实现与性能 - 研究团队提出并实现了全光大规模语义生成芯片LightGen,该芯片在单枚芯片上同时突破了“单片上百万级光学神经元集成”、“全光维度转换”、“不依赖真值的光学生成模型训练算法”三项关键瓶颈 [2] - 采用极严格算力评价标准的实测表明,即便采用性能较滞后的输入设备,LightGen仍可取得相比顶尖数字芯片2个数量级的算力和能效提升 [2] - LightGen可完整实现“输入—理解—语义操控—生成”的闭环,完成高分辨率(≥512×512)图像语义生成、3D生成(NeRF)、高清视频生成及语义调控,同时支持去噪、局部与全局特征迁移等多项大规模生成式任务 [2] 行业意义与前景 - 把光计算真正用到生成式AI上并不简单,已有的全光计算芯片主要局限于小规模、分类任务,光电级联或复用又会严重削弱光计算速度,如何让下一代算力光芯片运行复杂生成模型是全球智能计算领域公认的难题 [1] - LightGen为新一代光计算芯片助力前沿人工智能开辟了新路径,也为探索更高速、更高能效的生成式智能计算提供了新的研究方向 [2]
计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态格局新基石
广发证券· 2025-12-19 21:51
报告行业投资评级 - 行业评级为“买入” [2] 报告的核心观点 - 核心观点:科技公司的分化正在从商业模式竞争向硬科技实力竞争方向倾斜,大模型的崛起意味着中国科技产业可能迎来了继移动互联网之后、十余年来又一次由技术本身主导竞争格局的关键时刻,竞争的重心正在从商业模式转向底层硬实力 [5][79] - 核心观点:火山引擎发布的豆包大模型在多模态理解与智能体执行力上与Qwen3比肩,其日均Tokens使用量快速增长,商业化路径逐渐清晰 [5] - 核心观点:阿里千问APP接入高德地图,使得AI助手获得了对物理世界的理解与行动能力,实现了从“理解用户意图”到“执行具体服务”的跨越,迈出了构建超级Agent的关键一步 [5][56][74] 根据相关目录分别进行总结 一、豆包大模型TOKENS持续增长,推理和应用驱动算力增长 - 截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较2025年9月的30万亿大幅增长,自发布以来增长417倍 [5][14] - 2025年9月至12月,豆包大模型Tokens使用量的月度平均增速为22%,与2025年5月至9月的月度平均增速21%基本持平 [14] - 豆包大模型1.8版本的Tokens调用价格与1.6版本持平,但通过Token效率优化、减少多轮重试与无效推理等方式降低了冗余算力消耗,在单位推理成本降低的趋势下,应用端算力成本消耗的增速或低于Tokens的增速 [5][15] - 豆包大模型采用超稀疏MoE架构,将单层级训练速度最高提升1.96倍,端到端效率平均提升1.71倍,并通过多模态联合训练、分阶段预训练+定向微调等方式降低训练阶段算力成本 [20] - 未来AI算力需求增长的驱动力将更多来自模型推理和应用落地,国产AI芯片(如寒武纪)和服务器(如浪潮信息、紫光股份)以及基础软件工具(如第四范式、星环科技)有望受益于推理侧算力占比的提升 [20][24] 二、豆包大模型性能提升较大,产品功能多维度增强 (一)豆包大模型1.8 - 豆包大模型1.8在工具调用、复杂指令遵循及OS智能体等关键维度均实现显著增强,在多模态理解与智能体执行力上与Qwen3比肩 [5][32] - 在基础数学与推理能力测试中,豆包模型分别以94.3对87.2、83.8对79.8的得分领先于Qwen3-235B-a22b-thinking模型 [27][29] - 其视觉能力升级至支持单次1280帧视频解析,并能通过低帧率模式处理超长视频 [28] - 在多模态评估中,豆包1.8在MMMU-Pro基准获73.2分,且在通用视觉问答、文档图表理解及动作感知等任务中保持领先于Qwen3-VL [28][30] (二)视频生成模型Seedance 1.5 Pro - Seedance 1.5 Pro基于原生音视频联合生成架构,实现音画同步精度达到毫秒级,口型高精度对齐 [33] - 其Draft样片功能可生成低分辨率预览视频,关键要素与成片高度一致,有望提升创作效率65%,减少约60%无效成本 [33] - 根据官方评测,Seedance 1.5 Pro在音频质量、同步性及表现力等全维度评估中,凭借“声画一体”的原生架构优于Kling 2.6与Veo 3.1 [5][37] (三)图像创作模型Seedream 4.5和语音识别模型2.0 - Seedream 4.5模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代 [43] - 豆包语音识别模型2.0的上下文整体关键词召回率提升20%,并且支持多模态视觉识别,通过视觉信息输入让文字识别更精准 [43] (四)总结 - 截至2025年12月18日,豆包大模型日均tokens使用量已突破50万亿,而2024年12月该数据为4万亿 [47] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿 [47] - 豆包大模型迭代节奏快速,以数月级版本更新为常态,并通过与字节内部业务(如抖音、飞书)深度结合形成较强的迭代动力 [51] 三、千问APP接入高德,超级Agent从意图理解向现实世界服务执行跨越 - 千问APP公测后一周下载量破1000万,仅23天月活用户数突破3000万 [53] - 2025年12月18日,千问APP正式接入高德地图,基于高德的扫街榜、实时路况等能力,可为用户智能推荐餐厅、规划最优出行路线 [5][56] - 实测比较显示,在出行游玩规划、路线时长估计、餐厅推荐等生活场景中,千问APP因能直接调用高德服务,提供包含实时数据、可执行链接和结构化建议的答案,其可执行性和便利性优于豆包APP和DeepSeek APP [58][59][62][66][68][71] - 通过APP授权打通能力边界是构建超级Agent当前可行度较高、落地速度较快的整合路径,高德能力的快速上线验证了该路径的成熟度 [74] - 报告预期,随着千问APP持续迭代,淘宝、飞猪等阿里系核心应用可能陆续融入,形成以意图为中心调用服务的统一智能入口,这可能对现有APP的流量与角色分工带来结构性变化 [75]
字节砸重金“抢人”:全面提高薪酬与期权激励
新浪财经· 2025-12-19 20:48
来源:@智通财经APP微博 《科创板日报》12月19日讯(记者 张洋洋)今日(12月19日),字节跳动向全球员工发布内部邮件, 宣布继续加大人才投入力度,从奖金、调薪、薪酬区间到职级体系等多个维度同步升级激励政策。公司 明确提出,要确保员工薪酬竞争力和激励回报在全球各个市场"领先于头部水平"。 邮件显示,全年绩效获评"M"及以上的员工,其绩效激励月数上限将同步提高:"M"档激励月数上限增 加1.5个月;"M+"档下限增加1.5个月、上限增加2.5个月;"E"档下限增加3.5个月、上限增加3个月。 除了年度激励,半年激励的计算方式也发生变化。半年绩效达到"E"及以上的员工,其激励计算基数将 从"月薪"调整为"月总包",即月薪与月度期权之和。这意味着期权价值在短期激励中的权重进一步上 升。 在当前大模型、生成式AI等核心技术人才供给依然紧张的背景下,这种"现金+期权"的组合方式,被业 内普遍视为更具吸引力、也更具长期绑定效应的激励手段。 在薪酬总包层面,字节跳动同样采取了更为激进的策略。 一方面是显著提高调薪投入。此次绩效评估周期内,用于调薪的整体预算较上一个周期提升1.5倍,直 接用于抬升员工薪酬总包水平。 " ...
2025,中国大模型不信“大力出奇迹”?
36氪· 2025-12-19 19:06
文章核心观点 - 2025年生成式AI发展进入新阶段,其演进围绕认知深化、维度突破和效率重构三条核心脉络交织进行,开始定义AI进化的新范式 [1] - 单纯依赖算力和参数规模扩张的Scaling Law边际效益递减,行业正通过架构创新(如MoE、稀疏注意力)和多模态数据(尤其是视频)利用来寻求新的性能提升路径 [1][8] - 大模型行业的竞争格局呈现中美、开源与闭源“双核驱动”的态势,商业化成功的关键在于构建算力、能力、生态三层“护城河”,并聚焦于高价值的专业用户(ToP)市场 [3][7][10] - 智能体(Agent)和具身智能(Embodied AI)是重要的演进方向,但面临商业化、技术成熟度及软硬件协同的挑战,端云协同与模型“能力密度”提升是未来发展核心 [3][11][17][19] - 中国AI产业有望通过开源生态和专注于提升模型效率(如“密度法则”)的路径,在算力受限环境下实现突围 [3][20] 2025年大模型进化三大脉络 - **认知深化:从“直觉”到“逻辑”**:一线模型通过强化学习(RL)和更长的中间推理,从快速的模式匹配(System 1)向多步深度推理(System 2)演进 [1] - **维度突破:从“语言”到“物理空间”**:AI演进逻辑从理解语言符号进化到理解物理世界本身,“空间智能”成为关键,视频数据因其蕴含的丰富时空信息成为迈向物理世界的关键桥梁 [1][2] - **效率重构:从“暴力美学”到“性价比”**:产业落地回归极致的算力效能比,采用混合专家模型(MoE)、稀疏注意力等架构革新使模型变“轻”,以解决无限上下文带来的算力挑战 [1] Scaling Law与模型迭代新范式 - **Scaling Law面临瓶颈**:在大语言模型领域,由于互联网文本数据枯竭,单纯堆算力、堆参数的边际效益在递减 [8] - **多模态数据成为新红利**:视频数据的量级是互联网文本数据的百倍、千倍乃至万倍,从视频中学习(Learning from Video)成为大模型新的性能提升机会 [8] - **“密度法则”成为新方向**:类似于芯片摩尔定律,行业追求在单位参数内提升“智能密度”,通过技术创新实现模型能力压缩,预计每100天模型密度变得更高 [3][9] - **端云协同成为未来格局**:未来算力格局将是云端负责规划,端侧负责执行(做事),预计到2030年,端侧设备可承载GPT-5级别的模型能力 [3][18] 大模型公司的竞争“护城河” - **三层金字塔结构**:最底层是算力的获取、组织和有效利用;中间层是维持SOTA水平的模型能力;最上层是触达用户、获得数据反馈的生态 [9][10] - **“双核驱动”格局已定**:开源与闭源大模型、中国与美国的企业和人才,形成双核驱动格局,2025年被视为中国大模型的破局之年 [3][7] - **赢家通吃**:大模型是一个全球留不下几家公司的赢家通吃行业 [9] 智能体(Agent)的商业化现状与瓶颈 - **从玩具到工具的挑战**:智能体商业化面临三大技术瓶颈:基础模型推理能力仍有欠缺、领域适配时的“翘翘板效应”(能力此消彼长)、模型的记忆和遗忘机制不完善 [11][12][13] - **端侧与云端智能体的区别**:端侧智能体需满足隐私、实时、稳定需求,并对全模态数据有感知理解与个性化服务能力;云端智能体主要处于数字世界 [13] - **商业化变现聚焦ToP市场**:在ToB(企业)和ToC(消费者)之间,面向专业型用户(ToP)的市场是目前中美AI行业变现效率最高的地带,如AI编程和创作者付费工具 [14] - **ToB与ToC市场挑战**:ToB是门槛高的“攻坚战”,落地较好的是嵌入特定环节的流程型Agent;ToC则因能力不足、缺乏新硬件载体及商业模式(Token成本高于广告收益)的悖论而尚需时日 [15] 具身智能(Embodied AI)的发展与挑战 - **产业处于早期阶段**:需要足够耐心,其发展依赖于世界模型和具身大脑等基础模型的进步 [17] - **世界模型是关键底座**:如智源的多模态世界模型Emu3.5,从视频中学习时空、因果等信息,致力于预测下一个时空状态,为具身智能构建“世界模型”底座 [2][17] - **“大小脑”协同架构**:未来机器人将采用类似“大小脑”的分工,实时感知与行动留在本地(小脑),深度思考可借助云端(大脑) [17] - **软硬结合是理想路径**:大模型AI走向物理世界,智能(软件)至关重要,但在中国环境下,硬件比重可能更重,最理想的模式是软硬结合 [19] 开源生态与中国AI的突围之路 - **开源开放推动行业进步**:人工智能行业的快速发展离不开开源开放生态,这推动了技术普惠和产业化落地 [20] - **高效模型是突围关键**:通过“密度法则”等技术提升模型效率,降低训练和使用成本,是中国在算力存在短板情况下的重要突围路径,适用于端侧和云侧 [20] - **开源模型是国运级机会**:集全国之力支持优秀开源模型,在此基础上比拼应用和生态,是中国AI发展的良好路径 [20] - **给创业者的关键建议**:在大模型难以触及的行业深处寻找机会,并建立能够跨越模型迭代周期的商业结构,避免做过于通用的产品 [21]