Workflow
36氪
icon
搜索文档
三年沉淀,短剧春节档正式“升咖”
36氪· 2026-02-27 18:51
2026年短剧春节档市场表现超预期 - 2026年短剧春节档表现超预期,孵化出《十八岁太奶奶驾到,重整家族荣耀4》《一品布衣3》《北往》《一家三口在同班》《昼以继夜》等多部口碑与热度兼具的作品,档期含金量直线上升 [1][3] - 相比于2024和2025年仅有零星爆款且流量与口碑倒挂的情况,2026年档期内容质量显著提升,被外界视作数字文化消费新主力军 [1][3] 系列化IP成为竞争核心与市场主流 - 系列化IP是2026年短剧春节档的核心关键词,构成了档期的系列化IP矩阵,成为平台和头部厂牌构筑竞争壁垒的核心抓手 [4][7] - 领跑档期的《十八岁太奶奶驾到,重整家族荣耀4》开播前预约量破1000万,创短剧史新纪录,其上线三天红果播放量破10亿,并带动第五季五天内预约量破500万 [4][7] - 各大平台持续加码系列化IP投入,例如抖音集团短剧版权中心对季播剧和衍生剧推出激励政策:第二季激励比例10%(优质内容预计收入超百万),第三季及以上激励比例提升至15%(优质内容预计收入超200万) [10][11] - 系列化开发已成为短剧市场主流,但观众期待阈值走高,创作者需在“保留辨识度”和“持续创新”间找到平衡,以实现从内容产品到文化符号的跃迁 [11] 群像剧集中涌现并成为新主流 - 2026年短剧春节档内容供应多元化,群像戏流行成为创作典型特征,截至大年初七,红果平台日榜TOP5中有四部为群像剧 [12] - 《昼以继夜》红果播放量五天破10亿,表现超预期;《北往》《一家三口在同班》等春节档热门短剧也均属群像剧 [12] - 群像剧成为新主流是行业内容迭代、产业成熟、观众审美提升的共同结果,其世界观宏大、叙事空间充足,适合系列化开发,且能满足受众对复杂社会关系与分众化情感映射内容的需求 [15] - 2025年全年,短剧行业播放量破10亿的群像剧有近十部之多,为2026年群像戏集中涌现的市场背景 [14] 类型深耕驱动内容创新 - 类型深耕驱动的内容创新是2026年短剧春节档的另一典型特征,涌现多部惊喜之作 [12][15] - 首部聚焦春运返乡的现实题材短剧《北往》,以公路片形式和单元剧结构探讨社会议题与乡土情怀,在红果平台评分9.1分 [15][17] - 《一家三口在同班》以父母重返十八岁与儿子同班的奇幻校园喜剧设定,解构亲子隔阂议题,红果评分同样为9.1分 [15][17] - 上述作品实现了从题材、叙事到价值的全方位创新,是行业类型深耕的高质量代表作 [17] 短剧行业规模与春节档主流化进程 - 《DataEye2025年微短剧行业数据报告》显示,2025年中国微短剧、漫剧全年产值达千亿,大幅超出此前600亿元左右的市场预期 [18] - 2025年微短剧、漫剧市场体量已接近全国电影总票房(518.32亿元)的两倍,其中免费真人微短剧市场规模超500亿,约占真人微短剧整体市场的三分之二,漫剧市场规模估计接近200亿元 [18] - 2026年是短剧春节档实现市场地位和行业认知双重跨越的关键节点,标志着其走出边缘地带,成功“升咖” [18] - 与2024、2025年档期作品多为“流量赌博”式产品(如豆瓣评分最高仅6.6分)不同,2026年档期体现出热度与质感兼具的良性发展态势,是2025年行业精品化进程加速的必然结果 [18][19][22] - 平台运营进一步精细化,如红果平台主打“群像欢腾”主题并提前策划社区活动,腾讯视频特设“短剧节”独立一级入口,意味着短剧春节档愈发“硬核” [21] - 行业主流化具象体现:入选金河豚奖的《东北爱情往事之闪婚玫瑰》登陆东方卫视黄金档,成为国内首部登陆主流卫视黄金档的竖屏短剧 [22] - 随着2026年微短剧分类分层审核新规落地,平台对创新题材投入增加(如给出最高三倍分账倾斜),预计2027年短剧春节档将再次进化 [22]
AlphaEvolve再进化,DeepMind用A“养殖”算法,碾压所有人类设计
36氪· 2026-02-27 18:51
核心观点 - 谷歌DeepMind开发的AlphaEvolve系统,通过将算法源代码作为基因组,并利用大语言模型作为遗传算子进行“自然选择”,成功进化出全新的博弈论算法[1] - 进化出的算法(如VAD-CFR和SHOR-PSRO)采用了反直觉的、人类研究者从未想过的底层机制,在几乎所有测试的博弈中,性能全面碾压人类几十年设计的经典方案[1][20][21] - 这标志着AI从单纯执行算法,转向了自主发明算法,代表了算法设计范式的根本性转换[1][22][23] 技术框架与工作原理 - 系统名为AlphaEvolve,是一个进化式编码智能体,其工作方式更接近于达尔文的自然选择而非传统编程[5] - 它将算法的源代码当作基因组,使用大语言模型(如Gemini)作为遗传算子,对代码进行有语义的变异,例如重写逻辑、注入新控制流、改变符号操作[5][17] - 系统在一组博弈论基准游戏上评估每个“后代算法”的适应度,核心指标是可利用度,适应度高的算法存活并进入下一代,持续进行变异、评估和筛选[5][14] 目标算法与应用领域 - AlphaEvolve瞄准的目标是多智能体强化学习中两个核心的算法家族:反事实遗憾最小化和策略空间响应预言[6] - 这些算法是不完全信息博弈(如德州扑克)中寻找纳什均衡的关键技术,曾被用于开发Libratus和Pluribus等碾压人类扑克高手的AI[7] - 过去几十年,人类研究者通过手动调参和直觉设计了一系列变体,如CFR+、DCFR等[10] 算法设计的挑战与突破 - 不完全信息博弈是AI领域最难的挑战之一,其特点是玩家无法看到全部信息[12][13] - 算法设计的核心挑战在于设计空间是组合爆炸级别的,涉及如何折现历史遗憾、区别对待正负遗憾、策略平均的时机与权重等众多选择[14] - 传统方法受限于数学可推导性,只能在“优雅但有限”的设计空间搜索,而AlphaEvolve将搜索空间扩展到任意可执行代码,利用LLM进行“有意义的变异”,使得搜索可能性从几百种暴涨到近乎无限[16][17] 进化算法的具体成果 - 进化出的第一套算法VAD-CFR采用了三项反直觉机制:在局势混乱时果断忘掉旧经验、发现好招时立刻加倍下注、前500轮纯学习不做总结[20] - 进化出的第二套算法SHOR-PSRO学会了在训练和考试时使用不同策略:前期大胆试探,后期精准收网;训练时求稳,考试时求准[21] - 这些规则并非来自教科书,而是AI自主“进化”的结果,其有效性让人类专家感到惊讶[22] 性能与影响 - 在11个测试博弈中,AI进化出的算法碾压了所有人类设计的前辈算法[23] - 论文结论指出,自动发现的算法机制(特别是管理遗憾缩放和动态混合调度的机制)对人类直觉而言难以捉摸,但在实践中极其有效[25] - 这不仅是效率的提升,更是算法设计范式的转换,从“人类设计算法,机器执行”转变为“机器设计算法,机器执行”[17][23] 未来方向 - 公司计划将该进化框架应用于深度强化学习智能体的完整设计[25] - 公司还计划探索在合作博弈中的机制发现,预示着让AI进化出整个学习范式的可能性[25]
2026第一个手机黑科技,全球首款硬件防窥屏来了
36氪· 2026-02-27 18:51
三星S26Ultra产品发布 - 三星于2月26日推出S26Ultra,全球首发搭载硬件级防窥屏幕,无需贴膜即可实现防偷窥 [1] - 该产品起售价为9999元,比上一代S25Ultra贵约300元,其屏幕后续维修费用也比普通屏幕贵几百块 [12] - 防窥屏技术存在一定代价:开启防窥模式后,约一半像素工作,屏幕亮度和细腻度会略有下降;即便不开启,屏幕结构本身也会导致文字边缘轻微模糊、色彩略偏灰 [10][12] 防窥屏技术特点 - 技术原理:采用“双像素架构”,屏幕内置两套像素(一套常规广视角,一套窄视角防窥),通过物理阻断光线实现防窥,相比软件方案效果更直接灵活 [8][9] - 核心优势:用户正对屏幕时可清晰查看内容,不受阳光影响;当视线偏离正面约30°时,侧面旁人仅能看到黑屏,显示效果远优于传统防窥膜 [4][10] - 智能功能:支持全屏或局部区域防窥,可自定义应用;前置传感器能检测非机主视线,自动开启或关闭防窥;打开银行、支付类App时也会自动触发 [1][7] 行业竞争与供应链动态 - 国内厂商正全力跟进硬件防窥技术,京东方已申请相关专利,天马推出了柔性隐私显示技术,为硬件级防窥提供核心技术支持 [13] - 小米、OPPO、vivo、荣耀四大国产头部品牌已与京东方、天马等面板厂商合作,正在进行样机稳定性测试 [15] - 据爆料,国产厂商已在测试“硬件级原生防窥屏”,预计今年9月前后发布的国产旗舰新机将率先搭载此项技术 [13] 1) 国内供应链成熟,未来国产防窥屏成本可能更低,并可能针对支付宝、抖音、小红书等常用App进行专属优化 [15]
最强业绩下市值蒸发万亿,全球最贵公司怎么了?
36氪· 2026-02-27 18:51
核心观点 - 公司近期面临“冰火两重天”局面,尽管第四季度营收681亿美元,同比增长73%并超预期,但股价反应平淡甚至下跌,反映出市场对其算力护城河收窄的担忧,公司增长叙事面临挑战 [1] 近期业绩与市场反应 - 公司第四季度营收达到681亿美元,超出市场预期的657亿美元,同比增长73% [1] - 尽管业绩超预期,财报发布后股价仅微涨1.4%,次日大幅下跌5.5%,市值蒸发近2600亿美元 [1] - 此前,因“可能搁置投资OpenAI”的传闻,公司股价在三天内下跌约9%,而创始人黄仁勋关于“AI基建还有七到八年的路要走”的言论又使股价单日反弹近8% [1] 公司发展历程与成功关键 - 近十年公司经历三波主要股市行情:2016-2018年(AI概念与加密货币潮)、2019-2022年(数据中心转型)、2022年底至今(AI大模型算力需求暴涨) [2] - 创业早期,在账上仅剩300万美元的危机下,公司押注开发RIVA 128并获得成功,奠定了其在游戏图形芯片(GPU)领域的地位 [3] - 公司长期投入打造的CUDA并行计算平台,使GPU在AI算法训练和加密货币生产中发挥关键作用,抓住了两波浪潮的交汇点 [3] - 公司曾坚持十年搭建CUDA开发者生态,并在2012年后全面All-in,促使硬件与CUDA兼容,并开发适配软件库 [4] - 面对加密货币矿潮,公司迅速推出专用矿卡CMP系列并动态调价,成功将“副产品”转化为核心商业支柱 [4] 当前面临的挑战与风险 - 公司近一半数据中心收入来自大模型训练,但训练需求并非无限,且投资回报率正在降低 [6] - 顶尖与第十名基础模型的性能差距从2023年的11.9%急剧收窄至2024年的5.4%,“堆算力”的边际效益快速递减 [6] - 模型性能提升的重点正从预训练转向后训练与推理扩展,公司GPU的推理负载已超过训练 [6] - 推理是持续性运营开支,客户对成本极度敏感,且面临AWS Trainium、Google TPU等多种竞品选择 [6] - 公司GPU+CUDA的性价比优势面临风险,Counterpoint预测,到2028年谷歌/微软/亚马逊的ASIC芯片出货量将超过公司的GPU [7] - 下游客户如OpenAI自身也面临竞争压力,可能影响与算力提供商的绑定关系 [7] 公司的应对策略与新动向 - 从2025年开始,公司在售卖云服务器上力推CPO技术,将光模块和交换机芯片封装在一起,旨在通过捆绑销售赚取光模块差价 [8] - 公司积极推动美国政府批准向中国销售H200芯片,并于1月13日获得新政策批准,但需将销售收入的25%上缴美国政府 [9] - 公司已为针对中国的H20芯片计提了45亿美元的库存减值,并在最新财报中坦言业绩展望未计入任何来自中国的数据中心计算收入 [10] - 公司寻找新机会,如生物医药研发,于2022年推出BioNeMo开源框架,并于2026年1月与礼来宣布成立联合创新实验室,未来五年共同投入高达10亿美元 [10] - 创始人黄仁勋透露将在2026年3月的GTC大会上展示“前所未见”的芯片,并有猜测称可能公布“GPU+ASIC”方案以应对市场竞争 [10]
算力救不了AI智商?谷歌新大招终结“随机鹦鹉”争论
36氪· 2026-02-27 18:51
谷歌AI研究:元控制器与内部强化学习 - 谷歌团队通过引入元控制器操控模型内部残差流,使智能体在稀疏奖励环境中学会了“跳跃式思考” [1] - 该研究揭示了大模型内部可自发形成类似人脑的层次化决策机制,为AI在需要多步的复杂任务提供了全新的训练范式 [1] - 研究标志着AI研究从单纯优化模型输出,转向理解和操控模型内部认知过程 [22] 传统方法的局限与问题 - 传统大模型依赖逐词生成(token-by-token)的探索方式,在奖励稀疏的复杂长序列任务中难以完成 [2] - 这导致智能体需要外挂规划器才能完成复杂任务,如同蒙眼走迷宫,只有到达终点才能获得反馈 [1][2] - 在需要多个正确步骤才能获得奖励的“组合式任务”中,传统方法难以让智能体掌握层次化解决问题的能力 [4] 元控制器的工作原理与架构 - 元控制器通过接收基模型的残差流,能够生成一系列简单的内部控制器 [5] - 每个内部控制器对应一个时序抽象动作,并附带终止条件,通过按时间组合多个控制器,智能体能够在新任务上实现高效探索 [5] - 通过自监督的下一步动作预测,元控制器发现如何生成时间上稀疏变化的简单内部控制器序列 [7] - 元控制器能通过变分推理自动识别有意义的行为模块,相当于无监督发现抽象动作 [9] - 元控制器能动态控制抽象动作的持续时间,并能将学到的抽象动作重新组合以解决新任务 [9] 内部强化学习范式与效果 - 内部强化学习在元控制器发现的抽象动作空间中进行学习,与传统在原始动作空间学习的强化学习不同,搜索空间大幅减小 [11] - 在需要组合泛化的任务中,内部强化学习的成功率显著高于所有基线方法,包括先前最先进的分层强化学习方法CompILE [11] - 智能体学会将长序列任务分解为可重用的子程序,使搜索空间变小,奖励不再稀疏 [13] - 该方法通过对动作空间降维,将高维残差流空间压缩到低维抽象空间,并在抽象时间尺度上操作,使得在抽象层面进行奖励分配更加高效 [13] “觉醒-睡眠”训练循环的实现 - 该研究可视为“觉醒-睡眠”训练循环的具体实现 [15] - “睡眠”阶段对应自回归基础模型的预训练,模型通过下一个token预测的目标,在大量未标注行为数据上进行自监督学习 [15] - “觉醒”阶段则是元控制器及其驱动的内部强化学习,学习如何操控基础模型的内部残差流激活以生成抽象动作 [16] - 研究发现,只有当基础自回归模型在元控制器训练期间被冻结时,才会涌现出与子目标对齐的正确切换表征 [20] - 这印证了分阶段、迭代式训练的理论优越性,符合“先睡眠(构建模型)、后觉醒(学习控制)”的方案 [21] 研究的理论意义与潜在应用 - 研究表明,预测下一个词的训练方式结合元控制器,能够诱导出层次化的时间抽象,这与人类的问题解决方式高度相似 [22] - 该研究在不依赖手动奖励塑形的情况下解决需要多步才能完成的任务,是迈向能够导航复杂、开放式搜索空间的自主智能体的关键一步 [22] - 与稀疏自编码器等解释性方法相比,元控制器直接通过残差流干预降低预测误差,具有内部记忆,支持长时间跨度的干预,且能够发现可解释的、长时间持续的干预策略 [22] - 该技术潜在应用广泛,包括让机器人执行需要多步协调的复杂任务、自主分解复杂数学问题为推理步骤、以及在稀疏奖励环境中进行高效科学探索和假设检验 [23] - 该内部强化学习范式尤其适合需要长期规划和组合推理的场景,为实现真正通用的智能系统提供了新路径 [24]
“山河四省”,为何对电影票房很重要?
36氪· 2026-02-27 18:46
“山河四省”在2026年春节档及电影市场中的核心地位 - 核心观点:“山河四省”(山东、山西、河南、河北)是中国电影市场,尤其是春节档的“兵家必争之地”,其庞大的人口基数、持续增长的影院数量、突出的下沉市场表现以及积极的产业政策支持,共同构成了其作为全国重要票仓的关键驱动力 [1][5][7][13] 2026年春节档票房与排名表现 - 2026年春节档全国总票房超57亿元,山东省和河南省累计票房分别为4.12亿元和3.43亿元,两省合计占全国总票房的13%左右 [1] - 省份票房排名:广东省、江苏省、山东省、浙江省、河南省位列前五,其中山东排名第三,河南排名第五 [1] - 与去年春节档相比,山东、河北、山西的票房排名均上升1位,河南排名持平 [1] - 山东和河南的观影人次分别达到860万和717万,分列全国第三和第五位 [1] 重点影片在“山河四省”的市场表现 - 《飞驰人生3》在“山河四省”的票房占比均高于全国均值(50.8%),其中河北占比最高达54.9% [2] - 《飞驰人生3》在“山河四省”共取得票房7.05亿元,占其全国总票房约21% [4] - 《熊出没·年年有熊》在“山河四省”的票房占比也远高于全国均值(12.4%),其中河北占比最高达17.8% [2] - 《熊出没·年年有熊》在“山河四省”共取得票房约2.29亿元,占其全国总票房的27.55% [4] - 2025年,“山河四省”为《哪吒之魔童闹海》合计贡献约29.64亿元票房,占该影片总票房近20% [4] “山河四省”成为重要票仓的驱动因素:人口与经济基础 - 2024年末,“山河四省”常住人口总数合计达3.07亿人,其中山东人口数量位居全国第二 [5] - 2025年,山东、河南GDP分别位居全国第三和第六位 [5] - 人口大省在节假日集中了大量返乡人群,人口基数大导致观影人数相对更多 [5] “山河四省”成为重要票仓的驱动因素:影院建设与城镇化 - 截至2026年,山东、河南、河北、山西的营业影院数量分别为752家、719家、655家、381家,分列全国第五、第六、第七、第十四位 [7] - 上述四省的银幕数分别为5093块、4630块、3674块、2011块 [7] - 2026年全国营业影院数较2023年增加533家,其中河北、河南、山东、山西分别增加100家、74家、35家、33家,新增数量位列全国第一、第二、第七、第八位 [7] - 影院建设与城镇化水平提升相匹配,例如河北省常住人口城镇化率从2019年末的57.62%提升至2024年的63.42% [7] “山河四省”成为重要票仓的驱动因素:下沉市场表现 - 2026年春节档,下沉市场票房占比近六成,为近年最高 [11] - 《熊出没·年年有熊》是2026年春节档所有新片中三四线城市占比最高的影片,且在山东、河南两省的单片占比也最高 [11] - 山东、河南等省份三四线城市较多,其市场表现与春节档更偏下沉市场的特点相契合 [12] - 2026年春节档,山东、河南两省平均票价在48元以内,与全国均价持平;场均人次分别为31.4和27.1,属于全国较高水平;影院上座率分别为27.18%和23.21%,均超过档期市场均值22.22% [12] - 2月17日,山东滨州单日贡献票房超400万元,当日全国总票房为12.78亿元;滨州一家万达影城以59.82万元的单日票房位列全国影院第三 [12] 地方政府对电影产业的扶持政策 - 山东省出台多项政策扶持电影产业,例如对在山东立项且票房达10亿元及以上的电影给予一次性1000万元奖励 [13] - 青岛东方影都影视产业园为多部大片提供拍摄场地,2026年春节档冠军《飞驰人生3》的关键场景在此拍摄,《流浪地球》系列、《封神》系列等影片也均在此地拍摄 [13] 历史票房表现与市场地位 - 近年整体票房中,“山河四省”占据重要位置:山东在2023年和2024年为年度票房第四省,2025年升至全国第三;河南在2023年和2024年位居第五,2025年位居第六;河北在2023年至2025年间始终位居前十 [4] - 在“山河四省”各自的年度票房排行中,票房最高的影片均为春节档影片 [4] - 历年亲子动画和国产喜剧片在“山河四省”均备受欢迎 [4]
低价博弈失焦,辅助驾驶需回归理性
36氪· 2026-02-27 18:33
行业发展趋势 - 2025年行业核心口号是“智驾平权”,但发展重点正从追求规模普及转向聚焦安全和用户体验的理性轨道 [2] - 高阶智能辅助驾驶技术正加速下探至10万级主流市场,行业开始审视普及浪潮中的功能底线 [2] - 行业竞争从“有没有”转向“好不好用、安不安全”,脱离安全的数量扩张没有意义 [9] 行业竞争现状与问题 - 行业在竞争中出现失序,传播核心指标为定点数量,但交付规模和质量被忽视,价格成为博弈关键 [2] - “成本竞争”在加速普及的同时,可能压缩安全冗余、系统一致性和极端场景验证,在消费者心中埋下隐忧 [2] - 部分公司为迎合降本需求,流行在极小算力芯片上实现高阶功能,但局促配置往往因牺牲体验上限而被消费者抛弃 [11] - 中国汽车制造商开发周期为24至40个月,远短于欧洲的48至60个月,这种“快”带来了规模增长,也引发了焦虑 [7] - 快速开发可能导致问题,如不同车型间标定偏差导致体验断层、场景覆盖不全留下安全盲区、压缩测试环节等 [7] 数据与模型的核心作用 - 实现安全、无人监督的自动驾驶大约需要100亿英里的训练数据,数据规模直接影响泛化能力与极端场景覆盖密度 [3] - 概率极低但致命的场景(如突然窜出的行人)主要依赖海量真实里程数据去“撞见”并学习,模拟无法完全复现 [3] - 特斯拉在2025年底披露其智能辅助驾驶系统累计行驶里程超过110亿公里 [5] - 华为乾崑辅助驾驶在2025年里程达到54亿公里,实现212万次碰撞规避和3.3亿次辅助泊车 [5] - 行业内数据应用路径出现分化,部分车企因车型和硬件复杂导致数据碎片化,用于多个子模型训练,效率低下且难以应对长尾场景 [5] - “单模型持续强化”路径(如元戎启行)构建了结构性安全冗余,通过统一基座模型赋能不同业务线,实现数据与能力的双向强化 [5] 安全与技术架构 - 安全冗余的概念已从物理堆料向“数据规模”与“模型架构”延伸 [2] - 元戎启行采用VLA(视觉语言动作)模型,在端到端基础上引入语言模型,具备“思维链”能力,能在一定程度上摆脱传统端到端模型的“黑盒”问题 [6] - 模型架构和数据闭环的设计是辅助驾驶的安全基石,交付和硬件设计上的严苛标准对产品可靠性同样不可或缺 [6] 公司策略与市场表现 - 元戎启行CEO周光表示不追求合作车型数量,而是选择与少数头部车企深度绑定,将资源集中用于技术打磨,确保核心体验与安全的一致性 [7] - 公司聚焦长城、吉利等核心客户,联合定义产品并深度调试,实现辅助驾驶功能与车型的完美适配 [7] - 元戎启行方案已在十余款车型中实现适配,赋能魏牌高山、坦克500、银河M9等热销车型 [6] - 截至2025年10月,搭载元戎启行城市NOA的量产车型已累计交付超过20万辆,其在第三方城市NOA供应商市场占比接近40%,与华为、Momenta形成三足鼎立 [8] 成本、规模与安全的平衡 - 在智能驾驶行业,低价本身不是问题,但若价格被压到没有利润空间且缺乏足够量产车分摊成本时,安全冗余往往最先被牺牲 [11] - 元戎启行CEO周光表示,2026年市场竞争关键将聚焦于“降低成本”与“提升体验”两大核心,核心思路是“规模降本”而非“物料降本” [12] - 公司计划通过推进百万辆交付目标,将高昂研发成本分摊,在保证合理利润的前提下提供有竞争力的“安全低价”方案 [12] - 头部企业持续加码自研投入:华为自2019年以来在智能汽车领域累计研发投入已超500亿元;特斯拉2025年运营费用达127亿美元(同比增长23%),其中相当部分投向自动驾驶研发;2026年特斯拉还计划将资本支出提升至超过200亿美元用于新建工厂及扩建AI训练算力 [12] - 缺乏规模支撑的低成本方案无法分摊底层研发的刚性支出,最终可能从安全冗余上“找补”,一旦极端事故集中爆发,高昂的召回成本将击穿成本优势 [12] 行业风险与警示(基于事实数据) - 截至2025年9月,中国共实施汽车召回3230次,涉及车辆1.2亿辆 [13] - 仅2024年因辅助驾驶系统问题召回的车辆高达255.61万辆,占全年召回数量的23% [13] - 分不清“让利”与“让安全”的低价战会伤害企业利润及整个行业的用户信任池,动摇行业发展根基 [13]
寒武纪业绩快报:2025年营业收入64.97亿元,同比增长453.21%
36氪· 2026-02-27 18:28
公司业绩表现 - 2025年公司实现营业收入64.97亿元,同比增长453.21% [1] - 2025年公司实现归属于母公司所有者的净利润20.59亿元 [1] - 公司业绩实现扭亏为盈,上年同期归属于母公司所有者的净利润为亏损4.5亿元 [1]
华人天才出走xAI:算力竞赛已死,30美元解锁AI自进化
36氪· 2026-02-27 17:54
核心观点 - 核心研究员Jiayi Pan和Toby Pohlen在48小时内相继从xAI的Grok团队离职,引发对公司内部状况的猜测 [1][3] - Jiayi Pan的开源项目TinyZero证明,通过纯强化学习方法,仅需30美元训练成本和3B参数的小模型即可实现高级自我验证与推理能力,这挑战了行业依赖海量算力和参数堆砌的技术路径 [8][9][13] - 该方法论创新可能降低高级AI能力的开发门槛,带来技术平权,同时也引出了关于AI自我进化可能性的新问题 [16][17] 关键人物与职业变动 - Jiayi Pan于2025年5月加入xAI的Reasoning团队,成为Grok 4开发的核心成员之一,但在约9个月后离职 [7] - 几乎同一时间,Grok团队的另一位核心研究员Toby Pohlen也宣布离职 [1] - Jiayi Pan的AI研究之路始于2019年,本科毕业于密歇根大学,2023年进入加州大学伯克利分校攻读博士 [4][6] 技术创新与项目细节 - **TinyZero项目**:一个基于Qwen2.5-3B基础模型、仅需30美元训练成本的3B参数模型 [8][9] - 使用veRL框架在Countdown和Multiplication等任务上进行纯强化学习训练 [9] - 训练后,模型在Countdown任务上的准确率从0%提升到80%以上 [9] - 项目证明了DeepSeek R1-Zero展现的自我推理能力可通过纯强化学习在小模型上复现 [9] - **SWE-Gym项目**:Jiayi Pan在伯克利早期开发的项目,将强化学习引入软件工程领域,基于SWE-bench数据集的2294个真实GitHub Issue,训练AI生成可通过测试的代码补丁 [5][6] - **技术路径整合**:从SWE-Gym(让AI学会改代码)到Grok 4(将强化学习用于大模型推理)再到TinyZero(在小模型上实现自我纠错),组合起来暗示了AI通过优化自身训练代码实现“自我进化”的可能性 [16] 行业影响与对比 - TinyZero的低成本路径与行业巨头的算力军备竞赛形成鲜明对比 [3][10] - 同一时期,Sam Altman宣布的Stargate计划计划在4年内投资数千亿美元建设AI基础设施,但据报道到2025年底因利益冲突停滞,一个数据中心都未建成 [9] - 技术突破表明,通往高级推理能力的路径可能不需要数千亿美元的基础设施投资 [9] - 随着TinyZero开源,自我纠错能力不再是巨头专属,任何开发者都可在垂直领域训练具备该能力的AI,带来了技术平权的可能 [15][17] 模型能力表现 - TinyZero展现出“元认知”特征,在Countdown游戏中会进行完整的试错与回溯,并在输出最终答案前生成包含自我质疑语句(如“Wait, that's wrong”)的中间思维链 [10][11][12] - 这种行为模式此前仅在DeepSeek R1-Zero等大规模模型中观察到,但TinyZero在3B参数、30美元成本下复现 [12][13] - 实验证明,Scaling Law负责知识广度,而强化学习负责打通逻辑深度,两者的结合不一定需要海量参数 [15] 未来展望与基准测试 - 2025年发布的Humanity's Last Exam基准是一个多模态、超高难度的AI评估基准,旨在应对现有测试(如MMLU)已被模型以90%+准确率攻破的挑战 [17] - Jiayi Pan的研究工作(SWE-Gym, Grok 4, TinyZero)正在逼近如何评估超级智能这一问题的边界 [17] - 方法论创新在更小规模上实现高级AI能力,也带来了关于强化学习不稳定性、开源模型伦理边界和失控风险等未有答案的新问题 [17]
Nano Banana 2免费上线,超Pro版本100分登顶竞技场,API价格还对半砍了
36氪· 2026-02-27 17:50
产品发布与市场地位 - 谷歌旗下AI图像生成模型Nano Banana 2正式发布,其定位为在保持“Flash级”极速生成的同时,提供“Pro级”的专业能力[4] - 根据2026年2月25日的Text-to-Image Arena排行榜数据,Nano Banana 2(模型名:gemini-3.1-flash-image-preview)在“产品、品牌与传播”类别中综合排名第一,得分为1324分[3] - 在竞技场总榜中,Nano Banana 2的得分超越其前代专业版Nano Banana Pro(得分1264分)达100分,确立了新的领先地位[2][3][16] 技术性能与功能升级 - 生成速度大幅提升,实测生成单张图片仅需几秒钟[4] - 主体一致性能力增强,在单个工作流程中最多可保持5个角色的一致性和最多14个物体的保真度[8] - 指令遵循能力得到增强,能够更严格地执行复杂的文本提示[10] - 支持广泛的生成规格,图像分辨率覆盖从512像素到4K,并支持控制各种长宽比[12] - 视觉保真度升级,提供更生动的光照、更丰富的纹理和更清晰的细节[12] - 整合了网络搜索功能,可结合实时信息来增强生成内容的质量[6] 定价策略与商业模式 - Nano Banana 2提供免费使用 tier[6] - 其付费API(型号:gemini-3.1-flash-image-preview)的定价已公布,图像生成按分辨率收费[14] - 生成一张1K分辨率的图像成本为0.067美元(约合人民币0.46元),此价格比Nano Banana Pro便宜了一半[15] - 服务包含每月5,000次提示词的免费网络搜索增强额度,超出部分按每1,000次搜索查询14美元收费[15] 市场整合与行业影响 - 谷歌已将Nano Banana 2集成到其搜索服务和广告业务中[18] - 市场反馈积极,有观点认为该模型凭借强大的免费功能和极低的付费成本“再一次提高了标准”[19] - 极低的生成成本引发了关于其对设计行业潜在影响的讨论,有评论惊叹“设计师的时代要结束了”[21] - 用户已开始基于Nano Banana 2开发创新应用,例如将其与视频生成模型(如Seedance 2.0)结合使用[22][24]