Workflow
Scaling law
icon
搜索文档
小鹏想要的,不止“留在牌桌上”
虎嗅· 2025-06-20 07:13
销量与财务表现 - 零跑和小鹏1-5月销量同比分别增长161%和293%,一季度营收同比分别增长187%和142%,净亏损分别收窄87%和52% [2] - 两家车企营销策略差异显著:零跑保持低调仅举办两场车型发布会,小鹏则采用高强度营销流程包括多阶段产品发布和车主文化活动 [2][3] 产品策略与市场定位 - 小鹏MONA M03以10万元定价实现销量占比超50%,核心优势为620公里CLTC续航(实际450-500公里)、智能泊车等刚需配置,同时削减非核心功能如后桥扭力梁悬架、热泵空调等控制成本 [7][8][9][10][11] - 产品调整高效:小鹏在6-8个月内完成滴滴C1车型改造,通过用户需求调研优化配置,形成差异化竞争力 [12] 用户画像与营销创新 - MONA M03女性用户占比达38.6%(行业平均21.3%),年轻化(平均28.5岁)和未婚用户(76.5%)特征显著,通过白色内饰等快速响应提升女性占比至50% [18][19][20][21] - 营销活动精准定位:邀请欧阳娜娜等明星强化新手司机视角,打造"MONA小镇"场景化展示,发布会风格年轻化 [23][24][25] 技术研发与自动驾驶 - 小鹏自研"图灵AI芯片"单颗算力超700TOPS,G7搭载3颗实现2200TOPS算力,远超行业主流300TOPS配置,目标验证自动驾驶领域Scaling Law效应 [27][30][31] - 基座大模型采用思维链推理(CoT)技术,已训练720亿参数模型,累计处理2000万条30秒视频数据,结合强化学习实现自动驾驶能力持续进化 [36][40][42] - 实际路测显示复杂场景处理流畅,如无保护左转、多车道变道等,计划通过OTA升级将点对点智驾成功率提升至70% [44][45][47][48] 公司战略与行业竞争 - 小鹏明确"卷科技"路线,避免与传统车企价格战,聚焦智驾和AI技术差异化 [26][27] - 通过引入传统汽车人才优化供应链和成本控制,为技术创新提供支撑,目标建立体系化能力而非依赖单一爆款 [50][51]
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
机器之心· 2025-06-19 17:30
核心观点 - 推荐系统正经历由大型语言模型(LLM)驱动的生成式革命,端到端架构成为解决传统级联架构瓶颈的关键[2] - 快手提出的OneRec系统首次实现端到端生成式推荐全链路重构,在效果与成本上实现双赢[2][8] - OneRec已在快手双端应用,承接25% QPS,提升停留时长0.54%/1.24%,LT7显著增长[2][33] 技术架构创新 - **架构设计**:采用Encoder-Decoder框架,将推荐转化为序列生成任务,Encoder压缩用户行为序列,MoE架构Decoder实现参数扩展[6][11] - **多模态分词**:首创协同感知方案,融合视频标题、标签、语音转文字等多维信息,分层语义编码(RQ-Kmeans三层ID)[13][14] - **强化学习整合**:通过P-Score奖励模型(个性化融合目标预测值)和ECPO优化算法,提升用户停留时长而不损失曝光量[19][22][25] 性能与效率突破 - **算力利用率**:训练/推理MFU提升至23.7%/28.8%,较传统精排模型(4.6%/11.2%)提升3-5倍[27][31] - **成本优化**:OPEX降至传统方案的10.6%,关键算子数量压缩92%至1,200个[27][31] - **训练加速**:自研SKAI系统优化Embedding训练,UGMMU减少kernel数量,时间加权LFU算法提升缓存效率[36] 实验效果 - **短视频场景**:AB测试显示停留时长提升0.54%/1.24%,LT7增长0.05%/0.08%,交互指标全面正向[33] - **本地生活场景**:GMV增长21.01%,订单量提升17.89%,新客获取效率提高23.02%,已100%全量上线[34] - **Scaling Law验证**:参数规模从0.015B增至2.633B时,训练损失显著下降,符合大模型扩展规律[15] 未来方向 - **多模态桥接**:需构建用户行为与LLM/VLM的原生融合架构[38] - **奖励系统完善**:当前设计较初级,需强化对用户偏好和业务需求的引导[38] - **推理能力提升**:Infer阶段Scaling能力不足,需进一步优化[38]
云载 AI·健行未来——火山引擎“AI+医药大健康”行业论坛圆满落幕
财富在线· 2025-06-19 17:13
6月11日,「2025火山引擎 FORCE 原动力大会·春」"AI+医药大健康"行业论坛圆满落幕。以"云载 AI·健 行未来"为主题,本届医药大健康行业论坛深入探讨了豆包大模型与 AI 云原生技术的落地实践,来自清 华大学、广州实验室、津药达仁堂集团、美中宜和、北京大学人民医院、北京大学第一医院、北京友谊 医院的多位嘉宾,分享了 AI 在医药大健康等场景中的应用成果。 AI驱动医疗大健康行业全流程提效 针对科研进入"数据密集型+AI for Science"新范式融合时代的趋势,广州实验室研究员李亦学认为,AI 的发展源于对其基本原理的了解,贝叶斯定理、Transformer 神经网络、Scaling Law 等原理,支撑了大 模型能力的跃升,使其具备将复杂科研问题拆解为可学习、可重构问题空间的能力,能够加速科研范式 转变。 就此,他分享了与火山引擎联合开发 Bio-OS-Co-Pilot 的实践成果:该系统通过多智能体协作,将原本 需数年完成的科研流程压缩至小时级,显著提升建模、分析及多模态融合等全流程效率。 火山引擎副总裁张鑫在开场致辞中表示,医药大健康行业正在经历由 AI 驱动的范式转变,云计算的算 力 ...
电子行业2025年中期投资策略:算力需求仍将加大,端侧应用加速落地
东莞证券· 2025-06-17 17:21
报告核心观点 全球AI大模型竞争激烈,国产大模型崛起,算力需求持续加大,AI端侧应用加速落地,建议围绕AI算力和AI端侧两条主线布局,关注相关领域公司[176] 终端复苏及AI创新驱动,2024及25Q1业绩向好 - 行业2024年业绩向好,受益于宏观经济改善、补贴政策和AI大模型导入,智能终端需求复苏,云端算力硬件需求加大,营业收入28036.40亿元,同比增长17.04%,归母净利润和扣非后归母净利润分别增长24.10%和36.12% [13] - Q1业绩延续高增,受终端需求复苏和AI创新驱动,营业收入6949.32亿元,同比增长18.47%,归母净利润和扣非后归母净利润分别增长26.92%和32.12% [18] - 细分领域业绩亮眼,消费电子、PCB、CCL、面板制造营收和归母净利润均有不同程度增长 [26] 国产模型迅速崛起,DeepSeek推动模型平权 - 国产模型迅速崛起,比肩国际领先模型,中美竞争差距缩短,国产模型厂商在27个领先模型中占据22席 [29] - DeepSeek性能不断提升,R1-0528在多项基准测试中接近国际领先模型 [32] - 通义千问和豆包积极更新,具备较强竞争力 [37] - 国产模型API性价比凸显,有助于降低开发者使用门槛,加快AI大模型渗透 [42] 算力需求仍将加大,硬件业绩持续释放 - Scaling Law拓展至后训练、推理阶段,模型厂商在后训练和推理阶段投入更多算力,提升大模型深度思考能力 [47] - 推理带动Token消耗量增加,未来推理算力需求将进一步爆发 [50] - 海内外巨头资本开支高增,主权AI需求有望加速释放 [56][62] - 英伟达业绩略超预期,Blackwell出货加快,台系ODM厂月度营收高增,AI服务器出货动能充足 [63][66] - H20出口受限,国产算力市场打开,华为推出384超节点,集群能力大幅提升 [70][71] - AI服务器PCB迎来量价齐升,HDI需求有望井喷,多家陆系厂加快HDI布局 [76][79][82] - PCB和CCL产业链业绩持续释放,2024年和25Q1营收和归母净利润均快速增长 [84][97] AI端侧应用加速落地 AI手机渗透率有望提升,关税影响仍需进一步观察 - 终端需求回暖,2024年全球智能手机出货量同比增长约7%,2025Q1同比增长3% [112][115] - 终端推出系统级智能体助手,有望拉动用户换机需求 [120] - AI手机渗透率有望提升,预计2025年达到34%,同比提升约16个百分点,关注价值量提升环节 [131] - 关税影响仍需进一步观察,短期关注关税政策,中长期AI加持的智能终端有望加快落地 [135] Ray-Ban Meta爆品推动,AI眼镜出货量有望快增 - AI眼镜逐步落地,具备多媒体体验和多模态交互能力,有望加速渗透 [136] - Meta推出AI眼镜产品,出货量超百万,用户接受度提升 [140][144] - 国产终端积极跟进,密集推出多款产品,雷鸟V3具备多种优势 [144][151][153] - AI眼镜出货量有望快速增长,预计2025年达到376万副,2024 - 2028年复合增速为58.86% [155][156] - AI眼镜产业链新增多个环节,芯片是核心部件,AR眼镜光学显示系统成本占比较高 [160][163][169] 投资建议 - 围绕AI算力和AI端侧两条主线布局,关注AI服务器ODM、高端PCB/CCL产能公司,以及智能手机和智能眼镜相关环节 [176][179]
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解:AI「吃」下6亿秒视频后,智能涌现
量子位· 2025-06-16 12:50
贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI CVPR 2025 ,自动驾驶传来重大进展: Scaling Law , 首次在这条赛道被验证! 来自中国的 小鹏汽车 ,完整拿出了技术方案和AI司机"智能涌现"的成果。 自动驾驶的"ChatGPT时刻",真的要来了吗? CVPR 2025,小鹏汽车拿出了什么成果 今年的CVPR线下会议在美国田纳西州纳什维尔举办,日期是6.11-6.15。观众老爷们看这篇推送的时候, CVPR才刚刚结束几个小时——新 鲜出炉 。 CVPR的自动驾驶分论坛 (Workshop on Autonomous Driving) ,历年都是业内极具影响力的技术风向标和盛会。比如2022年的WAD, Wayve首次披露了自己低传感器端到端路线方案,马上成为自动驾驶赛道炙手可热的明星公司;再比如,特斯拉最早在CVPR WAD上详细分 享了占用网络技术,随后成为业内悉数跟进的量产方案…… 今年的WAD,中国的 小鹏汽车是唯一一家受邀发表主题演讲的车企 。 小鹏在演讲前一天,刚刚开启了最新SUV G7 的预售,创造了 量产L3级AI算力第一车 的纪录,单车算力超过2200TOPS,何小鹏 ...
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解:AI「吃」下6亿秒视频后,智能涌现
量子位· 2025-06-16 12:49
核心观点 - 小鹏汽车在CVPR 2025上首次验证了Scaling Law在自动驾驶VLA模型上的有效性,展示了其"自动驾驶基座模型"的技术突破[1][43][46] - 公司通过云端大模型+车端小模型蒸馏的技术路线,实现了AI司机的"智能涌现",在复杂场景下表现出超越传统方案的决策能力[4][7][9][11][13][14] - 新技术路线突破了传统端到端方案的局限性,构建了具备完整认知能力的"大脑+小脑"架构,为自动驾驶和具身智能的大一统奠定基础[26][27][57][60] 技术方案 - 云端部署720亿参数VLA大模型,以语言模型为骨干网络,融合视觉、语言和动作模块,实现环境理解到行为输出的闭环决策[30][33][36] - 车端部署蒸馏后的小模型,通过持续在线学习(Online Learning)实现能力迭代,G7车型搭载3颗自研图灵AI芯片,算力达2200TOPS[42][53][55] - 强化学习训练聚焦安全、效率、合规三大原则,并开发世界模型(World Model)生成高价值训练数据[37][38][39][40] 性能表现 - 在无规则代码托底情况下,基座模型直接控车完成加减速、变道绕行、转弯掉头等复杂驾驶任务,决策丝滑度显著优于传统方案[4][5][14][15] - 成功通过福州特殊路口等极端场景,展现出链式思考能力(CoT)和全局理解能力[17][18] - 模型累计训练2000多万条30秒视频片段,参数规模与数据量扩大过程中持续显现Scaling Law效应[43][46] 行业影响 - 首次从技术层面回应了"端到端只能模仿不能超越"的行业质疑,为L2与L4的技术路线融合提供新思路[27][60] - 云端算力达10 EFLOPS,集群效率超90%,全链路迭代周期5天,水平媲美顶尖AI公司[50][51] - 技术体系已实现车、机器人和飞行汽车通用,推动"AI定义汽车"向具身智能延伸[62][63][64] 产品落地 - 最新SUV G7预售价23.58万,成为量产L3级AI算力第一车,采用无激光雷达方案[2][15] - VLM作为车辆"大脑"统一舱驾交互,VLA-OL模型增强"小脑"运动规划能力[55][56] - 公司从2024年开始全面转向新技术路线,与行业主流方案形成明显差异[23][50]
AI学习机,比的是什么?
36氪· 2025-06-11 20:09
行业概况 - AI学习机市场快速增长 2024年上半年网上零售额增长136.6% [13] - 2025年学习机销量预计突破700万台 接近iPad在中国市场的800万台销量 [3] - 行业呈现三大阵营格局:教培系(学而思/猿辅导)、科技派(科大讯飞/小度)、老牌厂商(步步高/读书郎) [13][15][17] 产品特征 - 价格高端化 学而思最新款售价8299元 相当于iPhone 16 Pro Max [3][15] - 核心功能升级 支持智能语音交互/1v1个性化辅导/云端实时更新题库 [7] - 场景专一化 彻底屏蔽游戏社交软件 配合家长端APP实现学习监测 [9] 技术演进 - 采用双核架构 学而思搭载自研九章大模型与DeepSeek通用模型 [15] - 科大讯飞星火认知大模型达到国内领先水平 支持数学追根溯源功能 [15] - 老牌厂商算法依赖外部合作 难以实现动态知识图谱 [17] 竞争要素 - 题库数据为核心 需覆盖全国各省市真题/模拟题/名校试卷 [18][20] - 垂直领域内容成壁垒 艺术/音乐/编程等细分赛道积累不足 [20] - 解题准确性是关键 需优化算法减少逻辑错误和过度推理 [20] 市场需求 - "双减"政策推动需求 替代线下补习班和线上网课 [11] - 解决教育资源不均 三四线城市可获取内置名师课程 [11] - 满足碎片化学习 提供实时解题思路和灵活学习时间 [11] 产品局限性 - 非万能解药 效果取决于学生主动性和使用方法 [22] - 附加功能冗余 视频通话/家长伴读等非核心需求 [23] - 本质仍是工具 不能替代系统化学习过程 [23]
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
混沌学园· 2025-06-10 19:07
核心观点 - AI技术正在重新定义商业创新模式,企业需转变思路以保持竞争力 [1][2] - OpenAI和DeepSeek分别通过不同路径实现AI技术突破,为行业提供创新范式 [3][4] - AI能力的"涌现"现象成为技术跃迁的关键特征 [19][20][21] - 人机交互范式因ChatGPT发生根本性变革 [22][23][24] - 中国公司DeepSeek打破"美国原创、中国应用"的思维定式,展现基础研究实力 [75][77][78] OpenAI的创新路径 创立背景 - 2015年由马斯克和奥特曼创立,初衷是防止AI技术被巨头垄断 [9] - 从谷歌挖来核心科学家伊利亚·苏茨克维尔,坚持开源、安全、普惠理念 [10][12] 技术突破 - 基于Transformer架构的"自注意力机制"大幅提升语言理解能力 [13] - Scaling Law揭示模型规模与性能的线性关系,指导大规模投入 [15][16] - GPT系列模型通过"涌现"现象实现能力跃升,参数量临界点触发智能爆发 [19][20] 产品里程碑 - ChatGPT通过自然语言交互降低使用门槛,引发全球现象级应用 [22][23] - 推理模型o1实现从直觉思维(系统1)到理性推理(系统2)的认知跃迁 [26][30] DeepSeek的逆袭战略 技术路线 - 提出"有限Scaling Law",在资源受限下追求高性能 [32][33] - MLA技术优化内存效率,MoE架构实现计算资源动态分配 [38][39][42] - V3模型6710亿参数仅激活37亿,训练成本5557万美元(行业1/10) [44] 核心突破 - R1模型采用纯强化学习(类似AlphaGo Zero),展示完整推理过程 [45][47][49] - 在奥数竞赛中与OpenAI o1准确率相当,登顶美国应用榜单 [50][51] 组织创新 - 动态团队构成和自组织管理激发"涌现"式创新 [55][56][57] - 研究员自主提出MLA架构和训练公式,体现扁平化协作 [59][60] - 150人论文署名包含数据标注员,打破传统KPI束缚 [61][62] 行业启示 技术趋势 - AI从专用工具向通用智能演进,"涌现"成为能力突破关键指标 [20][21] - 对话式交互(ChatGPT)和推理能力(o1/R1)定义下一代AI标准 [23][26][45] 创新生态 - 中国公司首次在基础研究领域实现全球领先,打破技术跟随惯性 [75][77] - 资源效率(DeepSeek)与规模投入(OpenAI)并存,拓宽行业可能性 [32][44] 组织变革 - 传统金字塔管理让位于开放协作和资源自由调配的新型研发模式 [55][63][68] - "非标准人才"和纯粹技术热情成为创新核心驱动力 [66][67]
AI展望:NewScaling,NewParadigm,NewTAM
华泰证券· 2025-06-10 09:43
报告核心观点 - 全球AI发展呈现模型端新架构探索、算力端需求上行与硬件设计进入新范式、应用端商业模式变革的趋势,持续看好AI产业投资主线,全球AI应用将进入业绩收获期 [1] 模型:预训练Scaling Law有望开启新起点 - 大模型技术路线从预训练到后训练发展,2018 - 2024年9月为预训练阶段,2024年9月后进入后训练阶段 [13][15] - 腾讯混元Turbo - S通过创新架构实现性能与效率平衡,Google Gemini Diffusion在文本生成上有突破,大厂在预训练参数量和数据量扩大上有尝试,大规模算力集群支持预训练探索,模型架构改进或使预训练Scaling Law开启新起点 [23][24][25] 算力:训练推理两条主线共同推动算力需求持续上行 训练端 - 后训练阶段Scaling Law成大厂共识,新Scaling路径不断涌现,新架构探索有望重启预训练阶段算力需求叙事 [33][34] - 以“星际之门”为代表的大规模算力集群进展顺利,中东版“星际之门”落地,主权AI逐步落地,台积电新产能规划预示算力需求乐观 [38][41][42] 推理端 - Agent需求增长或使推理算力提升几十至上百倍,大量工具调用和信息交互使tokens消耗量大幅提升,产品用户数量增长带动算力需求提升 [43][46][52] 算力硬件新范式 - 大模型对系统综合能力要求提高,NVLink Fusion强化英伟达硬件生态优势,国产算力加速迭代,华为云推出新服务器,高密度机架方案为性能追赶提供路径 [57][58][60] 应用:Agent进展提速,看好AI应用进入业绩收获期 Agent发展情况 - Agent可能是AI应用终极形态,目前雏形初具,但完成复杂长期任务能力有限,“任务长度”是关键衡量指标且提升速度快 [68][73][74] - MCP统一了Agent工具调用生态,促进其快速构建和发展 [79] 海外AI应用 - AI Coding是重要垂类赛道,细分垂类商业化效果好,25Q1业绩大部分超预期,头部2B软件AI产品存量客户渗透率接近10%,全年收入有望加速增长 [82][84][85] 国内AI应用 - 加速从简单环节到复杂环节产品升级,25Q1利润指标率先改善,AI商业化24年初步验证,25年有望加速复制推广,MCP有望加速产业节奏 [88][90][94] 落地节奏展望:商业模式变革有望成为共识,看好细分领域率先放量 商业模式变革 - Agent应用从交付工具转变为交付结果,按效果付费新范式有望成行业共识 [99] 细分场景放量 - 数据复杂度低、幻觉容忍度高的场景率先实现规模化商业落地,2C场景商业化进展领先,2B应用分场景和行业来看,数据复杂度和预算影响落地节奏 [103][104][110] AI + 营销/销售 - 数据丰富、可量化ROI和流程标准化驱动AI快速商业化,企业需求从单一工具向全链路智能中枢升级,市场格局分散,AI有望重塑格局 [113][114][119] 重点公司推荐 - 推荐金山办公、福昕软件、泛微网络等多家公司,均给予“买入”评级 [7]
Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?
Founder Park· 2025-06-06 23:03
Google AI战略与产品进展 - Google通过整合Brain和DeepMind团队成立Google DeepMind 显著提升AI研发能力[5][6][9] - 公司TPU基础设施投资已持续十年 目前正扩大规模以支持大模型训练[6][8][12] - Gemini系列模型处理token量从12个月前的9 7万亿/月暴增至480万亿/月 增长50倍[27][28] - 推出Gemini 1 5 Pro、Flash等差异化产品线 Pro模型能力达Ultra的80%-90%但成本更低[30][31] 搜索业务AI化转型 - 搜索未来将部署多路径检索模型 整合网络信息并引导至有价值内容[4][14] - AI概览功能已嵌入广告 用户反馈积极并推动产品增长[15][16][18] - AI模式作为独立标签页测试 成熟后将逐步迁移至主搜索页面[18][21] - 非英语用户受益显著 Gemini多模态能力打破语言信息壁垒[15][22] 技术突破与行业影响 - 30%代码由AI辅助生成 整体工程效率提升10%[32][33] - 计算领域下一个交互范式是AR Project Astra项目将重塑Android XR生态[36][37][38] - 自动驾驶领域Waymo完成1000万次付费服务 最后20%技术攻坚比初期80%更耗时[39][40] - 当前处于AJI(非均衡AI)阶段 2030年前或难实现AGI但各维度将现飞跃[42][43][44] AI长期价值与产业变革 - AI独特之处在于递归式自我改进 将超越电力成为人类史上最重要技术[57][58] - 创造力门槛降低将释放全球80亿人认知潜力 内容创作群体或达十亿级[60][62][64] - 未来顶级内容体验仍依赖人类特质 AI生成与人类创作将长期共存[63][64][66] - 模型推理能力构建基于科学原理而非硬编码规则 尤其在数理领域[25][26][29]