Workflow
生成式AI
icon
搜索文档
海外自动驾驶专题报告:真L3加速推进与L4多场景爆发,海外自动驾驶投资风口
西南证券· 2025-06-25 17:00
报告行业投资评级 未提及 报告的核心观点 - 发展现状仅实现L2+大规模上车,真L3技术有望年内落地,L4限定场景商业模式有望跑通,头部企业有望2025年年内盈利 [3] - 技术方向催化方面,L3技术关注VLM技术量产上车和头部车企VLA模型落地,L4技术关注Robotaxi和Robovan场景,L2+、L3、L4技术需求利好核心零部件销量 [3][141] - 相关标的包括L3技术方向的全栈自研车企,L4技术方向的技术解决方案公司,以及L2+、L3、L4技术方向的核心零部件企业 [3][141] 根据相关目录分别进行总结 自动驾驶的分类和定义 - 自动驾驶分为L0 - L5共6个阶段,L0为人类手动驾驶,L1可辅助驾驶,L2可部分自动驾驶,L3可脱眼,L4可脱脑,L5为无人驾驶 [6] - 国际和国内高级别自动驾驶分级基本一致,但在责任定义上存在差异,国际标准强调企业主导,中国标准强调安全优先 [11][12] 自动驾驶的历史今生 - 自动驾驶经历早期探索、初步发展、技术突破、高速发展等阶段,未来理想引入认知模型,小鹏预计2025年年内实现L3上车,特斯拉计划2027年量产无人网约车 [14] 自动驾驶技术路线 - 技术层级包括感知端、决策段、执行端,感知端有以激光雷达为主的多传感器路线和纯视觉路线,决策段从规则算法到端到端算法,执行端从传统执行系统到线控执行系统 [20] - 算法架构从2D CNN到BEV+Transformer再到端到端算法,经历多次变革,端到端算法有显式和隐式两种落地形式 [22][36] - 端到端2.0结合生成式AI技术,特斯拉的World Model和理想的VLM认知模型可应对长尾场景,VLA正成为2025年头部车企竞逐焦点 [55][71][76] - L3和L4技术路径差异由目标场景的安全要求、责任归属和商业化逻辑决定,L3看重成本和安全权衡,L4对安全要求高 [86] 自动驾驶商业模式 - 自动驾驶技术变现方式为卖产品、卖服务、卖技术,国内外L3/L4双线并行发展,产业链相关企业均有望受益 [91][94] - L3级由全栈自研车企主导,2025年是商用元年,政策、技术和成本推动其向大众市场普及 [96] - L4四大场景包括Robotaxi、Robotruck、Robobus、Robovan,市场空间、技术壁垒、盈利情况各有不同,运营模式分为To C、To B、To G [101][113] 必争之地Robotaxi - 行业生态由技术提供方、平台运营方、整车提供方组成,营运模式有自运营模式和金三角模式 [122] - 接管频率、日均订单量、累计里程数是重要指标,Waymo接近商业化技术拐点,萝卜快跑和小马智行已实现单车盈亏平衡,萝卜快跑安全性与人类持平,Waymo超越人类 [125][126][133] 相关标的 - L3技术方向关注全栈自研车企,L4技术方向关注技术解决方案公司,L2+、L3、L4技术方向关注核心零部件企业 [3][141]
从技术狂欢到盈利拷问,中国AI2.0的集体造血焦虑
虎嗅· 2025-06-25 16:19
中国AI2.0企业生存图景 - 行业面临技术迭代高成本、商业化落地迟滞、客户转型困难等共性挑战,呈现集体"造血焦虑"[2] - 资本输血速度放缓,细分赛道可持续模式成为破局关键,行业进入技术理想与商业现实的残酷下半场[3] - 五家代表企业通过迥异路径探索商业化与技术创新平衡点:商汤转型生成式AI、黑芝麻聚焦智驾芯片、萤石深耕智能家居、群核专注空间设计、创新奇智锚定制造业[4][26][41][57][81] 商汤科技业务转型分析 - 2024年实现收入37.72亿元(+10.75%),近三年首次正增长,生成式AI贡献63.7%收入达24.04亿元(+103.1%)[5][10] - 业务结构从传统AI(占比<30%)转向生成式AI+智慧汽车,完成从CV龙头到生成式AI的转型[7][8][9] - 毛利率从2020年70.6%降至2024年42.9%,主因算力中心硬件成本增加,五年累计亏损464亿元[16][18][25] 黑芝麻智能商业模式 - 2024年收入4.74亿元(+51.92%),自动驾驶芯片贡献92.4%,以华山A1000(单价300美元)等平价产品切入市场[27][30][31] - 采用"芯片+软硬一体"捆绑销售模式,毛利率从24.68%提升至41.14%[35][36] - 研发投入持续高企(2024年14.35亿元达收入3倍),导致经调整亏损13.04亿元[38][39] 萤石网络业务结构 - 2024年收入54.42亿元(+12.41%),智能摄像机贡献54%收入,全球出货量1831万台保持第一[44][45] - 云平台服务成为第二增长曲线,收入从5.38亿元增至10.52亿元,毛利率提升至76%[49][50] - 营销费用占比15.77%侵蚀利润,净利率从11.63%降至9.26%[53][56] 群核科技市场定位 - 2024年前三季度收入5.53亿元(+13.19%),98.3%来自空间设计软件订阅,市占率22.2%[66][68][79] - 拥有物理特性仿真数据库构建护城河,毛利率持续改善至80.47%[72] - 期间费用率超100%,24Q3经调整亏损0.94亿元(净利率-17%)[76][78] 创新奇智发展困境 - 2024年收入12.22亿元(-30.21%),汽车装备等制造业场景收缩导致首次收入下滑[85][87] - 采用外包模式控费,期间费用率66.3%低于同行,毛利率微升至34.62%[90][91] - 2024年亏损收窄至1.17亿元,但商业化进度不及预期[94]
AI替代程序员?一项最新测试的结果恰恰相反 | 企服国际观察
钛媒体APP· 2025-06-25 13:54
AI编程技术现状 - 当前顶级大模型(包括GPT-4o、DeepSeek R1、Claude 3等20个)在编程竞赛类问题中表现有限,中等难度问题通过率仅53%,高难度问题通过率为0% [3][4] - 模型优势集中在知识密集型任务(如组合数学、线段树、动态规划),但在需要观察力、创造力或复杂算法推理的观察密集型任务中表现显著落后于人类专家 [4][7] - 失败主因是概念错误和高级推理能力不足,即使增加尝试次数仍难以解决高难度问题 [5][7] 行业竞争格局 - 国际科技巨头(微软、OpenAI、谷歌)聚焦智能体和复杂任务处理,如GitHub Copilot、Codex智能体、Gemini 2.5 Pro等 [6] - 国内厂商(字节跳动、美团)侧重本土化适配和快速开发工具,推出MarsCode一站式平台、NoCode等产品 [6] - AI编程工具已覆盖代码补全、生成、错误修复及自主任务执行等核心功能,支持主流开发环境 [6] 技术应用边界 - AI当前主要替代知识密集型编程场景(如标准化代码生成),但无法替代需创造性解决复杂问题的人类程序员 [7] - 模型性能提升依赖实现精度和工具增强,而非本质推理能力突破,距离通用人工智能仍有显著差距 [4][7] - 行业共识认为大模型优势场景仍局限在知识密集型领域,非结构化问题仍需人类专家介入 [7]
高盛:中国生成式AI应用的商业变现之路(英文)
搜狐财经· 2025-06-25 13:43
中国生成式AI应用的商业变现之路 - 核心争论聚焦于货币化、护城河与知识产权、用户案例和成本四个方面[1][6] - 消费级AI应用月活跃用户突破1000万,付费比率3%-13%[1][8] - 企业级AI软件目标客户约1000家,收入贡献目前为个位数到十几[1][8] AI定价策略 - 消费级AI工具年定价20-200美元,多模态内容成本更高[2][9] - 企业级AI应用订阅费80-1000美元/用户/年,或3000-20000美元许可费[2][9] - 消费级提供7-30天试用期,企业级为大规模客户提供预训练定制服务[2][10] AI用户案例分类 - AI创作包括图像、视频、音频生成与编辑[2][28] - AI生产力涵盖数据分析、排程、编码、文档生成[2][28] - AI行业工具涉及教育、医疗、建筑等领域[2][28] - AI企业服务包含金融、人力资源、供应链等[2][28] 供应商差异化优势 - 用户愿为差异化功能付费,如美图AI摄影自然美化功能[2][10] - 企业级AI需执行复杂任务并产生高ROI,从高管层开始采用[2][10] - 平台整合AI与软件功能优化工作流程,积累行业知识形成护城河[6][10] 当前AI三大不同点 - 计算成本降低,DeepSeek API令牌费0.6美元/百万,低于OpenAI的1.6-8.0美元[3][16] - 从AI副驾驶发展到能规划工作流程的AI代理[3][16] - 个人或企业知识中心可生成更高准确度的定制化答案[3][16] 企业级AI付费驱动因素 - 企业偏好能带来高ROI、理解业务知识并独立完成复杂任务的AI工具[17][18] - 应用供应商开发行业级AI模型和标准化解决方案[17][18] - 企业初期在管理层投入更多,逐步扩展到所有员工[17][18] 消费级AI付费驱动策略 - 聚焦1-3项AI功能,利用70-130亿定制化模型增强性能[18][19] - 面临平台供应商竞争,通过更长试用期优先扩展用户[18][19] - 保留用户依靠优质AI功能和更好效果[18][19]
慧与科技(HPE.US)紧抱英伟达(NVDA.US)大腿 在Discover大会重磅发布AI服务器新品
智通财经网· 2025-06-25 10:03
产品发布 - 公司发布新一代ProLiant Compute Gen12服务器,搭载NVIDIA RTX PRO 6000 Blackwell GPU [1] - 推出全新HPE Compute XD690高性能AI服务器,配备8个NVIDIA Blackwell Ultra GPU模块 [1] - 发布HPE Alletra Storage MP X10000高性能AI存储系统 [2] - 推出HPE OpsRamp Software人工智能算力平台,与NVIDIA Enterprise AI Factory服务配合使用 [2] 合作伙伴关系 - 公司与英伟达深化长期AI算力合作伙伴关系,共同打造"全栈AI工厂基础设施" [1][4] - 通过26家全新Unleash AI合作伙伴,加速实现AI价值创造 [2] - 与Veeam达成协议,帮助数据迁移和强化可移植性 [3] - 与CommVault扩大合作,抵御网络威胁并防止数据丢失 [3] 战略方向 - 公司从传统服务器商转型为"混合云计算订阅平台 + AI基础设施"提供者 [5] - 借助GreenLake混合云订阅模式与Cray超算技术,主攻"全栈AI工厂"解决方案 [4] - 公司CEO强调生成式AI、AI智能体及物理AI的潜力,认为构建正确的IT基石至关重要 [2] 市场表现 - 公司HPC & AI业务2023财年营收同比增长25% [5] - AI-高性能优化服务器在2024财年第四季创下单季9亿美元销售额纪录 [6] - 华尔街预计到2026财年该业务板块规模可望逼近60亿美元 [6] 行业竞争 - 公司与超微电脑、戴尔科技在AI服务器领域构成直接竞争关系 [4] - 三大AI服务器领军者均深度强化与英伟达合作,争夺优先获得新品AI GPU供给 [4]
生成式AI司法应用引争议
科技日报· 2025-06-25 07:30
今年5月11日,美国亚利桑那州高级法院的刑事量刑听证会上,出现了震撼人心的一幕:2021年一起案 件中的遇害者克里斯·佩尔基,竟通过视频向法官作出了感人至深的陈述。这段视频并非佩尔基本人生 前录制,而是其家人运用生成式人工智能(GenAI)技术,根据他生前的语音记录、影像资料"重塑"出 的数字影像,让他得以"亲口"道出心声。最终,法官采纳了这段特殊证词,开创了AI生成内容作为法庭 证据的司法先例。 自佩尔基案以来,GenAI在美国司法实践中的应用呈现指数级增长。美国缅因州执业律师斯蒂芬·施瓦茨 评价道,在确保准确性的前提下,GenAI不仅是提升效率的利器,更是推动司法进步的重要力量。 事实上,这不是生成式AI技术首次涉足司法领域。据物理学家组织网6月19日报道,这项能够创造文 本、图像、音频、视频等内容的AI技术,正悄然改变着法庭的运作方式:法官借助它厘清复杂案情, 律师用它高效撰写法律文书,普通诉讼当事人也能通过它获得辩护支持。然而,这项技术犹如一柄双刃 剑,在提升司法效率的同时,其准确性与公平性也受到质疑,它能否成为司法公正的助推器仍需观察。 GenAI或影响司法格局 美国西北大学普利兹克法学院丹尼尔·林 ...
腾讯研究院AI速递 20250625
腾讯研究院· 2025-06-24 23:13
谷歌ASMR纸艺视频 - 谷歌Gemini推出七段纸艺ASMR解压视频,内容涵盖火烈鸟水中起舞、圣托里尼落日等场景,采用高精准提示词生成和定格动画技术 [1] - 视频通过纸质艺术形式结合恰当背景音呈现梦幻效果,研究显示此类内容因帮助放松情绪而广泛传播 [1] - ASMR被视为从生产力工具转向美学与治愈的另类方式 [1] ElevenLabs语音助手11ai - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,支持日程管理、任务安排和信息查询 [2] - 集成Perplexity搜索并与Notion、Linear等工具对接,探索对话式AI在工作流程中的实际应用 [2] - 技术覆盖32种语言,已应用于有声书、游戏配音及医疗训练领域,中文能力待提升 [2] 微软Mu模型 - 微软Mu模型仅3 3亿参数,性能媲美参数量大10倍的Phi-3 5-mini,NPU设备上每秒响应超100 tokens [3] - 采用双重层归一化、旋转位置嵌入和分组查询注意力三大创新,优化Transformer架构效率 [3] - 支持Windows智能体功能,可将自然语言指令实时转化为系统操作,响应时间低于500毫秒 [3] 商汤科技任务规划助手 - 商汤科技推出办公小浣熊"任务规划助手",通过交互式AI将复杂问题拆解为可执行步骤 [4][5] - 工具通过持续对话挖掘需求细节,思维链条可追溯,适用于职业规划、投资分析等领域 [5] - 最终生成逻辑严密的图文规划报告,实测在学业选择等场景表现突出 [5] QQ浏览器AI高考通 - QQ浏览器"AI高考通"可在3-5分钟内生成高考志愿报告,包含院校解读、风险提示等六大板块 [6] - 提供个性化"冲稳保"院校专业清单,含分数线、学费等数据,支持多方案对比 [6] 码上飞AI Agent平台 - "码上飞"平台支持通过自然语言直接生成鸿蒙应用,采用多智能体系统实现全流程自动化开发 [7] - 用户仅需5分钟即可生成完整应用,支持一键发布为小程序、APP或网站并获取源代码 [7] 谷歌AR眼镜Martha - 谷歌AR眼镜开发者版本代号"Martha",基于Android XR平台,配备棱镜显示屏和内置相机 [8] - 配套应用界面类似Pixel Watch,含通知、视图记录等功能,明显针对测试人员设计 [8] 充电宝召回事件 - 安克创新和罗马仕共召回120万个充电宝,因电芯供应商安普瑞斯未经批准变更隔膜材料 [10] - 锂电池隔膜是关键安全组件,安普瑞斯因扩产导致制程管理问题,相关认证已被暂停 [10] 马斯克创业观点 - 马斯克强调第一性原理思维,主张从公理推演而非传统分析,以"效用乘以受益人数"衡量价值 [11] - 预测数字超级智能即将实现,成为多行星物种将显著延长人类文明寿命 [11] AI Native产品理念 - AI Native核心是构建AI与人的新关系,需考虑情商和生命感,而非单纯工具化 [12] - 实现需宽输入(环境感知)和柔输出(分步协同),创业者需同时服务用户与AI [12]
又一家SOC厂商下场“抢生意”,下游AI消费硬件市场卖爆
21世纪经济报道· 2025-06-24 18:12
生成式AI与消费硬件结合趋势 - 生成式AI与消费硬件结合成为最热产业趋势 正拉动端侧AI芯片强劲需求 [1] - 京东618期间 AI手机成交额同比增100% AI智能眼镜成交量同比增超7倍 AI音频产品成交用户同比增超3倍 具身智能机器人品类成交额同比增17倍 [1] - 未来每人身边至少有5个端侧大模型 包括手机 电脑 汽车 人形机器人 外骨骼等领域 [1] - 从云端集中计算转向边缘与端侧智能 数据隐私与实时性需求推动算力下沉 [1] AI硬件产品发展现状 - AI已进入多种终端 包括AI手机 AIPC AI可穿戴产品 AI车载系统 AI工业终端 AI玩具 机器人等 [2] - 2025年全球AI手机渗透率预计达34% 苹果 三星 华为 小米 OPPO vivo等厂商积极布局 [2] - AIPC核心在于本地运行大模型 解决个性化问题 苹果 英特尔 联想 华为 小米均在布局 [2][3] - AI可穿戴产品层出不穷 Meta 谷歌 字节跳动等企业推出搭载AI功能的设备 [3] - AI陪伴类产品成热点 如Robopoet珞博智能推出的"芙崽Fuzozo"AI养成系产品 [3] 端侧芯片市场发展 - 恒玄科技2024年推出BES2800芯片 采用6nm工艺 单芯片集成多核CPU/GPU NPU等 支持健康算法全天候运行 [5] - 恒玄科技2024年营收32%来自手表/手环芯片 收入同比增116% 出货量超4000万颗 2024Q1占比超40% [5] - 晶晨股份2025Q1自研智能端侧算力芯片出货近400万颗 达2024全年50% 预计2025年推新一代SoC芯片 [6] - 星宸科技2024年发布SSC309QL智能眼镜方案 预计2025年下半年出货 正开发下一代运动及智能穿戴芯片 [6] 行业前景与挑战 - AI基建持续投入与训练成本降低为产品放量提供催化 [3] - 当前瓶颈在于产品定义而非技术能力 AI功能带来渐进式提升而非销量爆发 [6] - AI端侧产品以玩具为第一轮代表将快速落地 硬件研发测试需以年立项推进 [7]
众所周知视频不能P?北大施柏鑫团队、贝式计算CVPR研究:视频里轻松换衣服、加柯基
机器之心· 2025-06-24 17:31
机器之心发布 机器之心编辑部 视频是信息密度最高、情感表达最丰富的媒介之一,高度还原现实的复杂性与细节。正因如此,视频也是编辑难度最高的一类数字内容。在传统的视频编辑流程 中,若要调整或替换主体、场景、色彩或是移除一个物体,往往意味着无数帧的手动标注、遮罩绘制和精细调色。即使是经验丰富的后期团队,也很难在复杂场 景中保持编辑内容的时间一致性。 近年来,生成式 AI 尤其是扩散模型与多模态大模型的快速迭代,为视频编辑带来了全新的解题思路。从早期基于规则的特效工具,到目标识别与自动分割,再到 基于文本指令的视频生成与重绘,尽管 AI 已经为视频编辑带来了效率与可控性的双重提升,但在精度要求较高的场景中仍存在一系列挑战,例如当前很多零样本 方法在处理连续视频帧时容易造成画面闪烁;对于背景复杂或多目标场景,可能会出现错位、模糊或语义偏差。 针对于此,北京大学相机智能实验室(施柏鑫团队)联合 OpenBayes贝式计算,以及北京邮电大学人工智能学院模式识别实验室李思副教授团队,共同提出了一种 结合草图与文本引导的视频实例重绘方法 VIRES,支持对视频主体的重绘、替换、生成与移除等多种编辑操作。该方法利用文本生成视频模 ...
TCL出海“升维”:创新效率提升超50% 云原生如何再造全球供应链
环球网· 2025-06-24 16:26
公司全球化战略 - 公司全球化战略从"产品输出"升级为"生态共建",与全球一流资源和企业建立深度协同[1] - 公司业务遍及160多个国家,年营收超3000亿元[1] - 早期国际化通过收购法国汤姆逊彩电和阿尔卡特手机业务实现产能布局[2] 数字化转型关键举措 - 与亚马逊云科技合作实现245个国家和地区数据覆盖,满足GDPR等区域性法规合规要求[4] - 仅用3个月构建海外无服务器IoT平台,降低20%成本并提升19%性能[6] - 新产品接入全球IoT平台周期从30人天压缩到1人天,业务研发费用降低50%[5] 技术创新成果 - 使用Amazon IoT Core实现全品类设备互联互通,推进Matter开放协议实现跨品牌互联[5] - 生成式AI应用使电视人机交互"固定样板"回复率环比下降25.6%[5] - AI绘画大模型可在3秒内根据三个关键词生成画作[7] AI深度应用场景 - 电视语音助手理解复杂指令能力提升,自动识别影视场景优化画质参数[7] - 人力资源工时统计从半天压缩到即时生成,管理层可实时获取全球库存数据[7] - 采用分层架构实现端云协同,通过模型蒸馏技术降低推理成本[7] 未来技术方向 - 探索Agent技术实现自然语言理解直接执行指令[8] - 研发具身智能家庭机器人,攻关长序列动作编排[8] - 生成式AI深度渗透和企业运营全局优化是未来两大合作方向[8] 全球化发展阶段 - 硬件出海1.0阶段通过收购实现[9] - 产能出海2.0阶段建立全球供应链[9] - 生态出海3.0阶段以云计算和AI为基石[9]