Workflow
深度学习
icon
搜索文档
吴晓波:“AI闪耀中国”2025(年度演讲全文)
新浪财经· 2025-12-29 11:18
文章核心观点 - 人工智能革命是事关国运的世纪大竞赛,中美两国是主要参与者,正沿着不同路径发展并形成竞争格局 [21][24][30] - 人工智能已从技术概念进入大规模产业应用阶段,正在深刻改造中国的制造业、服务业、金融业等几乎所有行业,并定义新的工业革命阶段 [19][57][103] - 2025年是人工智能应用爆发的关键年份,涌现和泛化成为技术发展的核心特征,工具普及使得每个普通人和企业都有机会成为AI时代的主角 [17][59][136] AI发展历程与现状 - 人工智能概念于1956年达特茅斯会议上提出,历经70年发展,在硬件(如英伟达、阿斯麦)和算法(如深度学习、Transformer)上取得关键突破后,于2022年11月30日以GPT-3.5上线为标志进入爆发期 [6][8][10] - 2025年1月15日,幻方量化旗下的DeepSeek产品出现,上线一个月下载量突破一亿,标志着AI应用开始深度改变生活 [15] - 当前AI发展呈现“涌现”(能力指数级跳跃)和“泛化”(多学科、多产业、多主体应用)两大特征 [17] 中美AI竞赛格局 - **算力投资**:2025年美国AI基建投资超3500亿美元,预测2030年累计达3-4万亿美元;2025年中国AI基建投资6300亿人民币,预测2030年累计超10万亿人民币 [24] - **算力分布**:全球算力美国占74.5%,中国占14%,美国是中国的5.3倍;超大规模数据中心数量美国是中国的4倍 [26] - **大模型生态**:中美大模型数量占全球80%以上;在图像生成、编辑、文生视频、文本能力等领域,中国模型如阿里Qwen、腾讯Hunyuan、字节Seedream等已进入全球前列 [28] - **发展路径**:美国聚焦AI芯片、大规模基建和闭源大模型的从0到1创新;中国依托制造和应用市场优势,利用AI改造生产线与产品,并发展开源大模型,实现从1到N的应用创新 [30] AI在多模态内容生产中的应用 - 多模态AI工具(如千问APP)使得非技术人员也能轻松完成文生图、生成电商图、创意短视频等内容创作 [34][36] - AI漫剧行业在2025年产量同比增长超600%,流水规模增长12倍,制作周期从90天缩短至10-15天,成本下降60-90% [38] - 动作捕捉与数字人技术成熟,可实现实时动作模仿与内容生产,为文化娱乐产业带来变革 [39][40] - 多模态技术进化可能使硅基人类的内容生产能力达到碳基人类的100倍以上,促使个人能力需要被重新定义 [43] 行业大模型的具体实践 - **金融业**:上海银行通过改写底层应用,成为全球首家AI原生手机银行,服务上海500多万老年人通过语音完成支付 [44] - **大宗商品贸易**:厦门国贸构建“铁矿石智慧决策链”,利用大模型预测价格走势,准确率达65%,铁矿石价格每波动1个百分点可能带来数十亿元盈亏变化 [46][48] - **家居行业**:金牌家居通过“飞流AI”小程序,实现智能匹配全国90%以上存量户型、AI生成效果图与报价、一站式施工交付,服务已覆盖全国43个城市 [53][55] - **基础设施支持**:百度智能云作为AI基建商,其算力基础设施(如昆仑芯)和智能体Agent基础设施,助力众多企业构建行业大模型,服务65%的央企及100%的系统重要性银行 [50][51] 智能体(Agent)的元年应用 - 智能体已广泛应用于教育(如AI英语教师)、办公协同(如飞书智能体处理文件、报销等任务),显著提升组织效率 [58] - 联想推出全球首款AI PC及“天禧个人超级智能体”,通过“端-边-云-网-智”架构整合分散的智能体,管理个人知识库并保护隐私 [61][62] - 创业公司已能打造高度仿真的“类脑智能体”,如内置200多个神经节点、具备200多种表情的“吴晓波Agent”,展示了技术的进步与未来伦理挑战 [66][68][70] 具身智能机器人产业 - 中国具身智能机器人产业极其年轻,调研的30家企业中三分之二为近三年成立,创始人多为80后、90后,拥有博士20人、教授博导9人 [72] - 机器人已在多种场景落地:优必选搬运机器人效率相当于工人的40%;云深处巡检机器人用于下水道、火灾现场;银河通用、千寻智能、跨维等公司的机器人已应用于前置仓、拧螺丝、制作咖啡及养老服务 [77] - 中国占据全球具身智能机器人供应链的63%,该产业被视为未来十年四个十万亿级市场之一(另三个为汽车、房地产、养老) [78][80] - 机器人技术正向消费电子渗透,如荣耀发布全球首款“手机机器人”ROBOT PHONE,具备AI大脑和自动调整的云台摄像头 [82][84] 智能工厂与工业5.0 - 中国拥有全球最多的“灯塔工厂”,截至2025年9月全球203座中中国占85座(42%) [106] - 海信黄岛空调“灯塔工厂”应用70多项AI技术,如机器视觉、数字孪生,工人通过数字孪生环境训练15天即可出师,极大降低时间与耗料成本 [88] - 传统制造业通过AI实现升级:双鹿电池建成全球首条碱性电池黑灯生产线和AI质检系统,其电池AI配方工艺大模型将研发耗时从一个月缩短至30分钟 [90][91] - 更传统的瓷砖(东鹏)和酱油(海天)行业通过AI再造每个生产环节,东鹏永川工厂粉料车间仅需2人,海天通过“AI豆脸识别系统”年筛选2.5万亿颗黄豆,并实现全光谱检测和风味量化 [93][94][99][100] - AI助力中国制造业打破“规模化、定制化、低成本”的“不可能三角”,中国正在定义以机器视觉、深度学习、大模型、具身智能和全流程AI管理为特征的工业5.0 [103][104] AI对电商与服务业的重塑 - AI有望终结“流量霸权”,实现“流量平权”,通过智能体直接连接需求与交易,降低高昂的投流和平台成本(如外卖成本占比高达30%,女装退货率达70%) [109][111][113] - 已有落地应用:1688的“遨虾Agent”可帮助创业小白完成跨境电商的市场分析、供应商筛选、素材生成;1688AI版帮助上班族兼职开店,月赚3000元 [114][116] - 服务业广泛引入AI提升体验与效率:美容院用AI面部扫描仪提供专业诊断;餐厅用AI巡检系统;儿童照相馆用3D打印玩偶提高客单价(毛利超50%);“全诊通”AI系统服务全国1.5万家诊所;紫荆AI医院中,接诊1万病例的AI医生能力相当于十年经验医生 [130][131][133] - 供应链各环节涌现专业AI服务商,如“海纳”AI招聘、“特赞”市场调查、“凌迪”服装设计、“包小盒”包装设计等 [134] 消费级智能硬件创新 - 家电企业正将产品变为家庭服务入口,如智能冰箱通过传感器和自然语言交互管理膳食,并可联动电商完成生鲜配送 [140] - 方太推出全球首个AI健康烹饪大模型,将整个厨房变为操作系统,基于用户身高、体重、健康数据(如血糖、脂肪肝)从2.6万份菜谱中推荐健康方案 [140][142]
吴晓波:“AI闪耀中国”2025(年度演讲全文)
吴晓波频道· 2025-12-29 09:26
文章核心观点 - 人工智能革命是一场事关国运的世纪大竞赛,中美两国是主要参与者,正走上不同的发展道路[2][54] - 人工智能已从技术概念进入广泛产业应用阶段,正在深刻改造中国的制造业、服务业、电商等各行各业[32][92] - 2025年是人工智能的“泛化”与“涌现”之年,技术开始指数级增长并渗透到各个角落[28][29][30] - 人工智能时代属于每一个普通人,但只属于那些率先并善于使用AI工具的普通人[95][185] AI发展历程与意义 - 1950年艾伦·图灵提出“机器会思考吗”的划时代问题[6][9] - 1956年达特茅斯会议首次提出“人工智能”概念[11] - 1992年英特尔投资阿斯麦,1993年黄仁勋创立英伟达,为AI奠定了重要硬件基础[13] - 2006年杰弗里·辛顿提出“深度学习”,找到了AI发展的正确路径[14] - 2016年AlphaGo战胜李世石,2017年谷歌提出Transformer模型[15] - 2022年11月30日,OpenAI的GPT-3.5上线,两个月后月活用户超过一亿,标志着AI进入新纪元[17] - 2025年1月15日,幻方量化旗下的DeepSeek产品出现,一个月下载量突破一亿,引发广泛关注[24][26] - 比尔·盖茨评价ChatGPT的历史意义不亚于互联网或个人电脑的诞生[19] 中美AI竞赛格局 - AI三要素为算力、算法、大数据,中美是主要竞赛对手[40][41][46] - **算力对比**:2025年美国AI基建投资超3500亿美元,预测2030年累计达3-4万亿美元;2025年中国AI基建投资6300亿人民币,预测2030年累计超10万亿人民币[41] - 全球算力分布:美国占74.5%,中国占14%,美国是中国的5.3倍[43] - 中国电网装机总量是美国的近3倍,新增发电能力是美国的9倍,每年电网支出900亿美元,是美国的3倍[44] - **大模型能力**:2023年中美顶级AI大模型能力差距接近20%,2025年初缩小到0.3%[48] - **算法优势**:中国在图像生成、图像编辑、文生视频、文本能力等领域的大模型排名全球靠前[49][50][51][52] - **发展路径**:美国聚焦AI芯片、大规模基建、闭源大模型和从0到1的创新;中国聚焦用AI改造制造业、庞大的应用市场、开源大模型和从1到N的拓展[54][55] - 中美将在人工智能、机器人技术、能源存储、区块链技术和多组学测序五个领域角逐[55] 多模态内容生产革命 - 多模态技术进化,使得硅基人类的内容生产能力可能达到碳基人类的100倍以上[72] - 例如“千问”APP等工具,帮助服装创业者生成电商图、餐饮主理人生成宣传图、自媒体博主生成创意短视频[63] - AI漫剧行业在2025年产量同比增长超600%,流水规模增长12倍,制作周期从90天缩短到10-15天,成本下降60-90%[67] - 动作捕捉技术(如“动见万物”团队)可实现实时数字人模仿,为文化产业和车间应用带来变化[70] 行业大模型应用 - “有多少行业就会有多少个行业大模型”已成为现实[72] - **上海银行**:改造为全球第一家AI原生手机银行,服务上海500多万老年人,通过语音完成支付[73] - **厦门国贸**:牵头组建“国际物流供应链领域国家级人工智能应用创新平台”,其“铁矿石智慧决策链”对价格走势预测准确率达65%[76][78][79] - **金牌家居**:通过“飞流AI”小程序实现智能家装,可匹配全国90%以上存量户型,自动生成效果图和报价,已在43个城市开通服务[89][90] - **百度智能云**:2019-2024年连续六年中国AI公有云市场份额第一,服务65%的央企、100%的系统重要性银行及众多新能源汽车和具身智能企业[83] 智能体(Agent)元年 - 2025年成为智能体进入元年的时刻[93] - 飞书平台上的智能体可帮助调取文件、生成会议纪要、完成报销等,平台上有5万多名“效率先锋”使用AI工具[94][95] - **联想**:2024年4月18日发布全球第一款AI PC,并推出“天禧个人超级智能体”,致力于整合分散的智能体,管理个人知识库并保护隐私[97][98] - 联想开发的“AI足球智能体世界杯版”整合了过往世界杯所有知识[100] - 上海一家10人创业公司开发了全球第一个真人仿生“类脑智能体”——“吴晓波Agent”,内置200多个神经节点和200多种表情[102][104] 具身智能机器人市场 - 具身智能机器人被认为是下一个十万亿级市场[108][118] - 中国30家重要具身智能公司中,三分之二(20家)是在最近三年内成立的,创始人以80后、90后为主,多有博士、教授背景[109][110] - 机器人已能完成倒茶、擦桌、叠衣、打乒乓球、精准抓取玻璃碎片等复杂任务[112] - 众多机器人已进入真实应用场景:优必选搬运机器人效率相当于工人的40%;云深处巡检机器人用于下水道、火灾现场;银河通用前置仓机器人用于美团医药仓等[115] - 中国占据具身智能机器人全球供应链的63%[116] - AI玩具(如Labubu)和手机机器人(如荣耀ROBOT PHONE)是AI在硬件领域的重要落地形态[121][122][124] 智能工厂与工业5.0 - 中国正在定义工业5.0,其特征是机器视觉与深度学习、大模型与智能体、具身智能及全流程AI管理和检测的广泛应用[149] - **海信黄岛空调“灯塔工厂”**:应用70多项AI技术于焊接、装配、研发等环节,通过数字孪生技术将培训时间成本大幅降低[129] - **双鹿电池**:建成全球第一条碱性电池黑灯生产线、第一套5G+智能仓储系统、第一套AI质检系统;其电池AI配方工艺大模型将研发任务耗时从一个月缩短至30分钟[133] - **东鹏瓷砖永川工厂**:通过大模型动态均配料、粉料车间仅需2人、智能打印定制瓷砖仅需15分钟、用527米窑炉的“AI大脑”监测79项质量指标[135][136] - 2025年符合5A新国标的瓷砖仅占市场5%,而东鹏永川工厂2026年该比例将达65%[139] - **海天酱油“灯塔工厂”**:应用“AI豆脸识别系统”筛选2.5万亿颗黄豆、塔式制曲圆盘单次制曲超50吨、光谱检测仪实现全检、“电子鼻”识别170多种香型,经历119道工序、494项检测[142][143][145] - AI助力中国制造业打破了“规模化、定制化、低成本”的“不可能三角”[146][147] - 全球“灯塔工厂”数量:2025年4月全球189座,中国79座;9月全球203座,中国85座,占全球42%[151] AI电商变革 - AI有望终结“流量时代”,实现流量平权[155][162] - **1688平台案例**:其“遨虾Agent”可帮助创业小白分析市场、筛选供应商、生成宣传素材,轻松入局跨境电商[163][165] - “1688AI版”APP和“1688分销工作台”可帮助上班族一键开店,兼职运营宠物用品店等,月赚约3000元[166] - **千问APP**:阿里巴巴产品,上线23天月活突破3000万,已接入高德地图,可规划路线、推荐餐厅和景点,未来有望整合阿里生态内交易,实现需求到交付的闭环[169][170][171][174][175] AI在服务业的应用 - 传统服务业正借助AI提升服务能力和规模[180] - **美容院**:通过摄像采集仪进行脸部扫描,生成精准皮肤报告和美容建议方案[180] - **儿童照相馆**:如“第二人生”公司,3秒拍照后可制作3D彩色玩偶,客单价超千元,毛利超50%[180][181] - **医疗**:“全诊通”服务全国1.5万家诊所;清华大学紫荆AI医院中,AI医生接诊1万病例后能力相当于十年经验医生,接诊10万、100万病例后能力指数级跃升[183] - **供应链服务**:涌现“海纳”(AI简历筛选)、“特赞”(AI市场调查)、“凌迪”(AI服装设计)、“包小盒”(AI包装设计)、“猎财猫”(AI招聘)等专业AI服务公司[184] AI智能硬件创新 - AI创新产品正走进日常生活,提升消费体验[189] - **方太AI厨房**:推出全球首个AI健康烹饪大模型,拥有2.6万份健康菜谱,可根据家庭成员身体状况推荐菜谱;智能冰箱可成为家庭膳食管理入口,实现生鲜电商联动[193][194][196] - 智能油烟机工作噪音可降至53分贝,达到图书馆级静音[198]
收到很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2025-12-26 17:18
自动驾驶领域学术研究趋势与方向 - 行业观察到计算机、车辆、自动化和机械等专业背景的学生对自动驾驶研究方向存在普遍困惑,特别是在入门和选择前沿方向上[2] - 行业将自动驾驶研究方向分为前沿方向与相对不拥挤的赛道,前沿方向包括视觉语言动作模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型,相对不拥挤的赛道包括开集目标检测、占用网络以及少样本/零样本学习[2] - 针对不同专业背景的学生,行业给出了差异化的学习路径建议,对于自动化和计算机背景的学生,建议专注于深度学习相关的前沿方向,如视觉语言动作模型、端到端和世界模型,这些方向被认为从入门到工作乃至读博都有很大发展空间,对于机械和车辆背景的学生,建议从传统规划与控制或3D高斯泼溅等对算力要求较低、入手更简单的方向开始[2] - 行业强调方法论提升的重要性,建议研究者通过多阅读论文和交流来逐步形成自己的思考与想法,并指出新人研究者通常需要经历多次试错才能产生好的想法[2] 论文辅导服务覆盖的研究方向 - 公司提供的论文辅导服务覆盖了自动驾驶领域的众多前沿与关键技术方向,包括但不限于端到端自动驾驶、视觉语言动作模型、世界模型、强化学习、3D目标检测、多传感器融合、3D高斯泼溅、鸟瞰图感知、占用网络、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、流匹配、点云感知、毫米波雷达感知、单目感知以及车道线/在线高精地图构建等[3] 论文辅导服务内容与成果 - 公司提供的核心服务包括论文选题、论文全流程指导以及实验指导[6] - 此外,公司还提供博士申请指导服务[7] - 公司宣称其辅导服务的中稿率很高,并且已有辅导完成的论文被计算机视觉、人工智能、机器人、自然语言处理等领域的顶级会议和期刊收录,例如CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL等[7] 论文辅导服务的目标发表范围 - 公司的论文辅导服务旨在帮助客户在广泛的学术出版物上发表成果,目标范围包括自动驾驶领域的顶级会议和期刊,涵盖中国计算机学会推荐的A、B、C类会议/期刊,科学引文索引的一区至四区期刊,中国科学院分区的一区至四区期刊,以及工程索引和中文核心期刊,同时也涵盖毕业设计论文、博士申请和学术比赛等相关需求[10]
前馈GS在自驾场景落地的难点是什么?
自动驾驶之心· 2025-12-26 11:32
课程核心内容与结构 - 课程旨在提供一套全面的3D高斯泼溅技术学习路线图,从原理到实战,帮助学员掌握3DGS技术栈 [2] - 课程由自动驾驶之心联合工业界算法专家设计,历时两个月开发 [2] - 课程采用离线视频教学,配合VIP群答疑及三次线上答疑,开课时间为12月1日,预计两个半月结课 [13] 讲师背景 - 讲师Chris拥有QS20硕士学位,现任某Tier1厂商算法专家 [3] - 讲师从事端到端仿真、多模态大模型、世界模型等前沿算法的预研和量产,并参与过全球TOP主机厂的仿真引擎及工具链开发 [3] - 讲师拥有丰富的三维重建实战经验 [3] 课程大纲详解 - **第一章:3DGS的背景知识**:概述计算机图形学基础,包括三维空间的隐式/显式表达、渲染管线、光线追踪、辐射场渲染,并介绍COLMAP、SuperSplat、Gsplat等开发工具,附带基于3D Real Car训练模型的小作业 [6] - **第二章:3DGS的原理和算法**:详细梳理3DGS原理及核心伪代码,讲解动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法,实战部分使用英伟达开源的3DGRUT框架 [7] - **第三章:自动驾驶3DGS**:聚焦自动驾驶仿真重建,讲解浙大Street Gaussian、上交OmniRe和浙大Hierarchy UGP三篇工作,实战使用学术界和工业界广泛采用的DriveStudio [8] - **第四章:3DGS重要的研究方向**:探讨COLMAP扩展、深度估计及Relighting等研究方向,并分析其工业界应用与学术前景 [9] - **第五章:Feed-Forward 3DGS**:梳理前馈3DGS的发展历程与算法原理,讲解最新的AnySplat和WorldSplat算法工作 [10] - **第六章:答疑讨论**:通过线上交流形式,讨论3DGS岗位需求、行业痛点及开放性问题 [11] 课程面向人群与学后收获 - **面向人群**:课程要求学员自备GPU,推荐算力在4090及以上,并具备计算机图形学基础、对视觉重建/NeRF/3DGS有一定了解、有概率论与线性代数基础、熟悉Python和PyTorch [15] - **学后收获**:学员将掌握3DGS完善的理论知识及相关技术栈、掌握算法开发框架并能训练开源模型、可与学术界及工业界同行持续交流,对实习、校招、社招均有助益 [15] 行业技术动态与课程关联 - 前馈3DGS是当前热门方向,旨在克服传统“per-scene optimization”的不便,但其在点云精度上仍有不足,尤其在私有数据域上精度不稳定 [2] - 课程内容紧密联系行业前沿,如第三章聚焦自动驾驶仿真,第五章专门探讨Feed-Forward 3DGS [8][10]
英伟达的最大威胁:谷歌TPU凭啥?
半导体行业观察· 2025-12-26 09:57
谷歌TPU的发展背景与动机 - 谷歌作为全球最大的信息检索系统公司,其使命“组织全球信息”高度依赖机器学习技术,该技术自2000年代中期起已广泛应用于搜索排序、垃圾邮件过滤、广告点击率预测等核心业务,为公司创造了每年数十亿美元的收入[10][11] - 在深度学习兴起前,谷歌通过大规模通用服务器集群支撑复杂模型训练,例如一篇2012年的论文记录使用一个由1,000台机器、共16,000个CPU核心组成的集群,连续运行约三天来训练一个拥有10亿连接、处理1000万张图像的模型[11][12] - 随着模型规模和计算密度急速扩张,依赖通用CPU集群的方式触及性能与能耗瓶颈,促使谷歌转向专用机器学习加速器路线[13] - 谷歌于2011年启动Google Brain项目,旨在结合深度神经网络与公司庞大的分布式计算基础设施和海量数据,训练此前规模难以企及的神经网络系统[13] - 早期深度学习开发完全基于CPU运行,直到Alex Krizhevsky在2013年加入谷歌后,才引入GPU进行神经网络训练,谷歌随后于2014年决定购买约40,000个NVIDIA GPU,花费约1.3亿美元[18][23] - 尽管GPU在训练上表现优异,但在全球范围内大规模部署模型进行推理时面临挑战,例如,若每位Android用户每天仅使用三分钟语音识别,通过CPU进行深度学习推理将迫使公司服务器数量增加两到三倍,成本高昂[24][25] - 依赖GPU存在潜在效率损失和单一供应商的战略风险,促使谷歌考虑定制硬件方案,目标是在推理任务上相较GPU实现约10倍的成本性能优势[26][27] 第一代TPU (TPU v1) 的诞生与设计 - 谷歌在15个月内完成了从概念到数据中心部署的壮举,于2015年初成功部署第一代TPU[4][42] - 项目快速成功的关键因素包括:团队的单一日程焦点、采用700 MHz的时钟频率和完全调试的28nm工艺,以及数据中心部署团队的高效协调[42] - TPU v1的架构灵感源于1978年H.T. Kung和Charles E. Leiserson提出的“脉动阵列”理论,该设计通过有节奏的数据流动和计算,非常适合大规模矩阵运算[31][33][50] - TPU v1的核心是一个256x256的脉动阵列矩阵乘法单元,执行8位整数乘法,采用量化技术以节省芯片面积和能耗[62][65] - TPU v1采用CISC设计,仅有约20条指令,通过PCIe接口从主机接收指令,关键指令包括读取主机内存、读取权重、执行矩阵乘法/卷积、应用激活函数以及写回主机内存[66][67][68][69][70][72] - 软件栈方面,谷歌开发了驱动程序使其深度学习框架TensorFlow能够与TPU v1协同工作,确保与CPU和GPU软件栈的兼容性[73] - TPU v1由台积电采用28nm工艺制造,芯片面积的24%用于矩阵乘法单元,29%用于统一缓冲区内存,仅2%用于控制逻辑,体现了架构的简洁高效[74][75] - 在性能上,TPU v1专注于推理任务,其拥有NVIDIA K80 GPU 25倍的乘累加单元和3.5倍的片上内存,在推理速度上比K80 GPU和Intel Haswell CPU快约15至30倍,能源效率更是高出25至29倍[78][79] TPU的迭代演进与技术升级 - **TPU v2 (2017)**: 定位为服务端AI推理和训练芯片,架构上进行多项重大改变,包括引入通用向量单元、将矩阵单元作为向量单元的卸载、采用高带宽内存,并添加互连以实现高带宽扩展,其核心采用超长指令字架构和线性代数指令集[82][83][90][91][92] - **TPU v3 (2018)**: 在v2基础上温和升级,矩阵单元和HBM容量增加两倍,时钟速率、内存带宽和芯片间互连带宽提升1.3倍,算力达420TFlops,内存128GB,并首次引入分布式训练框架和液冷技术[95] - **TPU v4i (2020)**: 定位为服务器端推理芯片,单核设计,增加了片上SRAM存储,引入四维张量DMA引擎和共享片上互连,时钟频率达1.05 GHz[99][100][104][106][108] - **TPU v4 (2021)**: 采用7nm工艺,峰值算力275TFLOPS,性能全球领先,通过引入光路交换机解决大规模集群的互连规模和可靠性问题,并公开了对稀疏模型的支持[114][117] - **TPU v5e (2023)**: 强调成本效益,专为大模型和生成式AI打造,与TPU v4相比,每美元训练性能提升高达2倍,每美元推理性能提升高达2.5倍,成本不到TPU v4的一半,支持从13B到2万亿参数的模型[119][120][123][126] - **TPU v5p (2023)**: 性能大幅提升,浮点运算次数和内存带宽分别提升2倍和3倍,大语言模型训练速度实现2.8倍的代际提升,提供459 teraFLOPS的bfloat16性能或918 teraOPS的Int8性能,支持95GB高带宽内存[127] - **TPU v6/Trillium (2024)**: 训练效果提高4倍以上,推理吞吐量提高3倍,能源效率提高67%,高带宽内存容量和芯片间互连带宽均实现翻倍,在12个Pod规模下扩展效率高达99%[129][133] - **TPU v7/Ironwood (2025)**: 采用3nm制程工艺,实现全方位突破,FP8峰值算力高达4614TFlops,较第二代TPU提升3600倍,配备192GB的HBM3E显存,单芯片内存带宽达7.2TBps,并首次在TPU系列中支持FP8计算[142][143][145] TPU v7的核心架构创新 - 应用3D堆叠技术,通过混合键合将逻辑层与内存层以10微米间距堆叠,减少信号延迟,并将功耗降低30%[147] - 引入新型计算核心FlexCore,每个核心包含4096个乘累加单元,支持FP32、FP16、BF16、FP8混合精度计算,并采用三级缓存结构,其中L3缓存容量达64MB/核心[148] - FlexCore集成了稀疏计算加速器,通过动态稀疏化技术,在训练中可自动屏蔽80%的零值数据,提升计算效率[149] - 采用光互联技术,在芯片上直接集成激光器和光调制器实现硅光子集成,利用波分复用技术使单链路带宽达1.6TB/s,将芯片间通信延迟从第六代的20微秒降低至5微秒[150] 软件生态与系统优化 - 编译器XLA得到显著改进,通过优化技术使模型在TPU v7上的运行速度提高30%[152] - 分布式训练框架针对大规模集群优化,在训练万亿参数语言模型时,训练时间较上一代缩短40%[153][154] - 配备增强版SparseCore,专为处理推荐系统等场景中的超大稀疏嵌入而设计,能大幅提升相关计算效率[154] - Pathways机器学习运行时在跨芯片计算中发挥关键作用,能高效协调数万个TPU芯片,在训练大型语言模型时可将效率提高50%[155] 应用表现与市场意义 - TPU v7在超大规模模型训练中展现卓越性能,其高算力、大内存和高带宽能显著缩短训练时间,并有望降低30%至50%的总体训练成本[156][157][158] - 在AI推理场景,特别是针对混合专家模型,TPU v7通过软硬件协同优化,可实现推理延迟降低50%以上,成本降低40%以上[158][160][161] - TPU系列的成功迭代证明了定制化AI加速硬件的可行性与巨大潜力,挑战了NVIDIA GPU在AI计算领域的绝对主导地位,表明市场存在多元化的竞争路径[5][163]
最近收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2025-12-19 17:25
自动驾驶领域研究方向与人才需求 - 行业收到大量来自计算机、车辆、自动化和机械方向学生的咨询,显示该领域人才需求旺盛且背景多元 [2] - 对于计算机与自动化背景的学生,行业建议主攻深度学习方向,包括视觉语言模型、端到端自动驾驶和世界模型等前沿领域,这些方向被认为从入门到就业乃至深造均有广阔空间 [2] - 对于机械与车辆工程背景的学生,行业建议可从传统规划与控制、3D高斯泼溅等方向入手,这些方向对算力要求相对较低且更易入门 [2] - 行业指出,新人研究者需要经历大量实践与试错才能形成有价值的创新想法,方法论提升的关键在于广泛阅读论文和积极交流 [2] 前沿与细分技术赛道 - 行业关注的前沿研究方向包括视觉语言模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型 [2] - 行业认为开集目标检测、占用网络、小样本/零样本学习等是相对竞争不那么激烈的细分赛道 [2] - 行业提供的论文辅导服务覆盖了广泛的技术方向,包括但不限于端到端、视觉语言模型、世界模型、强化学习、3D目标检测、多传感器融合、3D高斯泼溅、鸟瞰图感知、占用网络、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、流匹配、点云感知、毫米波雷达、单目感知以及车道线/在线高精地图 [3] 学术成果与发表支持服务 - 行业提供的论文辅导服务声称具有很高的中稿率,并已有成果被计算机视觉、人工智能、机器人、自然语言处理等领域的顶级会议和期刊收录,例如CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL [7] - 服务支持发表的论文级别多样,涵盖自动驾驶顶会/顶刊、中国计算机学会推荐的A/B/C类会议期刊、科学引文索引的一至四区期刊、中科院分区的一至四区期刊、以及工程索引和中文核心期刊 [10] - 服务内容全面,包括论文选题、全流程指导以及实验指导 [6] - 服务范围不仅限于学术论文发表,还扩展至毕业设计论文、申请博士以及竞赛支持 [10] - 服务提供针对不同论文级别的差异化定价 [8]
海外创新产品周报20251215:多只量化增强产品发行-20251216
申万宏源证券· 2025-12-16 11:59
报告行业投资评级 未提及 报告的核心观点 - 上周美国新发43只ETF产品,年末发行速度提升,涵盖个股杠杆、数字货币、单因子、另类、股票多空等多种类型产品 [2][5] - 过去一周美国ETF流入超400亿美元,国内股票产品流入超300亿美元,资金风险偏好较高 [2][9] - 上周股票多空等另类策略产品表现较好,规模前十的另类策略产品中部分表现出色 [2][14] - 2025年10月美国非货币公募基金总量增加,11月25日 - 12月3日当周美国国内股票基金流出超150亿美元,混合产品流出,债券基金小幅流入 [2][15] 根据相关目录分别进行总结 美国ETF创新产品:多只量化增强产品发行 - 上周美国新发43只产品,年末发行加速,含6只个股杠杆、3只数字货币相关产品,其中USCF有原油和比特币混合的2倍杠杆产品,Simplify有美股+期货策略产品 [5][6] - Motley Fool发行3只单因子ETF,分别为创新成长、价值和动量,每只持仓约150只股票 [6] - 贝莱德量化团队发行另类产品,NEOS发行股票多空产品,Hedgeye的130/30产品采用多空策略 [7] - Global X发行黄金开采商ETF,Franklin Templeton发行主动与量化结合的小盘增强ETF [7] - Sterling Capital股票期权产品多头用量化选股策略,分析传统及AI预测因子 [7] - Columbia发行6只ETF,3只债券、3只股票,股票产品为量化增强策略,半年调仓 [8] 美国ETF动态 美国ETF资金:各类资产维持流入 - 过去一周美国ETF流入超400亿美元,国内股票产品流入超300亿美元 [9] - 贝莱德标普500 ETF流出,先锋产品流入超400亿美元,两者资金流向差异超800亿美元,罗素2000、高收益债ETF流入 [11] - 各标普500 ETF资金波动大,罗索2000 ETF持续流入,黄金重回流入 [13] 美国ETF表现:股票多空等另类策略表现较好 - 上周股票多空产品发行多,近两年期货复制、多种对冲基金策略复合产品增加 [14] - 美国规模前十的另类策略产品覆盖多种策略类型,道富多策略产品、Convergence股票多空产品表现最佳 [14] 近期美国普通公募基金资金流向 - 2025年10月美国非货币公募基金总量23.70万亿美元,较9月增加0.22万亿,10月标普500上涨2.27%,国内股票型产品规模升0.9%,赎回压力大 [15] - 11月25日 - 12月3日当周美国国内股票基金流出超150亿美元,混合产品持续流出,债券基金小幅流入 [15]
海外创新产品周报:多只量化增强产品发行-20251216
申万宏源证券· 2025-12-16 11:16
报告行业投资评级 报告未提及行业投资评级相关内容 报告的核心观点 - 上周美国新发 43 只 ETF 产品,年末发行速度提升,涵盖个股杠杆、数字货币、单因子、另类、股票多空、金矿开采商、主动与量化结合的小盘增强、股票期权等多种类型产品 [7][9][10] - 过去一周美国 ETF 各类资产维持流入,国内股票产品流入超 300 亿美元,资金风险偏好较高,各标普 500 ETF 资金波动大,罗素 2000 ETF 持续流入,黄金重回流入 [13][15][17] - 上周股票多空等另类策略表现较好,美国规模前十的另类策略产品覆盖多种策略类型,部分产品表现出色 [19] - 2025 年 10 月美国非货币公募基金总量增加,国内股票型产品规模上升但赎回压力大,11 月 25 日 - 12 月 3 日当周国内股票基金流出超 150 亿美元,混合产品持续流出,债券基金小幅流入 [20] 根据相关目录分别总结 美国 ETF 创新产品:多只量化增强产品发行 - 上周美国新发 43 只产品,包括 6 只个股杠杆产品、3 只数字货币相关产品等 [7][9] - Motley Fool 发行 3 只单因子 ETF,分别为创新成长、价值和动量,每只持仓约 150 只股票 [9] - 贝莱德量化团队、NEOS、Hedgeye 等发行多空策略产品,Global X 发行金矿开采商 ETF,Franklin Templeton 发行主动与量化结合的小盘增强 ETF [10] - Sterling Capital 发行的股票期权产品多头部分采用量化选股策略,分析因子包括传统和 AI 预测指标 [10] - Columbia 发行 6 只 ETF,3 只债券和 3 只股票产品,股票产品为量化增强策略 [11] 美国 ETF 动态 美国 ETF 资金:各类资产维持流入 - 过去一周美国 ETF 流入超 400 亿美元,国内股票产品流入超 300 亿美元 [13] - 贝莱德标普 500 ETF 延续流出第一,先锋产品大幅流入超 400 亿美元,两者资金流向差异超 800 亿美元,罗素 2000、高收益债 ETF 流入 [15] - 各标普 500 ETF 资金波动大,罗素 2000 ETF 持续流入,黄金重回流入 [17] 美国 ETF 表现:股票多空等另类策略表现较好 - 上周较多股票多空产品发行,近两年期货复制、多种对冲基金策略复合产品增加 [19] - 美国规模前十的另类策略产品覆盖多种策略类型,道富的多策略产品、Convergence 的股票多空产品表现最好 [19] 近期美国普通公募基金资金流向 - 2025 年 10 月美国非货币公募基金总量为 23.70 万亿美元,较 9 月增加 0.22 万亿,10 月标普 500 上涨 2.27%,国内股票型产品规模上升 0.9%,赎回压力大 [20] - 11 月 25 日 - 12 月 3 日当周美国国内股票基金流出超 150 亿美元,混合产品持续流出,债券基金小幅流入 [20]
具身智能的始祖公司宣告破产,转身卖给了中国债主
搜狐财经· 2025-12-15 20:03
公司发展历程与行业地位 - 公司于1990年由麻省理工学院人工智能实验室成员创立,创始团队包括具身智能领域奠基人Rodney Brooks [2][4] - 公司早期重点开发政府与国防用途机器人,其PackBot机器人在军事和灾难救援中发挥了关键作用 [4] - 公司于2002年推出革命性产品Roomba扫地机器人,正式进入消费市场,该产品到2004年销量已超过100万台 [4] - 公司于2005年在纳斯达克上市,募资约9,000万美元 [4] - 截至目前,超过5,000万台Roomba扫地机器人进入全球家庭 [6] 衰落原因:技术路线错位与战略失误 - 公司在计算机视觉技术三次关键突破时刻均未能及时响应,导致技术落后 [7] - **第一次技术错位**:在计算机视觉技术不成熟的早期,公司放弃视觉方案,依赖声呐、触觉和惯性测量单元等非视觉技术,使初代Roomba以随机碰撞式导航成功占领市场 [8] - **第二次技术错位**:自2012年深度学习浪潮兴起及2010年代中期激光雷达SLAM技术突破后,行业迎来视觉和地图记忆能力,但公司固守其iAdapt碰撞算法,基于摄像头的vSLAM方案迟迟未能成熟,被科沃斯、石头科技等竞争对手凭借更成熟的激光雷达方案超越 [8] - **第三次技术错位**:行业进入从“感知几何空间”升级到“理解语义内容”的阶段,竞争对手产品能通过多传感器融合、端侧AI芯片实现自动识别房间用途和地面材质,而公司直到2022年才补齐吸拖一体和部分视觉能力,2025年才重新引入激光雷达,行动比行业主流慢了数年 [9] - 公司曾错失进入仓储机器人等领域的机会,并在2016年出售了国防业务,削弱了业务多元化能力 [7] - 从2018年到2025年,公司全球市场份额从60%暴跌至仅7.9%,被彻底挤出行业前列 [10] 财务状况恶化与破产导火索 - 2024年,亚马逊提出的17亿美元收购案因美国联邦贸易委员会和欧盟出于反垄断与隐私担忧而否决,尽管亚马逊支付了9,400万美元解约金,但交易流产彻底断绝了公司生机 [14] - 收购案流产后,公司裁员超过30%,创始人兼CEO Colin Angle离职,2024年底再次裁员105人,使全球员工规模比年初缩水近一半 [14] - 2025年第二季度,公司收入仅为1.76亿美元,同比下降23.3%,而在2022年亚马逊提出收购前,同一季度营收超过3亿美元 [14] - 公司财务状况急剧恶化,代工厂深圳杉川机器人有限公司逐步成为其最大债权人 [15] - 公司过去从凯雷集团相关机构获得的一笔贷款(本息合计1.907亿美元)的债权已被杉川的全资子公司接手 [15] - 公司还欠杉川1.615亿美元的产品制造费用,其中9,090万美元已经逾期 [15] - 目前公司总共欠下的债务已经超过3.5亿美元 [15] - 亚马逊支付的解约金已全部用于日常运营,截至2025年9月底,公司账面现金仅剩2,480万美元,远不足以维持其债务规模 [15] - 公司于美国时间12月14日正式申请破产保护,并同意将其100%股权出售给杉川 [1] 收购方背景与战略意图 - 收购方深圳杉川机器人有限公司是扫地机器人代工领域的领跑者,由大族激光孵化,海尔集团是战略股东 [16] - 业内说法称,全球高端扫地机器人市场里,每十台就有三台来自深圳杉川 [16] - 杉川的客户名单包括德国卡赫、斐纳、飞利浦以及国内的小米和海尔,近期戴森发布的首款全能基站型AI扫地机器人也由其代工 [16][18] - 杉川的技术实力已深入研发设计核心环节,超越了简单的组装制造 [18] - 杉川长期试图通过自有品牌“3i”向原始品牌制造商转型,但在中国市场受限于高昂定价和消费者接受度,市场声量有限 [18] - 公司拥有沉淀35年的品牌资产、高达2,000多项的专利储备以及在北美、日本和西欧市场根深蒂固的销售渠道,这正是杉川急需的资源 [18] - 杉川的战略意图在于“借壳出海”:利用公司品牌外壳,注入中国供应链成熟的高性能技术,在北美市场打造具备“iRobot品牌信任度+中国制造极致产品力”的混合体 [18] - 根据重组计划,杉川将免除公司的部分债务,并提供必要资金支持以维持其作为“持续经营企业”的运作 [16] 交易面临的挑战 - 监管审查是首要挑战,一家中国企业全资收购曾与美国国防部门合作、并掌握大量美国家庭数据的公司,将受到美国外国投资委员会的严格审查 [19] - 财务与运营层面存在压力,公司背负约3.5亿美元债务,维持其正常运转需持续投入流动资金,杉川需平衡自身代工业务的资金需求 [19] - 企业文化的融合与品牌价值的延续存在挑战,杉川深耕B端ODM领域,而公司是C端消费者品牌,两者在运营逻辑上存在差异 [19] - 未来如何在保留公司品牌调性与用户信任的同时,注入更高效的运营体系,将是决定整合成败的关键 [20]
AI发展史上重要的转折,源于这位华裔女生
吴晓波频道· 2025-12-15 08:21
李飞飞的学术与行业贡献 - 2009年,时年33岁的李飞飞发布ImageNet数据库,该数据库包含22000个类别、1400多万张经过标注的图片,用于训练和测试AI算法的物体识别能力 [1] - ImageNet数据库为杰弗里·辛顿验证AI神经网络算法的有效性提供了关键基础,由此掀起了深度学习革命 [2] - 李飞飞认为视觉能力是AI进化的关键,基于此观点创建了ImageNet,为AI视觉深度学习奠定了数据基础 [3] 李飞飞的职业发展与企业创立 - 李飞飞于2007年加入普林斯顿大学任助理教授,2009年成为斯坦福大学终身教授,2013年起担任斯坦福大学人工智能实验室负责人 [3] - 2017年,李飞飞加入谷歌担任副总裁兼谷歌云人工智能及机器学习首席科学家,期间创立了谷歌AI中国中心并发起非营利组织AI4ALL [4] - 2023年4月,李飞飞创立初创公司World Labs,专注于解决人工智能领域的空间智能问题,公司成立不到四个月估值即超过10亿美元 [4] World Labs的技术突破与空间智能前景 - World Labs成立四个月后发布了一款突破性AI模型,该模型能通过一张图片或一句话生成可交互、可编辑、可扩展的虚拟3D场景 [5] - 李飞飞定义空间智能为机器在3D空间和时间中进行感知、推理和行动的能力,并认为这是AI领域的下一个前沿发展方向 [6] - 该模型的发布被视为人类迈向空间智能的第一步,预示着AI将从平面处理转向对三维世界的深度理解,推动虚拟与现实世界的融合 [5][6]